автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Синтез и анализ непараметрических коллективов решающих правил
Автореферат диссертации по теме "Синтез и анализ непараметрических коллективов решающих правил"
На правах рукописи
Лапко Василий Александрович
СИНТЕЗ И АНАЛИЗ НЕПАРАМЕТРИЧЕСКИХ КОЛЛЕКТИВОВ РЕШАЮЩИХ ПРАВИЛ
05.13.01 - Системный анализ, управление и обработка информации
Автореферат
диссертации на соискание ученой степени доктора технических наук
Красноярск - 2004
Работа выполнена в Научно-исследовательском учреждении Институт вычислительного моделирования Сибирского отделения Российской академии наук и Сибирском государственном аэрокосмическом университете имени академика М.Ф. Решетнёва.
НАУЧНЫЙ КОНСУЛЬТАНТ:
доктор технических наук,
профессор Антамошкин Александр Николаевич
ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ
доктор технических наук, профессор
доктор технических наук, профессор
доктор технических наук, профессор,
Заслуженный деятель науки РФ
Лбов Геннадий Сергеевич Охорзин Владимир Афанасьевич
Титов Виталий Семёнович
ВЕДУЩАЯ ОРГАНИЗАЦИЯ: Томский государственный университет
Защита состоится «24» июня 2004 года в 14-00 часов на заседании диссертационного совета Д.212.249.02 при Сибирском государственном аэрокосмическом университете имени академика М.Ф. Решетнёва по адресу: 660014, г. Красноярск, проспект имени газеты «Красноярский рабочий», 31.
С диссертацией можно ознакомиться в библиотеке Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнёва.
Автореферат разослан «1"^» мая 2004 г.
Учёный секретарь диссертационного совета
Ковалёв И.В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Методы коллективного оценивания находят широкое распространение на современном этапе развития теории обучающихся систем, когда возникла потребность в обобщении разнотипных алгоритмов обработки информации с целью получения интегрированных знаний.
Обязательным условием синтеза традиционных моделей коллективного типа является наличие конечного множества решающих правил, каждое из которых имеет самостоятельное значение. Тогда коллектив моделей, например, с позиций средневзвешенного преобразования либо оценивания областей их компетентности, аккумулирует преимущества составляющих коллектив решающих правил. Другим крайним случаем коллектива являются непараметрические модели, структуру которых образуют элементы обучающей выборки и соответствующие им ядерные (весовые) функции. Каждая ядерная функция оказывает влияние на процесс формирования решения только в пределах конкретной ситуации из обучающей выборки.
В научной литературе настойчиво обсуждается и разрабатывается идея о совместном использовании в коллективе разнотипных моделей - как средства наиболее полного учета априорной информации. Известно яркое высказывание профессора В. Хардле (Прикладная непараметрическая регрессия. - М: Мир, 1993): «Совмещение параметрических и непараметрических составляющих может даже привести к построению лучшей модели, чем непараметрический или параметрический подход!». Получены первые успешные результаты исследований в данном направлении, к которым можно отнести методы локальной аппроксимации (Катковник В.Я., 1985), гибридные модели (Лапко А.В., 1993), полупараметрические и частично линейные модели (Хардле В., 1993). При этом особое внимание уделяется алгоритмам восстановления стохастических зависимостей, обеспечивающих учет частичных сведений об их виде и данных экспериментальных исследований.
Предлагаемая работа посвящена развитию и теоретическому обоснованию нового научного направления математического моделирования неопределённых сиотг
непараметрической статистики и коллективного оценивания с целью повышения эффективности использования априорной информации на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций. Под неопределёнными системами понимаются системы, исследование которых осуществляется в условиях неполной информации о закономерностях их функционирования.
В рамках данного направления появляется возможность обобщения традиционного непараметрического подхода и обеспечивается преемственность результатов научных исследований, что определяет фундаментальную значимость тематики диссертации.
Полученные при этом научные результаты создают методическую и математическую основу автоматизации проектирования информационных систем, реализующих непараметрические коллективы решающих правил, адаптируемых к объектам различной природы и условиям их исследования.
Основные научные результаты диссертации получены в рамках планов научных исследований Института вычислительного моделирования СО РАН (№01.9.80 007505 «Разработка математического и программного обеспечения многоуровневых интеллектуальных информационных систем принятия решений», №0.200.1 13696 «Разработка математического и программного обеспечения интеллектуальных информационно-аналитических систем») и Сибирском государственном аэрокосмическом университете имени академика М.Ф. Решетнёва. Актуальность темы диссертации признана рядом Российских фондов и организаций, осуществляющих финансирование научных исследований (РФФИ, гранты №00-01-00001, №01-01-06015 (MAC), №02-01-06409 (MAC), №03-01-00081; РГНФ - №03-05-12012B; Министерство образования РФ по фундаментальным исследованиям в области естественных и точных наук - №Е00-69-02; Красноярский краевой фонд науки - №10F0023M; Министерство промышленности, науки и технологий РФ (Совет по грантам Президента РФ) - №МК-143.2003.01; Фонд содействия отечественной науки).
Тема диссертации соответствует перечню «Критические технологии РФ» по направлению - компьютерное моделирование.
Цель работы: Разработать теоретические основы оптимального синтеза и анализа непараметрических коллективов решающих правил, обеспечивающих эффективное использование априорной информации на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций.
Цель достигается путём решения следующих задач:
1. Развить и обобщить методику синтеза непараметрических моделей коллективного типа в задачах восстановления многомерных стохастических зависимостей и распознавания образов в условиях неполной информации.
2. Разработать методику построения непараметрических моделей временных зависимостей по коротким рядам наблюдений их переменных на основе метода двойного коллективного оценивания, исследовать их свойства и определить условия компетентности.
3. Разработать и исследовать коллективы гибридных моделей стохастических зависимостей, учитывающих априорные сведения об их виде, локальном поведении и обеспечивающих «обход» проблемы выбора моделей в конкретных условиях их применения.
4. Разработать методику синтеза и анализа непараметрических моделей последовательных процессов принятия решений, создающих основу исследования сложных неопределённых систем с линейной структурой.
5. С позиций методов коллективного оценивания разработать и исследовать непараметрические модели анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов.
6. Создать информационные средства, реализующие непараметрические коллективы решающих правил, и применить их при исследовании социальных, медико-биологических и технических систем.
Методы исследования. Для решения поставленных задач использовались теория сложных и обучающихся систем, аппарат теории вероятности и математической статистики, методы коллективного оценивания и статистического моделирования.
Научная новизна исследований. Впервые теоретически обоснована и решена проблема оптимального синтеза и анализа непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей, распознавания образов, включая обработку множеств случайных величин, и моделирования временных процессов, которые обеспечивают эффективное использование априорной информации путём сочетания преимуществ параметрических и локальных аппроксимаций, тем самым сформировано новое научное направление в развитии методологии статистического моделирования систем при неполной информации.
В частности:
1. Развиты теоретические основы построения непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей и распознавания образов, обобщающих традиционные локальные аппроксимации и позволяющие эффективно использовать информацию обучающих выборок. Разработаны новые непараметрические коллективы с учётом эффективности упрощённых параметрических аппроксимаций, которые характеризуются более высоким уровнем помехозащищённости и точности. Из анализа асимптотических свойств непараметрических коллективов установлена слабая зависимость аппроксимационных свойств непараметрических моделей коллективного типа от вида упрощённых параметрических аппроксимаций. Впервые разработана методика оценивания вклада аргументов в формирование значений восстанавливаемой зависимости на основе непараметрического коллектива с системой линейных упрощённых аппроксимаций.
2. Предложена и обоснована методика двойного коллективного оценивания при синтезе непараметрических моделей временных зависимостей, включая нестационарные процессы, обеспечивающая максимальное использование информации коротких рядов наблюдений их переменных и повышенную помехозащищённость разрабатываемых моделей.
3. Разработаны и исследованы новые модификации гибридных моделей, отличающихся видом непараметрической оценки функции невязки между параметрической аппроксимацией
восстанавливаемой зависимости и её наблюдениями из обучающей выборки, что обеспечивает более полный учёт априорной информации. Для обхода проблем выбора вида функции невязки, предложена методика синтеза и анализа коллектива гибридных моделей.
4. С позиций методов коллективного оценивания разработаны и исследованы непараметрические модели статических систем с линейной структурой. При этом впервые аналитически обоснована возможность частичного сжатия пространства признаков непараметрической регрессии на основе их линейного преобразования.
5. Сформулирована и решена проблема анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов. Идея предлагаемого подхода заключается в замене операций над множествами на преобразования законов распределения их элементов с помощью непараметрических коллективов решающих правил.
Практическая ценность диссертации заключается в разработке методики, алгоритмических и программных средств синтеза и анализа структуры непараметрических коллективов решающих правил, ориентированных на исследование статических и динамических объектов различной природы при априорной неопределённости.
Полученные научные результаты рекомендуются для использования при выборе методов аппроксимации, построении и оптимизации непараметрических коллективов решающих правил в задачах восстановления стохастических зависимостей и распознавания образов.
Слабая зависимость условий асимптотической сходимости статистических оценок показателей эффективности непараметрических коллективов решающих правил от вида упрощённых аппроксимаций обосновывает использование линейных упрощённых аппроксимаций, что имеет важное прикладное значение для. повышения вычислительной эффективности изучаемого класса моделей и обеспечивает разработку методики оценивания вклада аргументов при формировании значений восстанавливаемой функции.
Применение непараметрических моделей временных зависимостей коллективного типа открывает возможность исследования широкого класса уникальных социальных, экономических и медико-биологических систем, динамика которых характеризуется короткими рядами наблюдений их переменных.
Гибридные модели многомерных стохастических зависимостей гарантируют преемственность результатов научных и прикладных разработок на основе использования ранее разработанных «старых» моделей в качестве дополнительной исходной информации.
Критерии статистического оценивания условий преимущества непараметрических коллективов решающих правил создают методическую и алгоритмическую основу автоматизации их проектирования при построении типовой информационной системы.
Информационные средства, реализующие непараметрические коллективы решающих правил, обладают возможностью адаптации к различным условиям исследования неопределённых систем и требованиям пользователей.
Автор защищает:
1. Модификации непараметрических моделей многомерных стохастических зависимостей и алгоритмов распознавания образов коллективного типа, обеспечивающие эффективное использование информации обучающих выборок на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций. Вычислительные аспекты применения непараметрических коллективов решающих правил и методы синтеза их эффективной структуры.
2. Непараметрические модели временных зависимостей, основанные на методе двойного коллективного оценивания; зависимость их свойств от особенностей исходной информации, содержащейся в коротких рядах наблюдений переменных изучаемых процессов, и параметров непараметрических коллективов. Свойства предложенных моделей и критерии оценивания условий их компетентности.
3. Методику оценивания вклада аргументов в формирование значений восстанавливаемой зависимости на основе
непараметрических моделей коллективного типа, использующих систему линейных упрощённых аппроксимаций.
4. Коллективы гибридных моделей многомерных стохастических зависимостей и их модификации; асимптотические свойства моделей и результаты сравнения их показателей эффективности.
5. Непараметрические модели статических систем с линейной структурой, элементы которой аппроксимируются непараметрическими регрессиями и образуют нелинейный коллектив решающих правил; асимптотические свойства показателей эффективности моделей и их зависимость от особенностей исходной информации.
6. Непараметрические модели анализа множеств случайных величин в задачах зосстановления стохастических зависимостей и распознавания образов, синтез которых основывается на методах коллективного оценивания; свойства моделей и алгоритмы их оптимизации.
7. Информационные средства, реализующие непараметрические коллективы решающих правил. Результаты их применения при прогнозировании динамики показателей преступности в регионе и урожайности сельскохозяйственных культур; исследовании закономерностей гемодинамических процессов сердечнососудистой системы организма человека в экологических условиях Севера; оценивании показателей эффективности системы терморегулирования спутников связи.
Реализация результатов работы. Непараметрические модели временных зависимостей коллективного типа и методика оценивания вклада аргументов в формирование их значений составили основу математического обеспечения информационной системы прогнозирования динамики показателей состояния преступности региона, которая используется в учебном процессе Сибирского юридического института МВД России и планировании деятельности ГУВД Красноярского края.
Непараметрические модели многомерных стохастических зависимостей коллективного типа и гибридные модели использованы при создании информационных средств оценивания показателей эффективности системы терморегулирования спутников связи в НПО «Прикладная механика» (г. Железногорск),
исследовании технологии высокочастотной предпосевной обработки семян, прогнозировании урожайности
сельскохозяйственных культур (Красноярский государственный аграрный университет).
Разработанные непараметрические модели коллективного типа и программные средства внедрены в Институте медицинских проблем Севера СО РАМН для исследовании взаимосвязей между параметрами гемодинамики сердечно-сосудистой системы организма человека в экологических условиях Севера.
Материалы диссертации включены в учебное пособие «Непараметрические системы обработки информации», изданное в рамках Федеральной целевой программы «Государственная поддержка интеграции высшего образования и фундаментальной науки 1997-2000 годы» и рекомендованное Министерством образования РФ для обучения студентов по направлению 654600 -«Информатика и вычислительная техника».
Апробация работы.. Основные положения диссертации представлялись и обсуждались на Всероссийских, Международных и региональных конференциях, в частности: 3-ей Всероссийской конференции с участием стран СНГ «Распознавание образов и анализ изображений: новые информационные технологии» (Нижний Новгород, 1997), Всероссийской конференции «Здоровье общества и безопасность жизнедеятельности» (Красноярск, 1997), 8-ой Всероссийской конференции «Математические методы распознавания образов» (Москва, 1997г.), 3-ем и 4-ом Сибирском конгрессе по прикладной и индустриальной математике (Новосибирск, 1998г., 2000г.), Международной конференции «Идентификация систем и задачи управления» (Москва, 2000г.), 5-ой Международной конференции «Распознавания образов и анализ изображений: новые информационные технологии» (Самара, 2000г.), Международной научно-практической конференции «Сибирский авиационно-космический салон» (Красноярск -Железногорск, 2001г., 2002г.), Международной конференции «12th International Heat Pipe Conference» (Moscow - Kostroma - Moscow, 2002), Всероссийской научно-практической конференции «Проблемы информатизации региона» (Красноярск, 2003г.), 7-ой Всероссийской научной конференции с участием иностранных
учёных «Современные методы математического моделирования природных и антропогенных катастроф» (Красноярск, 2003 г.).
Результаты исследований включались в основные научные достижения Института вычислительного моделирования СО РАН; представлены в отчётах грантов РФФИ №00-01-00001 «Разработка непараметрических систем распознавания образов, основанных на методе коллективного оценивания», №01-01-06015 (MAC), 02-0106409 (MAC), №03-01-00081 «Разработка непараметрических систем классификации множеств случайных величин»; гранта РГНФ №03-05-12012в «Разработка территориально распределённой информационной системы эпидемиологического мониторинга артериальной гипертонии среди населения региона»; гранта Министерства образования РФ по фундаментальным исследованиям в области естественных и точных наук №Е00-69-О2 «Разработка и исследование непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей»; гранта Красноярского краевого фонда науки №10F0023M' «Разработка и исследование непараметрических моделей нестационарных зависимостей коллективного типа»; гранта Президента РФ № МК-143.2003.01 «Разработка теоретических основ построения непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей» и гранта Фонда содействия отечественной науке «Выдающиеся учёные. Кандидаты и доктора наук РАН».
Перспективный характер направления исследований и научная новизна полученных результатов отмечалась в журнале «Вестник РФФИ» (№3,2001).
Структура и объём работы. Диссертация состоит из введения, семи глав, заключения, списка использованной литературы (175 наименований), содержит 357 страниц машинописного текста, иллюстрируется 107 рисунками.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении обоснована актуальность рассматриваемой в диссертации проблемы, определены цель и задачи исследования, выделены основные положения работы, имеющие научную новизну и практическую значимость.
В первой главе анализируются статистические модели коллективного типа, характеризующиеся множеством элементов их структуры, оператором сопряжения между ними и особенностью процедуры оптимизации решающего правила. На основе особенностей элементов и вида оператора их сопряжения в коллективе предложена методика классификации моделей коллективного типа, позволяющая систематизировать существующие подходы и определить новые постановки задач моделирования. Показано, что изучаемые в работе непараметрические модели коллективного типа занимают промежуточное положение между традиционными коллективами решающих правил и методами кусочной аппроксимации.
Идея предлагаемого подхода состоит в построении упрощённых параметрических аппроксимаций относительно некоторого набора точек из обучающей выборки с последующей их интеграцией в коллектив на основе методов непараметрической статистики.
Оценивание стохастических зависимостей. Пусть дана выборка составленная из статистически
независимых наблюдений значений неизвестной функции
у = ф) УхеЯк (1)
и её аргументов.
Считается, что функция (1) и плотности вероятности р{х), достаточно гладкие и имеют хотя бы первые две производные.
Поставим в соответствие некоторым точкам обучающей выборки условно назовём их опорными, упрощённые
аппроксимации зависимости (1), параметры которых
удовлетворяют условиям
Упрощённые аппроксимации ¡р,(х,оц) проходят через
опорные точки (х',У,/е/0) и близки в среднеквадратическом к элементам выборки V.
Обозначим количество упрощённых аппроксимаций | 1„ | = N < п, а через Ш' - статистическую оценку среднеквадратического критерия, используемого при выборе параметров от/ упрощённой аппроксимации (¡?/(дг,а/),
Примем в качестве статистической оценки зависимости (1) процедуру условного усреднения
(2)
У = <Р(х) = £ <Р1 (х,а,)Л1 (х), /е/.
где положительная, ограниченная значением единица функция Л'(х) определяет «вес» упрощённой . параметрической аппроксимации (опорной функции) при формировании
решения в ситуации X.
Примером функции Л'(х) является нормированное расстояние между точками либо «весовая» функция
составленная из положительных, симметричных и нормированных
«ядерных» функций с„'ф
на основе которых строятся
непараметрические модели.
Использование ядерных функций Ф| — | позволяет
учитывать оценку показателей эффективности упрощённых
аппроксимаций р,(х,а;), что повышает помехозащищённость и точность непараметрических коллективов.
Непараметрическая модель коллективного типа (2) допускает представление в виде
у = ф{х)+Ъ[х),
где первое слагаемое <р{х) является непараметрической регрессией, построенной на опорных точках; а второе играет роль
поправочного члена и отражает условную взаимосвязь между точками обучающей выборки, значение которого снижается по мере роста объёма исходной информации и количества опорных точек. Наличие поправочного члена делает коллектив (2) схожим с гибридными моделями, а слабая зависимость его свойств от вида опорных функций - с непараметрической регрессией.
Оценивание решающей функции в задаче распознавания образов. Пусть V = (дг',а|л'), 1 = 1,л) - обучающая выборка, составленная из параметров складывающейся ситуации х' и соответствующего ей «указания учителя» <т(х') о принадлежности ьй ситуации к одному, например, из двух классов.
Следуя методике синтеза коллективов решающих правил, построим относительно каждой опорной точки упрощённое уравнение разделяющей поверхности ^^ (*,«;), 1 е /0 между классами. Параметры ¡-й упрощённой решающей функции находятся из условия минимума эмпирической ошибки распознавания образов.
Без существенного снижения эффективности строящегося коллектива решающих функций, вид упрощённых уравнений разделяющих поверхностей может быть принят линейным, что значительно сокращает требуемые вычислительные ресурсы.
С этих позиций непараметрический коллектив упрощённых уравнений разделяющих поверхностей, например, в двуальтернативной задаче распознавания образов запишется как
где р1 - статистическая оценка вероятности ошибки распознавания образов, соответствующая упрощённой решающей функции
По сравнению с традиционной непараметрической оценкой байесовой разделяющей поверхности в статистике (3) «указания учителя» заменяются на упрощенные решающие функции
<р1^2{х,а{), I е 1а , 110 | = N . Обобщенное решение в процессе
классификации х формируется с учетом знака уравнения /12 (•*).
Отличие обобщённой решающей функции метода комитетов (Мазуров Вл.Д., 1990) от непараметрического коллектива (3), несмотря на близость их структуры, состоит в использовании линейных решающих правил вместо упрощённых уравнений разделяющих поверхностей.
Асимптотические свойства непараметрических моделей коллективного типа определяются утверждением
Теорема 1. Пусть: 1) восстанавливаемая стохастическая зависимость и плотности вероятности ограничены
и непрерывны со всеми своими производными до второго порядка включительно; 2) закон распределения р(х) аргументов х задан; 3) ядерные функции Ф(н) являются положительными, симметричными и нормированными при |итФ(и)г/н <со Ут<ю; 4)
последовательность с=с(Л0—»0 при N—><=0, а //с->«з. Тогда непараметрическая модель коллективного типа обладает
свойствами асимптотической несмещенности и состоятельности.
На основе анализа минимального среднеквадратического
отклонения
при оптимальных значениях коэффициента размытости с{ы) установлено, что асимптотические свойства непараметрических моделей коллективного типа «слабо» зависят от вида упрощённых аппроксимаций и объёма выборки п в задаче их идентификации. Данный вывод имеет важное теоретическое и прикладное значение, так как, с одной стороны, обосновывает возможность использования линейных упрощённых аппроксимаций, что значительно повышает вычислительную эффективность непараметрических моделей коллективного типа. С другой стороны, в данных условиях непараметрическая модель
коллективного типа представляется в виде линейного полинома с нелинейными коэффициентами, что позволило предложить методику оценивания вклада аргументов восстанавливаемой функции при формировании её значений.
Оценивание вклада аргументов в формирование значений восстанавливаемой функции. Сформируем в нормированном пространстве аргументов л = (х^, _/' = 1, линейные упрощённые аппроксимации а}), ] е /„. Тогда непараметрическая модель коллективного типа (2) является линейной аппроксимацией
Я*) =Е*А (*)+*•(*)
с нелинейными коэффициентами
нормированные значения которых Ь'у{х\у-\,к определяют вклад
аргументов ху , V = 1Д и свободного члена модели в формирование значения оцениваемой многомерной зависимости в ситуации х При этом величина Ьо(х) может быть интерпретирована как вклад неучтённых факторов.
Формирование системы упрощённых аппроксимаций. В работах Лапко В.А., Ченцова СВ. (1996) предложен рациональный закон формирования опорных точек при построении упрощённых аппроксимаций, который обеспечивает минимизацию асимптотического выражения среднеквадратического критерия точности аппроксимации непараметрического коллектива.
Однако рациональный закон распределения опорных точек сложен в реализации, так как представляет собой смесь плотностей вероятности: равномерной и плотности, зависящей от восстанавливаемой функции и её производных. Поэтому разработаны новые численные методы формирования системы опорных точек в процессе синтеза структуры непараметрической модели коллективного типа.
Итерационная процедура последовательного формирования упрощённых аппроксимаций основана на минимизации относительной эмпирической ошибки расхождения между
восстанавливаемой зависимостью и строящейся непараметрической моделью коллективного типа на каждом этапе её синтеза.
Пусть 0>у(дг,ау), у = 1,/ - некоторая система из / упрощённых
аппроксимаций зависимости у = ф{х) относительно опорных точек При этом эмпирическая ошибка расхождения
между экспериментальными данными и строящейся непараметрической моделью ¥/(?>/ (г,ау),./ = 1,/) имеет вид
где 1( = 1\1( - множество номеров точек, не входящих в число
опорных множество номеров точек исходной
выборки.
Тогда методика формирования системы опорных точек модели представляется следующей последовательностью действий:
1. Выбрать в качестве первой опорной точку с максимальным значением функции либо её производной. Принять значение параметра г = 1.
2. Включить номер опорной точки в множество
3. Оценить параметры упрощённой параметрической аппроксимации (р}\х,а^.
4. Построить непараметрическую модель коллективного типа Ч'/О-
5. Проверить соответствие количества опорных точек |/,[ требуемому N либо заданной оценке точности аппроксимации. Если условие выполнено, то процесс заканчивается.
6. Определить новую опорную точку из условия
^ (шах -х¥1(р„1р',а1,),у = 1,{ ))"_
Принять и перейти к этапу 2.
Идея комбинированного метода формирования опорных точек основывается на использовании датчика случайных чисел с равномерным законом распределения и последующим расширением их множества с помощью итерационной процедуры выбора упрощённых аппроксимаций, что позволяет в (2-3) раза
повысить вычислительную эффективность алгоритма синтеза структуры непараметрического коллектива.
Свойства непараметрических коллективов при конечных объёмах обучающих выборок. Используя методику вычислительного эксперимента, исследованы зависимости свойств непараметрических моделей коллективного типа от параметров их структуры, объёма, размерности и уровня зашумлённости обучающих выборок.
Установлено, что аппроксимационные свойства непараметрических моделей коллективного типа достоверно менее чувствительны к помехам в данных и размерности обучающей выборки по сравнению с непараметрической регрессией, методом к - ближайших соседей и сплайн-аппроксимациями. Этот факт объясняется двойным сглаживанием в структуре моделей коллективного типа и наиболее полным использованием информации, содержащейся в обучающей выборке.
Основным показателем, определяющим эффективность непараметрических коллективов в задаче распознавания образов, является отношение «количество упрощённых аппроксимаций / объём обучающей выборки». При значении данного отношения более 0.075 отмечается достоверное преимущество алгоритма распознавания образов коллективного типа над непараметрическим классификатором ядерного типа. При этом отношение «объём обучающей выборки / размерность» должно быть более 30. С ростом уровня помех, накладываемых на элементы обучающей выборки, оценка вероятности ошибки классификации возрастает за счёт выхода опорных точек из области пересечения классов, что снижает информативность аппроксимирующих решающих функций (элементов коллектива). Данный факт особо проявляется при малых объёмах обучающих выборок.
Во второй главе разработаны и исследованы непараметрические модели временных зависимостей коллективного типа, синтез которых осуществляется по коротким рядам V = (у' =>(0, =*(0>' = 1»") наблюдений их переменных. Полагается, что преобразование при каждом имеет по
крайней мере две первые ограниченные производные по
В отличие от традиционного подхода (Крившич Д.В., Ченцов СВ., Лапко А.В., Лапко В.А. 1996-1998 гг.), для максимального учёта исходной информации в задаче восстановления временных зависимостей предложен метод двойного коллективного оценивания, основанный на построении двух систем упрощённых аппроксимаций и
соответствующих им непараметрических моделей
При построении первой модели упрощённые
аппроксимации строятся последовательно, начиная с первого элемента временного ряда. Параметры каждой упрощённой аппроксимации находятся из условия её прохождения через опорную точку и близости в среднеквадратическом ко всем последующим временным наблюдениям из обучающей выборки. Построенные упрощённые аппроксимации объединяются в коллектив с помощью непараметрической оценки оператора условного математического ожидания
т=1>г(4о>«гК(^(о). (4)
где
(5)
а ядерные функции удовлетворяют условиям
нормированности, положительности и симметричности относительно опорных точек Эту стратегию
построения упрощённых аппроксимаций условно назовём процедурой их формирования «из прошлого в настоящее».
Вторая непараметрическая модель коллективного типа формируется в обратном порядке (процедура формирования структуры модели «из настоящего в прошлое») - упрощённые аппроксимации строятся последовательно, начиная с последнего элемента временного ряда. 'Параметры каждой упрощённой аппроксимации определяются из условия её прохождения через опорную точку и близости в среднеквадратическом ко всем предыдущим элементам обучающей выборки. Объединение
упрощённых аппроксимаций в коллектив реализуется по аналогии с предыдущей моделью (4).
Обобщённая коллективная модель искомой зависимости формируется, например, в соответствии с процедурой
(6)
где параметр определяется из условия минимума статистической оценки среднеквадратического критерия близости результатов прогнозирования с данными обучающей выборки.
В непараметрических моделях коллективного типа осуществляется многократное сглаживание - при оценивании параметров упрощенных аппроксимаций, за счет использования оператора условного математического ожидания и их преобразований, что обеспечивает высокую помехозащищенность принимаемых решений.
Доказаны теоремы асимптотической несмещённости и состоятельности непараметрической модели временной зависимости основанной на методе двойного коллективного оценивания, при наличии сведений о повторяющихся их реализациях. Определено отношение асимптотических выражений среднеквадратических критериев для и традиционного
непараметрического коллектива при оптимальных
значениях коэффициентов размытости ядерных функций
где А'(х),А(х) - функционалы от У/(*('))> плотностей вероятности для конкретного и их производных до второго порядка включительно.
Из условия IV < 1 установлен критерий преимущества непараметрического коллектива над традиционной моделью
коллективного типа который определяется
достоверным отличием средних значений коэффициентов линейных упрощённых аппроксимаций статистик При равномерном законе распределения аргументов восстанавливаемой зависимости непараметрические модели коллективного типг имеют равную эффективность,
поэтому введение дополнительных упрощённых аппроксимаций не привносит новой информации.
Эффективность непараметрического коллектива повышается, если в весовых функциях (5), составляющих его моделей учитывать статистические оценки
точности УУТ упрощённых аппроксимаций путём введения в
числитель и знаменатель (5) ядерных функций Ф 0 ~ ^
При ограниченных объемах обучающей выборки значение относительной ошибки аппроксимации модели (6) меньше, чем для непараметрической регрессии в 3,5-4 раза и традиционного непараметрического коллектива (4) - в 1,5-2 раза. Предложенная модель (6) является более устойчивой к зашумленности обучающей выборки, чем непараметрический коллектив (4), и остается адекватной условиям применения при уровне помех до 50%. С ростом объема обучающей выборки влияние помех на аппроксимационные свойства модели (6) уменьшается.
В третьей главе предложены и исследованы новые модификации гибридных моделей и их коллективы, позволяющие учитывать априорную информацию о виде восстанавливаемой многомерной зависимости у-<р (.*) V хеЯ* , её локальном поведении V = {х', у' ,1 = \, л] и снять проблему выбора моделей в конкретных исходных условиях
Структуру рассмотренных гибридных моделей составляют параметрические аппроксимации искомых стохастических зависимостей и непараметрические оценки функций невязок между ними, выбор вида которых порождает разнообразие исследуемого класса моделей.
Анализируются и сравниваются гибридные модели стохастических зависимостей, например, вида
где
- непараметрическая оценка функции невязки либо её нелинейных преобразований многомерная ядерная функция.
Доказаны теоремы об асимптотической несмещённости и состоятельности гибридных моделей типа (7). На основе анализа асимптотических свойств гибридных моделей показано, что учет априорной информации о виде зависимости позволяет повысить показатели эффективности их восстановления по сравнению с непараметрической регрессией. ПричехМ при относительно приближенных сведениях о виде зависимости либо о ее второй производной преимущество гибридных моделей сохраняется. Данный вывод не распространяется на условия, когда априорные сведения о восстанавливаемой зависимости представлены в виде линейного полинома.
Существуют области компетентности среди гибридных моделей, соответствующих различным функциям невязки между известной параметрической аппроксимацией искомой зависимости и ее экспериментальными значениями. Очевидно, что данный факт связан с различным типом помех, характерных для экспериментальных данных.
Неопределённость выбора функции невязки, несмотря на имеющиеся результаты аналитических исследований, порождает проблемы в обоснованном применении той или иной модификации гибридных моделей. Так, гибридная модель с функцией невязки типа разности хорошо зарекомендовала себя в случае аддитивных помех, накладываемых на переменные изучаемой зависимости. При мультипликативных помехах эффективно использовать невязку типа отношения Отсутствие априорных сведений
о характере случайных воздействий делает необходимым применение методов коллективного оценивания, что повышает эффективность гибридных моделей и позволяет дополнительно вскрыть полезную информацию.
Исследованы асимптотические свойства линейных коллективов гибридных моделей ,
М&. м
Ы*)=1«у>\М> Е<*/=1 . (8)
у=1
гибридные модели, отличающиеся видом функции невязки, а соответствующие им коэффициенты.
Разработаны аналитические критерии оценивания эффективности гибридных моделей по значениям их коэффициентов в коллективе (8). Выводы теоретического исследования подтверждаются данными статистического моделирования при конечных объёмах обучающих выборок: коллектив гибридных моделей в среднем достоверно обладает более высокими аппроксимационными свойствами по сравнению с её составляющими; гибридная модель с функциями невязки типа отношения предпочтительнее при значительных отклонениях от восстанавливаемой зависимости. Методы гибридного моделирования развиты на условия наличия частного описания восстанавливаемой зависимости
На практике подобные условия соответствуют расширению возможностей системы контроля статических объектов от измерения параметров х(1) = (ху, V = 1, ¿1) до х = (х(1), дг(2)), при восстановлении зависимости Следуя методике синтеза гибридных моделей, сформируем выборку где функция невязки
определяет степень расхождения между значениями и ее частным описанием в пространстве переменных х(2).
Для восстановления по выборке воспользуемся
непараметрической регрессией Тогда гибридная модель
искомой зависимости представляется статистикой
(9)
каждая составляющая которой определяется своим набором переменных Свойства гибридной модели (9)
определяются следующим утверждением
Теорема 2. Пусть: 1) восстанавливаемая зависимость у = р(х) представима суммой однозначных функций ф(х) = ф1(х(1)) + 2) функции и плотности вероятностей
р(х), р(х(1)), р(х(2)) ограничены вместе со своими производными до второго порядка включительно; 3) принадлежит классу
положительных, симметричных и нормированных функций; 4) последовательность коэффициентов размытости ядерных
функций такова, что при: п—>со значения с(и)—»0, а лс(и)—>со. Тогда, если аппроксимация обладает свойствами
асимптотической несмещенности и сходимости в среднеквадратическом к ф[(х(1)), то такие же свойства имеет и гибридная модель
Достаточно строгие ограничения, представленные в условии 1) теоремы 2, могут быть сняты если использовать в качестве решающего правила при формировании гибридной модели непараметрическую оценку условного математического ожидания в пространстве (х(2}, ^ = F(.t(l),а)).
В четвёртой главе разработаны и исследованы статистические модели статических систем с линейной структурой, представляющих собой нелинейный коллектив непараметрических регрессий вида
(Ю)
восстанавливаемых по обучающимся выборкам
Статистика (10) типа «оценка в оценке» является основным фрагментом модели неопределённой системы с линейной структурой, что определяет актуальность создания методики её исследования. В работе установлены асимптотические свойства нелинейного непараметрического коллектива, которые представлены утверждением
Теорема 3. Пусть: 1) функции ^(х), ^(л) и плотности вероятности ограничены вместе со
своими производными до второго порядка включительно, причём <Рг{у\)к РгЬх) липшицируемы с некоторой ограниченной константой; 2) ядерные функции Ф(ы) являются положительными,
симметричными и нормированными при 3)
последовательности при а
«jcj-^oo, п2с2-*со. Тогда непараметрический коллектив (10) обладает свойствами асимптотической несмещенности и состоятельности.
В частности, среднеквадратическое отклонение статистики (10) ограничено выражением
ЧсгРгЬ>1)
WiM ЬрЦх)
Уг
Полученные результаты развиваются при исследовании нелинейного коллектива
(И) ,*2
где у^ задаётся параметрической моделью ^ =^(дг],а) еЛ ,
Частным случаем зависимости (10) при ¿1 = 1 является последовательная процедура формирования модели методом группового учёта аргументов или гибридная модель (9). Предварительно сформируем обучающую выборку
Принимая в качестве оптимального правила условное математическое ожидание, построим непараметрическую модель зависимости (11)
К*) = 1УАМ, (12)
где
ф{уцА)
итуациях х = (д^Д) сначала
При оценивании зависимости в с вычисляется. ух = Ffxj,«), а затем по д а н Код^) в соответствии со статистикой (12) определяется ,у(.х).
Определены условия асимптотической сходимости модели (12), что подтверждает возможность снижения размерности пространства признаков в задаче восстановления стохастических зависимостей.
В пятой главе разработаны и исследованы новые непараметрические модели анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов при априорной неопределённости.
Пусть состояние исследуемого объекта характеризуется множествами ХаЯк и УсД1 независимых наблюдений случайных величин взаимосвязь между которыми определяется
неизвестным преобразованием
Я:Х->Г. (13)
Априорную информацию составляет выборка (л"', У/ = 1,//), где множеству соответствует вполне определённое множество Подобные условия встречаются при исследовании объектов, параметры которых многократно измеряются в течении короткого интервала времени; при обработке больших массивов статистических данных, которые с помощью метода декомпозиции преобразуются к условиям исследования задачи (13).
Идея предлагаемого подхода заключается в замене операций над множествами на менее трудоемкие и хорошо разработанные операции над оценками функций распределения их элементов, используя методы проверки сложных статистических гипотез и непараметрической статистики.
Определим на элементах множеств X', У' исходной обучающей выборки (Л", У',/ = 1, Щ непараметрические оценки плотностей вероятности
Два множества Л", X* близки, если соответствующие им статистические оценки функций распределения с
некоторым уровнем доверия
Тогда модель преобразования случайных множеств (13) в задаче восстановления стохастических зависимостей
представляется в виде непараметрического коллектива оценок
/=1
в: |(у)->Г.
Оператор О является датчиком случайных величин, с помощью которого формируется оценка У множества У, соответствующего X.
В качестве критерия близости между оценками функций распределения ^(х) и Fj{x) используется, например, ядерная мера
1 1 —+—
т т
/2
и
Предложенная мера близости основана на использовании критерия Смирнова для проверки гипотезы Н0 с уровнем доверия
где т, т1 - соответственно количество элементов множества X и
Превышение порогового значения £>д критерия Смирнова означает нарушение гипотезы #0.
Полученные результаты развиты при синтезе непараметрических алгоритмов распознавания образов, включая условия неоднозначных указаний «учителя».
Доказана теорема об асимптотической несмещённости и' состоятельности модели (14).
Применение предложенного подхода является перспективным направлением «сжатия» информации обучающих выборок на основе её предварительной декомпозиции и последующем анализе получаемых множеств случайных величин в пространстве
параметров их законов распределения. При этом используются непараметрические оценки плотности вероятности регрессионного типа. На их основе появляется возможность осуществить доверительное оценивание непараметрических решающих функций в задаче восстановления стохастических зависимостей и распознавания образов.
В частности, предложены доверительные границы регрессионной оценки плотности вероятности, которые определяются статистиками
-1 V* /
(к V1 аг*__к
лМ= ГК Е^'ПФ
^=1 ) 1=1 У=1
< = 1,2, (15)
где количество элементов равномерной сетки, на которые
разбивается область определения плотности вероятности
элемента сетки, а верхняя и
нижняя толерантные границы частоты появления в нём точек исходной выборки с заданным уровнем доверия.
Статистики (15) являются основой построения доверительных границ для непараметрической оценки уравнения разделяющей поверхности в задаче распознавания образов.
В результате многочисленных вычислительных экспериментов подтверждено наличие смещения для непараметрических моделей стохастических зависимостей, формируемых на основе регрессионной оценки плотности вероятности, и предложена методика его алгоритмического устранения.
Впервые проведено исследование рандомизированного метода оптимизации непараметрических статистик, когда коэффициенты размытости с ядерных функций определяются случайно с законом распределения р{с). Обоснован выбор класса рациональных законов
Применение рандомизированного метода оптимизации позволяет на порядок повысить вычислительную эффективность непараметрических моделей.
В шестой главе представлено описание информационной системы исследования и прогнозирования динамики показателей преступности региона, основу математического обеспечения которой составляют непараметрические модели временных
зависимостей коллективного типа (6) и методика оценивания вклада аргументов в формирование значений восстанавливаемой зависимости, изложенные в 1 и 2 главах диссертации.
Особенность изучаемых социальных процессов, динамика которых зависит от экономических, демографических условий региона, материально-технического обеспечения
правоохранительных органов, состоит в их уникальности и нестационарном характере. Поэтому исходную информацию составляют короткие временные ряды статистических данных о состоянии различных видов преступности однородных групп населения, социально-экономических условий их проживания и качественном составе органов внутренних дел.
В структуре разработанной информационной системы выделяются четыре основные подсистемы:
Ведение баз данных. Предназначена для работы с массивами данных информационной системы. Обеспечивает ввод и представление данных в удобной для пользователя форме.
Достоверность. Обеспечивает решение задачи оценивания, достоверности отличий динамики показателей преступности однородных групп населения в различных условиях их формирования.
Прогноз. Направлена на решение следующих задач: прогнозирование динамики показателей преступности; определение вклада аргументов в формирование значений показателей преступности; определение тенденции их временного изменения.
Взаимосвязи. Позволяет решать задачи выявления взаимосвязей между показателями преступности и факторами, определяющих их изменение.
Каждая из приведенных подсистем является самостоятельным программным модулем, интегрированным в единую оболочку.
Результаты работы информационной системы предназначены для поддержки принятия решений (например, выбор организационных и оперативных, мероприятий, направленных на профилактику и борьбу с преступностью).
Разработанная информационная система прогнозирования и анализа динамики преступности используется в учебном процессе Сибирского юридического института МВД. РФ и планировании
деятельности Главного управления внутренних дел Красноярского края.
В седьмой главе приводится программное обеспечение, реализующее непараметрические коллективы решающих правил, и рассматривается его применение в задачах исследования технических и медико-биологических систем.
Программные средства реализованы в среде визуального программирования Delphi 6.0 и представляют собой диалоговый пакет программ, который предназначен для работы в операционной среде Windows 98 или Windows 2000 на компьютерах типа Pentium 4 с объемом оперативной памяти не менее 128 Mb.
Пакет программ ориентирован на конкретную структуру данных и предусматривает возможность подключения новых их баз.
Программные модули пакета предоставляют исследователю следующие возможности:
- первичная обработка данных и обнаружение статистических закономерностей, характеризующих статические и динамические системы при неполной информации;
- построение параметрических, непараметрических, гибридных моделей статических объектов, включая условия наличия их частного описания;
- построение непараметрических моделей временных процессов коллективного типа;
- синтез непараметрических коллективов решающих правил в задаче распознавания образов, включая анализ множеств случайных величин;
- оценивание вклада аргументов в формирование значений восстанавливаемых зависимостей с помощью непараметрических коллективов решающих правил.
Ориентация моделей и алгоритмов пакета программ на обнаружение скрытых закономерностей при малом уровне исходной информации придает ему универсальный характер и возможность исследовать объекты различной природы.
Разработанные программные средства использованы при исследовании показателей эффективности электронасосных агрегатов спутников связи (например, коэффициент полезного действия) в зависимости от параметров условий их
функционирования (количество оборотов электродвигателя, напряжение питания и управления, температура рабочей жидкости) и конструктивных особенностей рабочих колёс. По материалам вычислительных экспериментов на реальных данных определены эффективные режимы работы электронасосных агрегатов, которые используются при проектировании системы терморегулирования спутников связи в НПО «Прикладная механика» (г. Железногорск).
Гибридные модели стохастических зависимостей и непараметрические коллективы решающих правил широко используются в задачах исследования закономерностей влияния параметров электротехнологических процессов предпосевной высокочастотной (ВЧ) обработки семян пшеницы, валерианы лекарственной, клубней картофеля на показатели эффективности их развития и урожайность. При этом устранена систематическая погрешность традиционных полиномиальных моделей второго порядка, повышена в 2 раза точность аппроксимации искомой зависимости и определены рациональные режимы предпосевной обработки семян пшеницы в электромагнитном поле высокой частоты.
Непараметрические модели стохастических зависимостей коллективного типа успешно использовались при исследовании закономерностей взаимосвязи между параметрами гемодинамики сердечно-сосудистой системы организма человека с учётом возраста и стажа проживания на Севере. Средняя относительная ошибка моделирования составила - 5.7%, что в два раза ниже по сравнению с непараметрической регрессией.
Установлено, что критерии оценивания состояния сердечнососудистой системы определяются не только повышенным артериальным давлением, его предвестником являются значения скорости распространения пульсовой волны и её динамика.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
Впервые с единых теоретических позиций разработаны методы оптимального синтеза и анализа непараметрических моделей коллективного типа для решения задач восстановления стохастических зависимостей, распознавания образов, моделирования временных процессов, анализа множеств случайных величин и исследования статических систем с линейной
структурой, которые обеспечивают эффективный учёт априорной информации. Фундаментальная значимость выполненных исследований заключается в создании нового научного направления, обобщающего традиционные непараметрические решающие правила на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций.
Сформулированная цель диссертации достигнута, получены следующие основные результаты и выводы:
1. Развиты теоретические основы построения непараметрических моделей коллективного типа в задачах восстановления многомерных стохастических зависимостей и распознавания образов, обеспечивающие повышение в (2-3) раза вычислительной эффективности их решения на основе более полного использования информации обучающих выборок и учёта аппроксимационных свойств элементов коллектива. Установлено слабое влияние вида упрощённых параметрических аппроксимаций на асимптотические свойства непараметрических коллективов, что обосновывает использование при их синтезе линейных полиномов. На этой основе предложены итерационная и комбинированная процедуры последовательного формирования упрощённых аппроксимаций, минимизирующих на каждом этапе относительную эмпирическую ошибку моделирования. Разработана оригинальная методика оценивания вклада аргументов в формирование значений восстанавливаемых зависимостей.
2. Разработаны новые непараметрические модели временных процессов, основанные на методе двойного коллективного оценивания. Повышенные их аппроксимационные свойства достигаются за счёт увеличения количества упрощённых параметрических аппроксимаций временных процессов и учёта статистических оценок их показателей эффективности. Определены асимптотические свойства непараметрических моделей коллективного типа и их зависимость от количества и вида упрощённых аппроксимаций, объёма исходной информации. Установлено, что достоверное отличие средних значений коэффициентов при аргументах упрощённых аппроксимаций непараметрических моделей коллективного
типа в обобщённой модели временного процесса, является критерием эффективного применения метода двойного коллективного оценивания.
3. Разработаны новые модификации гибридных моделей, обеспечивающие комплексное использование априорных сведений о виде восстанавливаемой зависимости и информации обучающих выборок. Предлагаемые модели гарантируют преемственность результатов научных исследований и отличаются от известных принципами формирования и оценивания функции невязки - меры расхождения между экспериментальными данными и исходным представлением о виде исследуемой зависимости. Установлены условия их асимптотической сходимости. При относительно приближённых сведениях о виде искомой зависимости либо о её второй производной отмечается преимущество гибридных моделей над традиционными непараметрическими аппроксимациями. Для преодоления существующей неопределённости выбора гибридных моделей в конкретных условиях восстановления стохастических зависимостей разработаны их коллективы. Предложена методика количественного оценивания показателей эффективности гибридных моделей составляющих коллектив.
4. Гибридные модели стохастических зависимостей с учётом их частного описания позволяют наиболее полно использовать априорную информацию в условиях расширения возможностей системы контроля параметров изучаемых объектов. В подобных моделях сведения о виде восстанавливаемой зависимости и функция невязки с экспериментальными данными определяются в различных пространствах признаков. Если искомая зависимость представляется в аддитивном виде при данных наборах признаков, то существуют условия, когда изучаемые гибридные модели обладают свойствами асимптотической несмещённости и состоятельности.
5. Разработаны и исследованы нелинейные коллективы непараметрических регрессий, реализующие последовательные процедуры формирования решений. Определены зависимости условий асимптотической сходимости непараметрического коллектива от его параметров и объёма обучающей выбороки.
I РОС. НАЦИОНАЛЬНАЯ |
I БИБЛИОТЕКА |
6. Исследованы асимптотические свойства непараметрической регрессии, содержащей в качестве аргумента параметрическую аппроксимацию. Подобные статистики являются модификацией модели статической системы с линейной структурой и основным фрагментом последовательной процедуры формирования многофакторных моделей. Для линейных параметрических аппроксимаций установлена асимптотическая сходимость модификации непараметрического коллектива, тем самым впервые аналитически обосновывается возможность частичного сокращения пространства признаков при формировании решений.
7. Сформировано новое научное направление моделирования неопределённых систем, когда условия формирования решений определяются множествами случайных величин. Идея предлагаемого подхода заключается в замене операций над множествами на менее трудоёмкие и хорошо разработанные операции над оценками функций распределения их элементов, преобразование которых осуществляется на основе проверки сложных статистических гипотез и методов непараметрической статистики. Разработаны оригинальные модели анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов, представляющие собой непараметрические коллективы статистических оценок плотностей вероятности элементов множеств. Установлены условия асимптотической несмещённости и состоятельности статистических оценок их показателей эффективности.
8. Развита методика восстановления стохастических зависимостей и распознавания образов в условиях больших выборок на основе их предварительной декомпозиции и последующего решения задач в пространстве параметров законов распределения элементов множеств случайных величин. При этом впервые построены толерантные границы непараметрических решающих функций на основе доверительного оценивания частот принадлежности точек исходной выборки множествам случайных величин.
9. Для широкого применения результатов научных исследований разработан пакет программ, в котором реализованы
непараметрические модели коллективного типа для решения задач восстановления стохастических зависимостей, распознавания образов, моделирования временных процессов и анализа множеств случайных величин. Ориентация непараметрических коллективов на уровень априорной неопределённости обеспечивает адаптацию пакета программ при исследовании объектов различной природы. На его основе разработана информационная система анализа и прогнозирования динамики показателей преступности региона, которая прошла испытания на реальных данных. Пакет программ используется при оценивании показателей эффективности агрегатов системы терморегулирования спутников связи и исследовании электротехнологического процесса предпосевной обработки семян сельскохозяйственных культур. На его основе определены количественные закономерности гемодинамических процессов сердечнососудистой системы организма человека в экологических условиях Севера и уточнены критерии оценивания её состояния.
Основные положения и результаты диссертационной
работы представлены в следующих публикациях автора:
1. Лапко, А.В. Непараметрические модели коллективного типа /
A.В. Лапко, В.А. Лапко, М.И. Соколов, СВ. Ченцов. -Новосибирск: Наука, 2000. - 144с.
2. Лапко, А.В. Непараметрические системы классификации / А.В. Лапко, В.А. Лапко, М.И. Соколов, СВ. Ченцов. - Новосибирск: Наука, 2000. - 240с.
3. Лапко, В.А. Непараметрические методы обработки информации: Учеб. пособие / В.А. Лапко, М.И. Соколов. -Красноярск: КГТУ, 2001.-116с.
4. Лапко, В.А. Непараметрические коллективы решающих правил /
B.А. Лапко. - Новосибирск: Наука, 2002. - 168с.
5. Лапко, В.А. Непараметрические модели статических объектов на основе методов коллективного оценивания / В.А. Лапко, СВ. Ченцов // Информатика и системы управления: Межвузовский сборник научных трудов. - Красноярск: НИИ ИЛУ, 1996. -(Вып. 1).-С56-60.
6. Лапко, В.А. Исследование асимптотических свойств непараметрических моделей коллективного типа / В.А. Лапко, СВ. Ченцов // Информатика и системы управления: Межвузовский сборник научных трудов. - Красноярск: НИИ ИЛУ, 1997. - (Вып. 2). - С.12-19.
7. Лапко, В.А. Оптимизация непараметрических аппроксимаций коллективного типа / В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. -Красноярск: НИИ ИПУ, 1998. - (Вып. 3). - С.84-91.
8. Лапко, А.В. Непараметрические модели распознавания образов в условиях малых выборок / А.В. Лапко, В.А. Лапко, СВ. Ченцов // Автометрия, 1999. - №6. - С105-113.
9. Лапко, А.В. Синтез и анализ непараметрических алгоритмов распознавания образов в условиях больших выборок / А.В. Лапко, В.А. Лапко, СВ. Ченцов // Распознавания образов и анализ изображений: новые информационные технологии: Труды 5 международной конференции (16-22 октября 2000, Самара) / Институт систем обработки изображений РАН. -Самара, 2000. -Т.1. - С.85-89.
10. Лапко, В.А. Комбинированный метод формирования упрощённых аппроксимаций при синтезе непараметрических моделей коллективного типа / В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. -Красноярск: НИИ ИПУ, 2000. - (Вып. 5). - С. 152-156.
11. Лапко, В.А. Непараметрические модели коллективного типа /
B.А. Лапко // Идентификация систем и задачи управления: Труды международной конференции (26-28 сентября 2000, Москва) / ИПУ РАН. - Москва, 2000. - С. 635-641.
12.Востротина, А. С Информационная система оценивания и прогнозирования динамики состояния здоровья населения / А.С Востротина, Г.С Высоцкая, А.В. Лапко, В.А. Лапко и др. // Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС: Труды межрегиональной конференции (19-21 декабря 2000, г. Красноярск) / ИВМ СО РАН. - Красноярск, 2000. - С. 74-81.
13. Лапко, В.А. Синтез и анализ непараметрических моделей коллективного типа / В.А. Лапко // Автометрия, 2001. - №6. -
C.98-106.
Н.Двирный, В.В. Статистический анализ влияния конструктивных особенностей рабочих колёс на эффективность электронасосных агрегатов спутников связи / В.В. Двирный, М.И. Соколов, В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. - Красноярск: НИИ ИГЛУ, 2001. -(Вып. 6).-С. 188-194.
15. Двирный, В.В. Разработка и исследование непараметрических моделей малорасходных вентиляторов космических аппаратов / В.В. Двирный, М.И. Соколов, В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. -Красноярск: НИИ ИПУ, 2001. - (Вып. 6). - С. 195 - 201.
16. Лапко, В.А. Непараметрические модели временных зависимостей, основанные на методе двойного коллективного оценивания / В.А. Лапко // Автометрия, 2002. - №1. - С.42-50.
17. Лапко, А. В. Гибридные модели стохастических зависимостей / А.В. Лапко, В.А. Лапко // Автометрия, 2002. - №5. - С.38-48.
18. Двирный, В.В. Экспериментальные исследования критерия подобия малорасходных центробежных насосов в зависимости от частоты вращения / В.В. Двирный, В.А. Лапко, А.А. Логанов и др. // Информатика и системы управления: Межвузовский сборник научных трудов. - Красноярск: НИИ ИПУ, 2002. -(Вып. 7).-С. 70-75.
19. Лапко, В.А. Модификации непараметрических моделей временных зависимостей коллективного типа / В.А. Лапко, К.Ю. Гуревич // Информатика и системы управления: Межвузовский сборник научных трудов. - Красноярск: НИИ ИПУ, 2002. -(Вып. 7). - С. 52 - 57.
20. Лапко, А.В. Непараметрические методики анализа множеств случайных величин / А.В. Лапко, В.А. Лапко // Автометрия, 2003.-№1.-С.54-61.
21. Лапко, В.А. Гибридные модели стохастических зависимостей в условиях частного описания / В.А. Лапко, Г.И. Цугленок // Вестник КрасГАУ, 2003. - №2. - С.67-72.
22. Лапко, А.В. Непараметрические коллективы в задаче прогнозирования эффективных режимов электротехнических процессов / А.В. Лапко, В.А. Лапко, Г.И. Цугленок // Вестник КрасГАУ, 2003. - №2. - С.74-78.
23. Селиванов, Н.И. Применение статистических методов для исследования тяго-сцепных свойств гусеничного трактора на снежном покрове / Н.И. Селиванов, В.А. Лапко, А.В. Кузнецов // Ресурсосберегающие технологии механизации сельского хозяйства (приложение к Вестнику КрасГАУ). - Красноярск: КрасГАУ, 2003. - №1. - С.60-64.
24. Высоцкая, Г.С. Информационная система комплексного исследования и прогнозирования состояния здоровья населения региона / Г.С. Высоцкая, К.Ю. Гуревич, А.В. Лапко, В.А. Лапко и др. // Проблемы информатизации региона: Материалы 8 Всероссийской научно-практической конференции (28-29 октября 2003, Красноярск) / КГТУ. - Красноярск, 2003. -Т.1. -С.164-167.
25. Лапко, В.А. Синтез и анализ гибридных моделей стохастических зависимостей в условиях наличия их частного описания / В.А. Лапко // Автометрия, 2004. - №1. - С.51-59.
26. Лапко, В.А. Статистические модели электротехнических изделий и процессов с учётом их частичного описания / В.А. Лапко, М.И. Соколов, Г.И. Цугленок // Вестник КрасГАУ, 2004. -№3.-С.267-270.
27. Лапко, В.А. Модификации непараметрических моделей коллективного типа в задачах восстановления временных процессов / В.А. Лапко, В.В. Молоков, А.А. Лапко // Вестник КрасГАУ, 2004. - №3. - С.44-50.
28. Lapko, A.V. Simulation and optimization of developing systems, when information is not complete / A.V. Lapko, G.S. Vysotskaya, V.A. Lapko // MS'99 Proceedings of International Conference on Modelling and Simulation (17-19 May 1999, Santiago de Compostela, Spain) / University Of Santiago de Compostela. -Santiago de Compostela, 1999. - Vol. II. -pp. 141-149.
29. Lapko, A.V. Nonparametric Models Of Pattern Recognition Under Conditions Of Small Samples / A.V. Lapko, V.A. Lapko, S.V. Chentsov // Optoelectronics, Instrumentation And Data Processing, 1999.-№6.-pp. 83-90.
30. Lapko, A.V. Nonparametric algorithms and classification systems / A.V. Lapko, V.A. Lapko, S.V. Chentsov // Pattern recognition and image analysis, 2000. - Vol. 10. - №1. - pp. 31-42.
31.Lapko, A.V. Synthesis And Analysis Nonparametric Algorithms Of Pattern Recognition When Samples Are Large / A.V. Lapko, V.A. Lapko, S.V. Chentsov // Pattern recognition and image analysis, 2001.-Vol. 11.-№1. -pp. 53-55.
32. Lapko, V.A. Synthesis And Analysis Of Nonparametric Collective-Type Models / V.A. Lapko // Optoelectronics, Instrumentation And Data Processing, 2001. - №6. -pp. 83-90.
33. Lapko, V.A. Nonparametric Models of Pattern Recognition of Collective Type / V.A. Lapko // Pattern recognition and image analysis, 2002. - Vol. 12. - №4. -pp. 354-361.
34. Lapko, V.A. Nonparametric Models Of Time Dependences Based On Double Collective Estimation / V.A. Lapko // Optoelectronics, Instrumentation And Data Processing, 2002. - №1. - pp. 37-44.
35. Lapko, A.V. Hybrid Models Of Stochastic Dependences / A.V. Lapko, V.A. Lapko // Optoelectronics, Instrumentation And Data Processing, 2002. - №5. -pp. 33-42.
36. Chikanov, N.F. Development Test Results For Aluminum Gas Control Heat Pipes On Smalsat Positioning Satellites / N.F. Chikanov, V.V. Dvirnyi, S.P. Ermilov, A.G. Kozlov, V.I. Khalimanovich, V.A. Lapko and other // 12th International Heat Pipe Conference / Institute OfThermal Physics Of The Ural Branch RAS. - Ekaterinburg, 2002-Vol. 1.-pp. 81-86.
37. Lapko, A.V. Nonparametric Methods For Random variable Set Analysis / A.V. Lapko, V.A. Lapko // Optoelectronics, Instrumentation And Data Processing, 2003. - №1. - pp. 44-50.
Подписано к печати 30 апреля 2004 г. Тираж 100 экз. Заказ №_/££ Отпечатано в типографии КГТУ 660036, Красноярск, ул. Киренского, 26
11 09 98
Оглавление автор диссертации — доктора технических наук Лапко, Василий Александрович
Введение
1 Синтез и анализ непараметрических моделей коллективного 19 типа в задачах восстановления стохастических зависимостей
1.1 Классификация статистических моделей коллективного типа
1.2 Восстановление многомерных стохастических зависимостей 23 на основе непараметрических коллективов
1.3 Непараметрические коллективы решающих правил в задаче 27 распознавания образов
1.4 Дифференциация признаков анализируемой ситуации по 35 степени их влияния на формирование решения
1.5 Асимптотические свойства непараметрических моделей 37 коллективного типа
1.6 Сравнение аппроксимационных свойств непараметрических 47 моделей"коллективного типа
1.7 Оптимизация непараметрических моделей коллективного 55 типа
1.7.1 Выбор закона распределения опорных точек
1.7.2 Методика формирования системы опорных точек
1.7.3 Оценивание областей компетентности 66 непараметрических моделей коллективного типа
1.8 Свойства непараметрических моделей коллективного типа в 69 условиях ограниченных выборок
1.8.1 Анализ непараметрических коллективов при • 69 оценивании стохастических зависимостей
1.8.2 Анализ свойств непараметрических алгоритмов 82 распознавания образов коллективного типа
Выводы
2 Непараметрические модели временных зависимостей, основанные на методе двойного коллективного оценивания
2.1 Традиционные непараметрические модели временных 94 зависимостей коллективного типа и их свойства
2.2 Синтез и анализ непараметрических моделей временных 104 зависимостей, основанных на методе двойного коллективного оценивания
2.3 Асимптотические свойства непараметрических коллективов 109 временных зависимостей
2.4 Сравнение аппроксимационных свойств непараметрических 116 коллективов в задаче восстановления временных зависимостей
2.5 Исследование свойств непараметрических моделей 118 коллективного типа при коротких временных рядах
Выводы
3 Коллективы гибридных моделей в задаче восстановления стохастических зависимостей
3.1 Направления повышенной эффективности использования 126 априорной информации
3.2 Традиционные гибридные модели
3.3 Модификации гибридных моделей
3.4 Синтез и анализ коллективов гибридных моделей
3.5 Оценка эффективности входящих в коллектив гибридных 137 моделей
3.6 Сравнение аппроксимационных свойств коллектива 141 гибридных моделей
3.7 Непараметрические модели стохастических зависимостей с 148 учётом их частичного описания
Выводы
4 Непараметрические модели последовательных процессов 163 принятия решений
4.1 Непараметрические модели статических систем с линейной 163 структурой
4.2 Непараметрические модели стохастических зависимостей, 173 основанные на методе группового учёта аргументов
Выводы
5 Непараметрические модели анализа множеств случайных 179 величин
5.1 Регрессионная оценка плотности вероятности
5.2 Применение метода декомпозиции обучающей выборки в 183 задаче распознавания образов
5.3 Синтез и анализ непараметрической регрессии на основе 186 метода декомпозиции выборки
5.4 Анализ множеств случайных величин при восстановлении 188 стохастических зависимостей
5.5 Непараметрические алгоритмы классификации множеств 196 случайных величин
5.6 Свойства непараметрических моделей стохастических 198 зависимостей в условиях больших выборок
Выводы
6 Информационная система прогнозирования динамики состояния преступности региона
6.1 Основные понятия и определение объекта исследования
6.2 Системный анализ преступности и ее причины
6.3 Задачи исследования состояния преступности региона
6.4 Анализ направлений научных исследований в задачах 248 профилактики и борьбы с преступностью
6.5 Структура информационной системы и описания процесса её 251 функционирования
6.6 Прогнозирование показателей преступности на примере 257 Красноярского края
Выводы
7 Программное обеспечение непараметрических коллективов 272 решающих правил и его применение
7.1 Программное обеспечение непараметрических коллективов 273 решающих правил
7.1.1 Назначение комплекса программ и его 273 функциональные возможности
7.1.2 Структура комплекса программ
7.1.3 Описание вспомогательных блоков
7.1.4 Блок программ «Непараметрические методы 278 восстановления стохастических зависимостей»
7.1.5 Блок программ «Непараметрические методы 283 распознавания образов»
7.1.6 Описание работы блока программ «Оценка вклада 287 аргументов»
7.2 Статистические модели оценивания показателей эффективности электротехнических изделий
7.2.1 Непараметрические модели оценивания показателей 291 эффективности электронасосных агрегатов
7.2.2 Статистический анализ влияния конструктивных 296 особенностей рабочих колёс на эффективность электронасосных агрегатов
7.2.3 Разработка и исследование непараметрических 304 моделей малорасходных вентиляторов системы охлаждения
7.3 Информационная система исследования закономерностей 312 влияния параметров энерготехнологических процессов предпосевной высокочастотной обработки семян
7.3.1 Гибридные модели электромагнитного поля 313 процессов ВЧ и СВЧ обработки семян пшеницы
7.3.2 Коллективы решающих правил в задаче исследования 316 процессов ВЧ и СВЧ обработки семян пшеницы
7.3.3 Статистическая модель динамики развития валерианы 319 лекарственной
7.3.4 Статистические модели оценивание показателей 322 эффективности технологии высокочастотной предпосевной обработки клубней картофеля
7.4 Восстановление взаимосвязи между показателями гемодинамики сердечно-сосудистой системы организма человека в экологических условиях Севера.
Выводы ^^
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Лапко, Василий Александрович
Актуальность работы. Методы коллективного оценивания находят широкое распространение на современном этапе развития теории обучающихся систем, когда возникла потребность в обобщении разнотипных алгоритмов обработки информации с целью получения интегрированных знаний.
Обязательным условием синтеза традиционных моделей коллективного типа является наличие конечного множества решающих правил, каждое из которых имеет самостоятельное значение. Тогда коллектив моделей, например, с позиций средневзвешенного преобразования либо оценивания областей их компетентности, аккумулирует преимущества составляющих коллектив решающих правил. Другим крайним случаем коллектива являются непараметрические модели, структуру которых образуют элементы обучающей выборки и соответствующие им ядерные (весовые) функции. Каждая ядерная функция оказывает влияние на процесс формирования решения только в пределах конкретной ситуации из обучающей выборки.
В научной литературе настойчиво обсуждается и разрабатывается идея о совместном использовании в коллективе разнотипных моделей - как средства наиболее полного учета априорной информации. Известно яркое высказывание профессора В. Хардле (Прикладная непараметрическая регрессия. — М.: Мир, 1993): «Совмещение параметрических и непараметрических составляющих может даже привести к построению лучшей модели, чем непараметрический или параметрический подход!». Получены первые успешные результаты исследований в данном направлении, к которым можно отнести методы локальной аппроксимации (Катковник В .Я., 1985), гибридные модели (Лапко A.B., 1993), полупараметрические и частично линейные модели (Хардле В., 1993). При этом особое внимание уделяется алгоритмам восстановления стохастических зависимостей, обеспечивающих учет частичных сведений об их виде и данных экспериментальных исследований.
Предлагаемая работа посвящена развитию и теоретическому обоснованию нового научного направления математического моделирования неопределённых систем с позиций методов непараметрической статистики и коллективного оценивания с целью повышения эффективности использования априорной информации на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций. Под неопределёнными системами понимаются системы, исследование которых осуществляется в условиях неполной информации о закономерностях их функционирования.
Непараметрические модели коллективного типа формируются на основе семейства упрощённых параметрических либо локальных аппроксимаций искомой зависимости, объединение которых в единое решающее правило осуществляется с помощью непараметрической оценки условного математического ожидания относительно параметров элемента коллектива и (или) значений их обобщённых характеристик.
К непараметрическим коллективам относятся их модификации, гибридные и непараметрические модели, основанные на последовательных процедурах формирования решений.
Среди рассматриваемого класса моделей различаются линейные и нелинейные непараметрические коллективы, исследование асимптотических свойств которых требуют разработки соответствующих аналитических технологий.
В рамках данного направления появляется возможность обобщения традиционного непараметрического подхода и обеспечивается преемственность результатов научных исследований, что определяет фундаментальную значимость тематики диссертации.
Полученные при этом научные результаты создают методическую и математическую основу автоматизации проектирования информационных систем, реализующих непараметрические коллективы решающих правил, адаптируемых к объектам различной природы и условиям их исследования.
Основные научные результаты диссертации получены в рамках планов научных исследований Института вычислительного моделирования СО РАН (№01.9.80 007505 «Разработка математического и программного обеспечения многоуровневых интеллектуальных информационных систем принятия решений», №0.200.1 13696 «Разработка математического и программного обеспечения интеллектуальных информационно-аналитических систем») и Сибирском государственном аэрокосмическом университете имени академика М.Ф. Решетнёва. Актуальность темы диссертации признана рядом Российских фондов и организаций, осуществляющих финансирование научных исследований (РФФИ, гранты №00-01-00001, №01-01-06015 (MAC), №02-01-06409 (MAC), №03-01-00081; РГНФ - №03-05-12012в; Министерство образования РФ по фундаментальным исследованиям в области естественных и точных наук - №Е00-69-02; Красноярский краевой фонд науки - №10F0023M; Министерство промышленности, науки и технологий РФ (Совет по грантам Президента РФ) - №МК-143.2003.01; Фонд содействия отечественной науки).
Тема диссертации соответствует перечню «Критические технологии РФ» по направлению — компьютерное моделирование.
Цель работы: Разработать теоретические основы оптимального синтеза и анализа непараметрических коллективов решающих правил, обеспечивающих эффективное использование априорной информации на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций.
Цель достигается путём решения следующих задач:
1. Развить и обобщить методику синтеза непараметрических моделей коллективного типа в задачах восстановления многомерных стохастических зависимостей и распознавания образов в условиях неполной информации.
2. Разработать методику построения непараметрических моделей временных зависимостей по коротким рядам наблюдений их переменных на основе метода двойного коллективного оценивания, исследовать их свойства и определить условия компетентности.
3. Разработать и исследовать коллективы гибридных моделей стохастических зависимостей, учитывающих априорные сведения об их виде, локальном поведении и обеспечивающих «обход» проблемы выбора моделей в конкретных условиях их применения.
4. Разработать методику синтеза и анализа непараметрических моделей последовательных процессов принятия решений, создающих основу исследования сложных неопределённых систем с линейной структурой.
5. С позиций методов коллективного оценивания разработать и исследовать непараметрические модели анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов.
6. Создать информационные средства, реализующие непараметрические коллективы решающих правил, и применить их при исследовании социальных, медико-биологических и технических систем.
Методы исследования. Для решения поставленных задач использовались теория сложных и обучающихся систем, аппарат теории вероятности и математической статистики, методы коллективного оценивания и статистического моделирования.
Научная новизна исследований. Впервые теоретически обоснована и решена проблема оптимального синтеза и анализа непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей, распознавания образов, включая обработку множеств случайных величин, и моделирования временных процессов, которые обеспечивают эффективное использование априорной информации путём сочетания преимуществ параметрических и локальных аппроксимаций, тем самым сформировано новое научное направление в развитии методологии статистического моделирования систем при неполной информации.
В частности:
1. Развиты теоретические основы построения непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей и распознавания образов, обобщающих традиционные локальные аппроксимации и позволяющие эффективно использовать информацию обучающих выборок. Разработаны новые непараметрические коллективы с учётом эффективности упрощённых параметрических аппроксимаций, которые характеризуются более высоким уровнем помехозащищённости и точности. Из анализа асимптотических свойств непараметрических коллективов установлена слабая зависимость аппроксимационных свойств непараметрических моделей коллективного типа от вида упрощённых параметрических аппроксимаций. Впервые разработана методика оценивания вклада аргументов в формирование значений восстанавливаемой зависимости на основе непараметрического коллектива с системой линейных упрощённых аппроксимаций.
2. Предложена и обоснована методика двойного коллективного оценивания при синтезе непараметрических моделей временных зависимостей, включая нестационарные процессы, обеспечивающая максимальное использование информации коротких рядов наблюдений их переменных и повышенную помехозащищённость разрабатываемых моделей.
3. Разработаны и исследованы новые модификации гибридных моделей, отличающихся видом непараметрической оценки функции невязки между параметрической аппроксимацией восстанавливаемой зависимости и её наблюдениями из обучающей выборки, что обеспечивает более полный учёт априорной информации. Для обхода проблем выбора вида функции невязки, предложена методика синтеза и анализа коллектива гибридных моделей.
4. С позиций методов коллективного оценивания разработаны и исследованы непараметрические модели статических систем с линейной структурой. При этом впервые аналитически обоснована возможность частичного сжатия пространства признаков непараметрической регрессии на основе их линейного преобразования.
5. Сформулирована и решена проблема анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов. Идея предлагаемого подхода заключается в замене операций над множествами на преобразования законов распределения их элементов с помощью непараметрических коллективов решающих правил.
Практическая ценность диссертации заключается в разработке методики, алгоритмических и программных средств синтеза и анализа структуры непараметрических коллективов решающих правил, ориентированных на исследование статических и динамических объектов различной природы при априорной неопределённости.
Полученные научные результаты рекомендуются для использования при выборе методов аппроксимации, построении и оптимизации непараметрических коллективов решающих правил в задачах восстановления стохастических зависимостей и распознавания образов.
Слабая зависимость условий асимптотической сходимости статистических оценок показателей эффективности непараметрических коллективов решающих правил от вида упрощённых аппроксимаций обосновывает использование линейных упрощённых аппроксимаций, что имеет важное прикладное значение для повышения вычислительной эффективности изучаемого класса моделей и обеспечивает разработку методики оценивания вклада аргументов при формировании значений восстанавливаемой функции.
Применение непараметрических моделей временных зависимостей коллективного типа открывает возможность исследования широкого класса уникальных социальных, экономических и медико-биологических систем, динамика которых характеризуется короткими рядами наблюдений их переменных.
Гибридные модели многомерных стохастических зависимостей гарантируют преемственность результатов научных и прикладных разработок на основе использования ранее разработанных «старых» моделей в качестве дополнительной исходной информации.
Критерии статистического оценивания условий преимущества непараметрических коллективов решающих правил создают методическую и алгоритмическую основу автоматизации их проектирования при построении типовой информационной системы.
Информационные средства, реализующие непараметрические коллективы решающих правил, обладают возможностью адаптации к различным условиям исследования неопределённых систем и требованиям пользователей.
Автор защищает:
1. Модификации непараметрических моделей многомерных стохастических зависимостей и алгоритмов распознавания образов коллективного типа, обеспечивающие эффективное использование информации обучающих выборок на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций. Вычислительные аспекты применения непараметрических коллективов решающих правил и методы синтеза их эффективной структуры.
2. Непараметрические модели временных зависимостей, основанные на методе двойного коллективного оценивания; зависимость их свойств от особенностей исходной информации, содержащейся в коротких рядах наблюдений переменных изучаемых процессов, и параметров непараметрических коллективов. Свойства предложенных моделей и критерии оценивания условий их компетентности.
3. Методику оценивания вклада аргументов в формирование значений восстанавливаемой зависимости на основе непараметрических моделей коллективного типа, использующих систему линейных упрощённых аппроксимаций.
4. Коллективы гибридных моделей многомерных стохастических зависимостей и их модификации; асимптотические свойства моделей и результаты сравнения их показателей эффективности.
5. Непараметрические модели статических систем с линейной структурой, элементы которой аппроксимируются непараметрическими регрессиями и образуют нелинейный коллектив решающих правил; асимптотические свойства показателей эффективности моделей и их зависимость от особенностей исходной информации.
6. Непараметрические модели анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов, синтез которых основывается на методах коллективного оценивания; свойства моделей и алгоритмы их оптимизации. 7. Информационные средства, реализующие непараметрические коллективы решающих правил. Результаты их применения при прогнозировании динамики показателей преступности в регионе и урожайности сельскохозяйственных культур; исследовании закономерностей гемодинамических процессов сердечно-сосудистой системы организма человека в экологических условиях Севера; оценивании показателей эффективности системы терморегулирования спутников связи.
Реализация результатов работы. Непараметрические модели временных зависимостей коллективного типа и методика оценивания вклада аргументов в формирование их значений составили основу математического обеспечения информационной системы прогнозирования динамики показателей состояния преступности региона, которая используется в учебном процессе Сибирского юридического института МВД России и планировании деятельности ГУВД Красноярского края.
Непараметрические модели многомерных стохастических зависимостей коллективного типа и гибридные модели использованы при создании информационных средств оценивания показателей эффективности системы терморегулирования спутников связи в НПО «Прикладная механика» (г. Железногорск), исследовании технологии высокочастотной предпосевной обработки семян, прогнозировании урожайности сельскохозяйственных культур (Красноярский государственный аграрный университет).
Разработанные непараметрические модели коллективного типа и программные средства внедрены в Институте медицинских проблем Севера СО РАМН для исследовании взаимосвязей между параметрами гемодинамики сердечно-сосудистой системы организма человека в экологических условиях Севера.
Материалы диссертации включены в учебное пособие «Непараметрические системы обработки информации», изданное в рамках Федеральной целевой программы «Государственная поддержка интеграции высшего образования и фундаментальной науки 1997-2000 годы» и рекомендованное Министерством образования РФ для обучения студентов по направлению 654600 - «Информатика и вычислительная техника».
Апробация работы. Основные положения диссертации представлялись и обсуждались на Всероссийских, Международных и региональных конференциях, в частности: 3-ей Всероссийской конференции с участием стран СНГ «Распознавание образов и анализ изображений: новые информационные технологии» (Нижний Новгород, 1997), Всероссийской конференции «Здоровье общества и безопасность жизнедеятельности» (Красноярск, 1997), 8-ой Всероссийской конференции «Математические методы распознавания образов» (Москва, 1997г.), 3-ем и 4-ом Сибирском конгрессе по прикладной и индустриальной математике (Новосибирск, 1998г., 2000г.), Международной конференции «Идентификация систем и задачи управления» (Москва, 2000г.), 5-ой Международной конференции «Распознавания образов и анализ изображений: новые информационные технологии» (Самара, 2000г.), Международной научно-практической конференции «Сибирский авиационно-космический салон» (Красноярск -Железногорск, 2001г., 2002г.), Международной конференции «12th International Heat Pipe Conference» (Moscow - Kostroma - Moscow, 2002), Всероссийской научно-практической конференции «Проблемы информатизации региона» (Красноярск, 2003г.), 7-ой Всероссийской научной конференции с участием иностранных учёных «Современные методы математического моделирования природных и антропогенных катастроф» (Красноярск, 2003г.).
Результаты исследований включались в основные научные достижения Института вычислительного моделирования СО РАН; представлены в отчётах грантов РФФИ №00-01-00001 «Разработка непараметрических систем распознавания образов, основанных на методе коллективного оценивания», №01-01-06015 (MAC), 02-01-06409 (MAC), №03-01-00081 «Разработка непараметрических систем классификации множеств случайных величин»; гранта РГНФ №03-05-12012в «Разработка территориально распределённой информационной системы эпидемиологического мониторинга артериальной гипертонии среди населения региона»; гранта Министерства образования РФ по фундаментальным исследованиям в области естественных и точных наук №Е00-69-02 «Разработка и исследование непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей»; гранта Красноярского краевого фонда науки №10F0023M «Разработка и исследование непараметрических моделей нестационарных зависимостей коллективного типа»; гранта Президента РФ № МК-143.2003.01 «Разработка теоретических основ построения непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей» и гранта Фонда содействия отечественной науке «Выдающиеся учёные. Кандидаты и доктора наук РАН».
Перспективный характер направления исследований и научная новизна полученных результатов отмечалась в журнале «Вестник РФФИ» (№3, 2001).
Публикации. Результаты теоретических, экспериментальных и прикладных исследований опубликованы в 53 печатных работах, из них 11 статей в журналах рекомендованных ВАК для представления материалов докторских диссертаций, три монографии, учебное пособие и 10 статей в зарубежной печати.
Структура и объём работы. Диссертация состоит из введения, семи глав, заключения, списка использованной литературы (175 наименований), содержит 357 страниц машинописного текста, иллюстрируется 107 рисунками.
Заключение диссертация на тему "Синтез и анализ непараметрических коллективов решающих правил"
Выводы
1. Для широкого исследования результатов научных исследований в среде Delphi разработан комплекс программ, в котором реализованы непараметрические модели коллективного типа для решения задач восстановления стохастических зависимостей, распознавания образов и моделирования временных процессов, анализа множеств случайных величин. Ориентация непараметрических коллективов на уровень априорной неопределённости обеспечивает адаптацию комплекса программ при исследовании объектов различной природы.
2. Комплекс программ непараметрических коллективов решающих правил использовался при оценивании показателей эффективности электронасосных агрегатов с учётом конструктивных особенностей их рабочих колёс и малорасходных вентиляторов, что позволило определить оптимальные режимы эксплуатации агрегатов при проектировании системы терморегулирования спутников связи.
Разработанный комплекс программ использовался в задачах исследования закономерностей влияния параметров электротехнологических процессов предпосевной высокочастотной обработки семян пшеницы, валерианы лекарственной, клубней картофеля на показатели эффективности их развития и урожайность. Это позволило осуществить прогноз лабораторной всхожести и урожайности пшеницы сорта «Скала» от параметров электротехнологии (экспозиция нагрева семян, частота электромагнитного поля, период «обработка-посев») и нормы посева семенного материала на гектар площади, что позволило устранить систематическую погрешность традиционных полиномиальных моделей второго порядка и повысить точность аппроксимации искомой зависимости в 2 раза.
Применение комплекса программ непараметрических коллективов решающих правил при исследовании гемодинамических процессов сердечно-сосудистой системы организма человека в экологических условиях Севера позволяет в два раза повысить точность прогнозирования скоростей распространения пульсовой волны по мышечному и эластическому типу. На этой основе количественно подтверждена гипотеза об информативности скоростей распространения пульсовой волны и их динамики на состояние сердечно-сосудистой системы, уточнены критерии его оценивания.
Заключение
Впервые с единых теоретических позиций разработаны методы оптимального синтеза и анализа непараметрических моделей коллективного типа для решения задач восстановления стохастических зависимостей, распознавания образов, моделирования временных процессов, анализа множеств случайных величин и исследования статических систем с линейной структурой, которые обеспечивают эффективный учёт априорной информации. Фундаментальная значимость выполненных исследований заключается в создании нового научного направления, обобщающего традиционные непараметрические решающие правила на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций.
Сформулированная цель диссертации достигнута, получены следующие основные результаты и выводы:
1. Развиты теоретические основы построения непараметрических моделей коллективного типа в задачах восстановления многомерных стохастических зависимостей и распознавания образов, обеспечивающие повышение в (2-3) раза вычислительной эффективности их решения на основе более полного использования информации обучающих выборок и учёта аппроксимационных свойств элементов коллектива. Установлено слабое влияние вида упрощённых параметрических аппроксимаций на асимптотические свойства непараметрических коллективов, что обосновывает использование при их синтезе линейных полиномов. На этой основе предложены итерационная и комбинированная процедуры последовательного формирования упрощённых аппроксимаций, минимизирующих на каждом этапе относительную эмпирическую ошибку моделирования. Разработана оригинальная методика оценивания вклада аргументов в формирование значений восстанавливаемых зависимостей. Разработаны новые непараметрические модели временных процессов, основанные на методе двойного коллективного оценивания. Повышенные их аппроксимационные свойства достигаются за счёт увеличения количества упрощённых параметрических аппроксимаций временных процессов и учёта статистических оценок их показателей эффективности. Определены асимптотические свойства непараметрических моделей коллективного типа и их зависимость от количества и вида упрощённых аппроксимаций, объёма исходной информации. Установлено, что достоверное отличие средних значений коэффициентов при аргументах упрощённых аппроксимаций непараметрических моделей коллективного типа в обобщённой модели временного процесса, является критерием эффективного применения метода двойного коллективного оценивания. Разработаны новые модификации гибридных моделей, обеспечивающие комплексное использование априорных сведений о виде восстанавливаемой зависимости и информации обучающих выборок. Предлагаемые модели гарантируют преемственность результатов научных исследований и отличаются от известных принципами формирования и оценивания функции невязки - меры расхождения между экспериментальными данными и исходным представлением о виде исследуемой зависимости. Установлены условия их асимптотической сходимости. При относительно приближённых сведениях о виде искомой зависимости либо о её второй производной отмечается преимущество гибридных моделей над традиционными непараметрическими аппроксимациями. Для преодоления существующей неопределённости выбора гибридных моделей в конкретных условиях восстановления стохастических зависимостей разработаны их коллективы. Предложена методика количественного оценивания показателей эффективности гибридных моделей составляющих коллектив.
4. Гибридные модели стохастических зависимостей с учётом их частного описания позволяют наиболее полно использовать априорную информацию в условиях расширения возможностей системы контроля параметров изучаемых объектов. В подобных моделях сведения о виде восстанавливаемой зависимости и функция невязки с экспериментальными данными определяются в различных пространствах признаков. Если искомая зависимость представляется в аддитивном виде при данных наборах признаков, то существуют условия, когда изучаемые гибридные модели обладают свойствами асимптотической несмещённости и состоятельности.
5. Разработаны и исследованы нелинейные коллективы непараметрических регрессий, реализующие последовательные процедуры формирования решений. Определены зависимости условий асимптотической сходимости непараметрического коллектива от его параметров и объёма обучающей выбороки.
6. Исследованы асимптотические свойства непараметрической регрессии, содержащей в качестве аргумента параметрическую аппроксимацию. Подобные статистики являются модификацией модели статической системы с линейной структурой и основным фрагментом последовательной процедуры формирования многофакторных моделей. Для линейных параметрических аппроксимаций установлена асимптотическая сходимость модификации непараметрического коллектива, тем самым впервые аналитически обосновывается возможность частичного сокращения пространства признаков при формировании решений.
7. Сформировано новое научное направление моделирования неопределённых систем, когда условия формирования решений определяются множествами случайных величин. Идея предлагаемого подхода заключается в замене операций над множествами на менее трудоёмкие и хорошо разработанные операции над оценками функций распределения их элементов, преобразование которых осуществляется на основе проверки сложных статистических гипотез и методов непараметрической статистики. Разработаны оригинальные модели анализа множеств случайных величин в задачах восстановления стохастических зависимостей и распознавания образов, представляющие собой непараметрические коллективы статистических оценок плотностей вероятности элементов множеств. Установлены условия асимптотической несмещённости и состоятельности статистических оценок их показателей эффективности.
8. Развита методика восстановления стохастических зависимостей и распознавания образов в условиях больших выборок на основе их предварительной декомпозиции и последующего решения задач в пространстве параметров законов распределения элементов множеств случайных величин. При этом впервые построены толерантные границы непараметрических решающих функций на основе доверительного оценивания частот принадлежности точек исходной выборки множествам случайных величин.
9. Для широкого применения результатов научных исследований разработан пакет программ, в котором реализованы непараметрические модели коллективного типа для решения задач восстановления стохастических зависимостей, распознавания образов, моделирования временных процессов и анализа множеств случайных величин. Ориентация непараметрических коллективов на уровень априорной неопределённости обеспечивает адаптацию пакета программ при исследовании объектов различной природы. На его основе разработана информационная система анализа и прогнозирования динамики показателей преступности региона, которая прошла испытания на реальных данных. Пакет программ используется при оценивании показателей эффективности агрегатов системы терморегулирования спутников связи и исследовании электротехнологического процесса предпосевной обработки семян сельскохозяйственных культур. На его основе определены количественные закономерности гемодинамических процессов сердечнососудистой системы организма человека в экологических условиях Севера и уточнены критерии оценивания её состояния.
Библиография Лапко, Василий Александрович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Автоматизиция научных исследований в медицине (по данным популяционных обследований) / A.B. Лапко, Л.С. Поликарпов, В.Т. Манчук и др. Новосибирск: Наука, 1996. - 270с.
2. Айвазян, С.А. Прикладная статистика. Исследование зависимостей / С.А. Айвазян, И.С. Еников, Л.Д. Мешалкин. М.: Финансы и статистика, 1985.- 487с.
3. Алгоритмы и программы восстановления зависимостей / В.Н. Вапник, Т.Г. Глазкова и др. М.: Наука, 1984.- 815 с.
4. Андреев, H.A. Об одной модели консилиума / H.A. Андреев, Л.А. Растригин, Р.Х. Эренштейн // Адаптивные системы. Рига: Зинатне, 1972. -(Вып. 2.)-С. 16-25.
5. Архангельский, А.Я. Delphi 6: Справочное пособие / А.Я. Архангельский.- М.: ЗАО «Издательство БИНОМ», 2001. 1024с.
6. Байдак, И.Б. Современные системы идентификации дактилоскопических изображение / И.Б. Байдак // Информатизация правоохранительных систем: Материалы VI международной конференции / Под общей ред.
7. B.А. Минаева / Академия управления МВД России. Москва, 1997. - 4.2. -С.163-166.
8. Баженова, И.Ю. Delphi 6: Самоучитель программиста / И.Ю. Баженова. -М.: Кудиц-образ, 2002. 432с.
9. Белогуров, В.П. Критерий пригодности моделей для прогнозирования количественных процессов / В.П. Белогуров // Автоматика, 1990. № 3.1. C.23-28.
10. Бобровский, С. Delphi 6 и Kylix: Справочное пособие / С. Бобровский. -СПб: Питер, 2002. 560с.
11. Бокс, Дж. Анализ временных рядов. Прогноз и управление / Дж. Бокс, Г. Дженкинс. М.: Мир, 1974. - Вып. 1. - 286с.
12. Бусленко, Н.П. Метод статистических испытаний / Н.П. Бусленко, Ю.А. Шрейдер. М.: Государственное издательство физико-математической литературы, 1961.-228с.
13. Вапник, В.Н. Восстановление зависимостей по эмпирическим данным /
14. B.Н. Вапник М.: Наука, 1979. - 447с.
15. Вапник, В.Н. Теория распознавания образов / В.Н. Вапник, А .Я. Черновенкис. М.: Наука, 1974. - 414 с.
16. Варядченко, Т.В. Непараметрический метод обращения функции регрессии / Т.В. Варядченко, В.Я. Катковник //Стохастические системы управления. Новосибирск: Наука, 1979. - С.4-14.
17. Васильев, В.И. Конструирование пространств в процессе обучения распознаванию образов / В.И. Васильев // Автоматика. 1982,- №5. - С. 18-27.
18. Вицин, С.Е. Системный подход и преступность / С.Е. Вицин. М., 1980.1. C.45.
19. Войтенко, С.Г. Модель агрессивного виктимного поведения / С.Г. Войтенко //Информатизация правоохранительных систем: Материалы VI международной конференции / Под общей ред. В.А. Минаева / Академия управления МВД России. Москва, 1997. - 4.1. - С.237-240.
20. Востротина, A.C. Информационная система оценивания и прогнозирования динамики состояния здоровья населения / A.C. Востротина, Г.С. Высоцкая, A.B. Лапко, В.А. Лапко и др. // Проблемы разработки и внедрения информационных систем в здравоохранении и
21. ОМС: Труды межрегиональной конференции (19-21 декабря 2000, г. Красноярск) / ИВМ СО РАН. Красноярск, 2000. - С. 74-81.
22. Головченко, В.Б. Комбинирование моделей неопределённости / В.Б. Головченко. Новосибирск: Наука, 2002. - 190с.
23. Горяинов, В.Б. Математическая статистика: Учеб. пособие / В.Б. Горяинов, И.В. Павлов, Г.М. Цветкова и др. М.: МГТУ им. Н.Э. Баумана, 2001.-424с.
24. Горяинов, К.К. Криминологическая обстановка: Методологические аспекты / К.К. Горяинов. Москва, 1991. - С. 15.
25. Горелик, A.A. Методы распознавания / A.A. Горелик, В.А. Скрипник. -М.: Высш. шк., 1977. 222 с.
26. Гмурман, В.Е. Теория вероятностей и математическая статистика: Учеб. пособие / В.Е. Гмурман. М.: Высш. шк., 1999. - 479с.
27. Гноевой, A.A. Метод оценки основного голоса на фоне основного шума /
28. A.A. Гноевой, A.A. Коршунов // Информатизация правоохранительных систем: Материалы VI международной конференции / Под общей ред.
29. B.А. Минаева / Академия управления МВД России. — Москва, 1997. -4.2. С.135-137.
30. Демиденко, Е.З. Линейная и нелинейная регрессия / Е.З. Демиденко. -М.: Финансы и статистика, 1981. 302с.
31. Дервой, Л., Дьерфи Л. Непараметрическое оценивание плотности (Ц-подход) / Л. Дервой, Л. Дьерфи. М.: Мир, 1988. - 407с.
32. Дрейпер, Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. -М.: Финансы и статистика, 1987. 351с.
33. Дубровский, С.А. Прикладной многомерный статистический анализ / С.А. Дубровский. -М.: Финансы и статистика, 1982. 216 с.
34. Дуда, Р. Распознавание образов и сцен / Р. Дуда, П. Харт. М.: Мир,1976.- 511 с.
35. Дюран, Б. Кластерный анализ / Б. Дюран, П. Оделл. М.: Статистика,1977. 128 с.40. Ёлкина, В.Н. Математические методы агроинформатики / В.Н. Ёлкина, Н.Г. Загоруйко, Ю.А. Новосёлов. Новосибирск: ИМ СО РАН, 1987. -202с.
36. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности / В.А. Епаненчиков // Теория вероятности и ее применения, 1969. Т.14. - (Вып. 1). - С.156-161.
37. Живоглядов, В.П. Непараметрические алгоритмы адаптации / В.П. Живоглядов, A.B. Медведев. Фрунзе: Илим, 1974. - 134с.
38. Журавлёв, Ю.И. Избранные научные труды / Ю.И. Журавлёв. М.: Издательство Магистр, 1998. - 420 с.
39. Журавлёв, Ю.И. Класс коллективно-групповых решающих правил, основанных на дисперсионном критерии компетентности предикторов / Ю.И. Журавлёв, Н.Г. Загоруйко // Анализ данных и сигналов, Новосибирск, 1998. (Вып. 163). - С.82-90.
40. Заблоцкис, Н.Я. Информационно-методическое обеспечение анализа и прогнозирования преступности: Методические рекомендации / Н.Я. Заблоцкис, Г.А. Романов. М.: ВНИИ МВД России, 1994. - 64 с.
41. Загоруйко, Н.Г. Комбинированный метод принятия решений / Н.Г. Загоруйко // Вычислительные системы, Новосибирск. 1966. - (Вып.28). — С.22-31.
42. Загоруйко, Н.Г. Пакет прикладных программ ОТЭКС / Н.Г. Загоруйко, В.Н. Елкина, C.B. Емельянов, Г.С. Лбов. М. Финансы и статистика, 1986.- 160с.
43. Загоруйко, Н.Г. Прикладные методы анализа данных и знаний / Н.Г. Загоруйко. Новосибирск: ИМ СО РАН, 1999. - 270с.
44. Задонцева, Т.Н. Построение моделей управления отдельных подсистем исправительных учреждений / Т.Н. Задонцева // Информатизация правоохранительных систем: Материалы VIII Международной конференции. Москва, 1999. - С. 102-103.
45. Зубов, И.Н. Организация прогнозирования преступности в регионе и использование данных прогноза в подготовке управленческих решений / И.Н. Зубов, В.И. Селиверстов, A.JI. Ситковский, А.Д. Шестак. 2-е изд. -М.: МЦ при ГУК МВД России, 1998. 20с.
46. Ивахненко, А.Г. Непараметрический комбинаторный алгоритм МГУА на операторах поиска аналогов / А.Г. Ивахненко, В.А. Чаинская, H.A. Ивахненко // Автоматика, 1990. № 5. - С. 14-27.
47. Ивахненко, А.Г. Долгосрочное прогнозирование и управление сложными системами / А.Г. Ивахненко. Киев: Техника, 1975. - 372с.
48. Ивахненко, А.Г. Непараметрический комбинированный алгоритм МГУА на операторах поиска аналогов / А.Г. Ивахненко // Автоматика, 1990. -№5.-С. 14-27.
49. Ивахненко, А.Г. Самоорганизация прогнозирующих моделей / А.Г.
50. Ивахненко, Й.А. Мюллер. Киев: Техника, 1985. - 223с.
51. Иванченко, В.Н. Исследование алгоритмов идентификации сложных процессов с помощью моделирования на ЭВМ / В.Н. Иванченко, Н.Н. Лябах, А.Н. Гуда // Автоматика, 1992. № 3. - С. 82-88.
52. Искусственный интеллект и экспертные системы: Сборник научных трудов / Под общей ред. Н.Г. Загоруйко. Новосибирск: ИМ СО РАН, 1997. - 218с.
53. Калинина, Н.В. Математическая статистика: Учеб. Пособие / Н.В. Калинина, В.Ф. Панкин. М.: Высш. шк., 2001. - 336с.
54. Катковник, В.Я. Линейные оценки и стохастические задачи оптимизации. -М.:Наука, 1976. 188с.
55. Катковник, В.Я. Линейные и нелинейные методы непараметрического регрессионного анализа / В.Я. Катковник // Автоматика, 1979. №5. - С. 165-170.
56. Катковник, В.Я. Непараметрическая идентификация и сглаживание данных: Метод локальных аппроксимаций / В.Я. Катковник. М.: Наука, 1985.-336с.
57. Клейменов, М.П. Прогнозирование преступности: Лекция / М.П. Клейменов, А.Н. Харитонов. Омск: Юридический институт МВД России, 1995.-С.5.
58. Кочергов, Е.Г. Автоматизированная система прогнозирования психологических свойств личности по почерку / Е.Г. Кочергов, Ю.А. Станкевич, К.Е. Колотыгин // Информатизация правоохранительных систем: Материалы VI международной конференции. / Под общей ред.
59. B.А. Минаева / Академия управления МВД России. — Москва:, 1997. 4.2. — С.176-178.
60. Колмогоров, А.Н. Основные понятия теории вероятностей. М.: Наука, 1974.- 120с.
61. Косов, P.A. Непараметрические модели анализа интервальных данных / P.A. Косов, В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. Красноярск: НИИ ИПУ, 1999. -(Вып. 4).-С. 190-192.
62. Криминология: Учебник / Под общей ред. профессора Н.Ф. Кузнецовой, профессора Г.М. Миньковского. М.: Издательство БЕК, 1998.- 566 с.
63. Крившич, Д.В. Коллективы непараметрических моделей нестационарных временных зависимостей / Д.В. Крившич, C.B. Ченцов // Вестник Красноярского государственного технического университета. -Красноярск: КГТУ, 1996. (Вып. 5). - С. 90-94.
64. Лапко, A.B. Непараметрические алгоритмы автоматической классификации и их применение в задаче идентификации / A.B. Лапко // Адаптация и обучение в системах управления и принятия решений. -Новосибирск: Наука, 1987. С. 152-163.
65. Лапко, A.B. Имитационные модели пространственно распределённых экологических систем / A.B. Лапко, Н.В. Цугленок, Г.И. Цугленок. -Новосибирск: Наука, 1999 190 с.
66. Лапко, A.B. Обучающиеся системы обработки информации и принятия решений / A.B. Лапко, C.B. Ченцов, С.И. Крохов, Л.А. Фельдман. -Новосибирск: Наука, 1996 296с.
67. Лапко, В.А. Непараметрические модели статических объектов на основе методов коллективного оценивания / В.А. Лапко, C.B. Ченцов // Информатика и системы управления: Межвузовский сборник научных трудов. Красноярск: НИИ ИПУ, 1996. - (Вып. 1). - С.56-60.
68. Лапко, В.А. Асимптотические свойства непараметрических моделей коллективного типа / В.А. Лапко, C.B. Ченцов // Организационные модели управления территориальными энергосистемами: Межвузовский сборник научных трудов. Красноярск: КГТУ, 1997. - С.56-63.
69. Лапко, В.А. Имитационные модели распределённых систем / В.А. Лапко, C.B. Ченцов и др. // Организационные модели управления территориальными энергосистемами: Межвузовский сборник научных трудов. Красноярск: КГТУ, 1997. - С.179-188.
70. Лапко, В.А. Исследование асимптотических свойств непараметрических моделей коллективного типа / В.А. Лапко, C.B. Ченцов // Информатика исистемы управления: Межвузовский сборник научных трудов. -Красноярск: НИИ ИЛУ, 1997. (Вып. 2). - С.12-19.
71. Лапко, В.А. Непараметрические модели стохастических зависимостей коллективного типа / A.B. Лапко, C.B. Ченцов // Многоуровневые непараметрические системы принятия решений: Монография. Новосибирск: Наука, 1997. С.136-141.
72. Лапко, В.А. Непараметрические модели коллективного типа / В.А. Лапко // Материалы 3-го Сибирского конгресса по прикладной и индустриальной математике / ИМ СО РАН. Новосибирск, 1998.- С. 101.
73. Лапко, В.А. Оптимизация непараметрических аппроксимаций коллективного типа / В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. Красноярск: НИИ ИЛУ, 1998. -(Вып. 3).-С.84-91.
74. Лапко, A.B. Непараметрические модели распознавания образов в условиях малых выборок / A.B. Лапко, В.А. Лапко, C.B. Ченцов // Автометрия, 1999. №6. - С. 105-113.
75. Лапко, A.B. Непараметрические системы классификации / A.B. Лапко, В.А. Лапко, М.И. Соколов, C.B. Ченцов. Новосибирск: Наука, 2000. -240с.
76. Лапко, В.А. Оптимальный синтез и анализ непараметрических моделей распознавания образов коллективного типа / В.А. Лапко // Труды 4-го Сибирского конгресса по прикладной и индустриальной математике / ИМ СО РАН. Новосибирск, 2000. - С. 93-94.
77. Лапко, A.B. Непараметрические модели коллективного типа / A.B. Лапко, В.А. Лапко, М.И. Соколов, C.B. Ченцов. Новосибирск: Наука, 2000.- 144с.
78. Лапко, A.B. Гибридные модели стохастических зависимостей, основанные на МГУА / A.B. Лапко, Ю.Ю. Якунин // Информатика и системы управления: Межвузовский сборник научных трудов. -Красноярск: НИИ ИЛУ, 2002. (Вып. 7). - С. 44 - 46.
79. Лапко, A.B. Непараметрические модели анализа множеств случайных величин / A.B. Лапко, В.А. Лапко, P.A. Косов // Информатика и системы управления: Межвузовский сборник научных трудов. Красноярск: НИИ ИЛУ, 2002. - (Вып. 7). - С. 64 - 69.
80. Лапко, В.А. Непараметрические модели коллективного типа / В.А. Лапко // Идентификация систем и задачи управления: Труды международной конференции (26-28 сентября 2000, Москва) / ИЛУ РАН. Москва, 2000. -С. 635-641.
81. Лапко, В.А. Непараметрические методы обработки информации: Учеб. пособие / В.А. Лапко, М.И. Соколов. Красноярск: КГТУ, 2001. - 116с.
82. Лапко, В.А. Синтез и анализ непараметрических моделей коллективного типа / В.А. Лапко // Автометрия, 2001. №6. - С.98-106.
83. Лапко, В.А. Непараметрические модели временных зависимостей, основанные на методе двойного коллективного оценивания / В.А. Лапко // Автометрия, 2002. №1. - С.42-50.
84. Лапко В.А. Непараметрические системы распознавания образов коллективного типа в условиях «неидеального учителя» / В.А. Лапко // Информатика и системы управления: Межвузовский сборник научных трудов. Красноярск: НИИ ИЛУ, 2002. - (Вып. 7). - С. 58 - 63.
85. Лапко, В.А. Модификации непараметрических моделей временных зависимостей коллективного типа / В.А. Лапко, К.Ю. Гуревич // Информатика и системы управления: Межвузовский сборник научных трудов. Красноярск: НИИ ИЛУ, 2002. - (Вып. 7). - С. 52 - 57.
86. Лапко, A.B. Гибридные модели стохастических зависимостей / A.B. Лапко, В.А. Лапко // Автометрия, 2002. №5. - С.38-48.
87. Лапко, В.А. Непараметрические коллективы решающих правил / В.А. Лапко. Новосибирск: Наука, 2002. - 168с.
88. Лапко, A.B. Непараметрические методики анализа множеств случайных величин / A.B. Лапко, В.А. Лапко // Автометрия, 2003. №1. - С.54-61.
89. Лапко, В.А. Гибридные модели стохастических зависимостей в условиях частного описания / В.А. Лапко, Г.И. Цугленок // Вестник КрасГАУ, 2003. №2. - С.67-72.
90. Лапко A.B. Непараметрические коллективы в задаче прогнозирования эффективных режимов электротехнических процессов / A.B. Лапко, В.А. Лапко, Г.И. Цугленок // Вестник КрасГАУ, 2003. №2. - С.74-78.
91. Лапко, В.А. Синтез и анализ гибридных моделей стохастических зависимостей в условиях наличия их частного описания / В.А. Лапко // Автометрия, 2004. №1. - С.51-59.
92. Лапко, В.А. Статистические модели электротехнических изделий и процессов с учётом их частичного описания / В.А. Лапко, М.И. Соколов, Г.И. Цугленок // Вестник КрасГАУ, 2004. №3. - С.267-270.
93. Лапко, В.А. Модификации непараметрических моделей коллективного типа в задачах восстановления временных процессов / В.А. Лапко, В.В. Молоков, A.A. Лапко // Вестник КрасГАУ, 2004. №3. - С.44-50.
94. Лапко, В.В. Непараметрические модели прогнозирования показателей преступности региона / В.В. Лапко, В.В. Молоков // Информатика и системы управления: Межвузовский сборник научных трудов. -Красноярск: НИИ ИЛУ, 1999. (Вып. 4). - С. 73-76.
95. Лбов, Г.С. Методы обработки разнотипных экспериментальных данных / Г.С. Лбов. Новосибирск: Наука, 1981. - 160с.
96. Лубин, А.Ф. Автоматизированная оценка оперативной обстановки / А.Ф. Лубин, C.B. Крыгин // Информатизация правоохранительных систем: Материалы VI международной конференции / Под общей ред.
97. В.А. Минаева / Академия управления МВД России. — Москва, 1997. —4.1. — С.165-167.
98. Мазуров Вл.Д. Метод комитетов в задачах оптимизации и классификации. — М.: Наука, 1990. 248с.
99. Медведев, A.B. Непараметрические системы адаптации / A.B. Медведев. Новосибирск: Наука, 1983. - 174 с.
100. Моисеев, H.H. Универсальный эволюционизм: (Позиция и следствие) / H.H. Моисеев // Вопросы философии, 1991. №3. - С.24-25.
101. Надарая, Э.А. Непараметрические оценки кривой регрессии / Э.А. Надарая // Тр. ВЦ АН ГССР, 1965. (Вып.5). - С. 56-68.
102. Нильсон, М. Обучающиеся машины / М. Нильсон. М.: Мир, 1967.
103. Патрик, Э. Основы теории распознавания образов / Э. Патрик. М.: Сов. радио, 1980.
104. Поликарпов, JI.C. Гемодинамический анализ кровообращения у жителей Крайнего Севера / JI.C. Поликарпов // Экстремальная физиология и индивидуальные средства защиты. М., 1986.- С. 158-159.
105. Поликарпов, JI.C. Особенности клинического течения гипертонической болезни в экологических условиях Крайнего Севера / Л.С. Поликарпов // Актуальные проблемы кардиологии Севера и Сибири. Красноярск, 1991. -С. 93.
106. Поликарпов, Л.С. Критерии отбора лиц для проживания на Крайнем Севере как первичная профилактика сердечно-сосудистых заболеваний: Методические рекомендации / Л.С. Поликарпов, С.Р. Кузнецов. -Красноярск, 1994.- 94 с.
107. Расстригин, Л.А. Методология решения задач обнаружения закономерностей и прикладная гносенология / Л.А. Расстригин // Машинные методы обнаружения закономерностей. Новосибирск: Ин-т математики СО АН СССР, 1981.- С. 14-16.
108. Расстригин, Л.А. Адаптация сложных систем / Л.А. Расстригин. Рига: Зинатне, 1981.-375 с.
109. Растригин, Л.А. Гибридное распознавание / Л.А. Растригин // Автоматика и телемеханика, 1993. № 4. -С.3-20.
110. Растригин, Л.А. Метод коллективного распознавания / Л.А. Растригин,
111. Р.Х. Эренштейн. M.: Энергоиздат, 1981.
112. Райзин, Дж. Вэн Простой гистограммный метод для непараметрической классификации / Дж. Вэн Райзин, Чи Пи Йонг. // Классификация и кластер. М., 1980. - С. 328-351.
113. Райбман, Н.С. Идентификация технологических объектов методами кусочной аппроксимации / Н.С. Райбман, A.A. Дрофеюк и др. М.: 1977. -70с.
114. Розенблатт, Ф. Принципы нейродинамики / Ф. Розенблатт. М.: Мир, 1965.
115. Рубан, А.И. Идентификация стохастических объектов на основе непараметрического подхода / А.И. Рубан // Автоматика и телемеханика, 1979.-№11.-С. 106-118.
116. Рубан, А.И. Методы анализа данных: Учеб. пособие / А.И. Рубан. -Красноярск: КГТУ, 1994. 4.1. - 220с.
117. Красноярск: КрасГАУ, 2003. -№1,- С.60-64.
118. Солодовников, A.C. Теория вероятностей: Учеб пособие / A.C. Солодовников. М.: Вербум-М, 1999. - 208с.
119. Стечкин, С.Б. Сплайны в вычислительной математике / С.Б. Стечкин, Ю.Н. Субботин. М.: Наука, 1976. - 248с.
120. Титов, B.C. Основы теории распознавания образов: Учеб. пособие / C.B. Дегтярёв, Е.И. Духнич, H.A. Кореневский, B.C. Титов и др. Курск: Курск. ГТУ, 1999. -136с.
121. Ту, Дж. Принципы распознавания образов / Дж Ту, Р. Гонсалес. М.: Мир, 1978.-411 с.
122. Фукунаги, К. Введение в статическую теорию распознавания образов / К. Фукунаги. -М.: Наука, 1979.- 367 с.
123. Хардле, В. Прикладная непараметрическая регрессия / Хардле В. М.: Мир, 1993.- 349 с.
124. Хаснулин, В.И. Космические тайны вашего самочувствия / В.И. Хаснулин. Новосибирск: Наука, 1992.- 176 с.
125. Цикличность в социальных системах («круглый стол») // Социологические исследования, 1992.- №6. С.36-46.
126. Цугленок, Г.И. Методология и теория системы исследования электротехнических процессов / Г.И. Цугленок. Красноярск: КрасГАУ, 2003.- 193с.
127. Цыпкин, Я.З. Основы теории обучающихся систем / Я.З. Цыпкин. М.: Наука, 1970. - 280 с.
128. Шаракшанэ, A.C. Сложные системы / A.C. Шаракшанэ, И.Г. Железнов, В.А. Ивницкий. М.: Высш. шк., 1977. - 247с.
129. Щедрин, Н.В. Анализ и прогноз преступности в г. Красноярске на основе пространственной картографической информации / Н.В. Щедрин,
130. А.Н. Рогалев, Е.П. Москвин // Проблемы информатизации региона: Труды 4-ой Всероссийской конференции / Под общей ред. В.И. Быкова / ЗАО «Диалог Сибирь НТ». - Красноярск, 1998. - С. 265-267.
131. Юраж, В.Я. Метеотропная реакция при гипертонической болезни и коронарном атеросклерозе в связи с воздушными фронтами и гелиофизическими факторами / В.Я. Юраж // Климат и сердечнососудистая система. Л., 1965. - С. 75-83.
132. Brieman, L. Estimating optimal transformations for multiple regression and correlation / L. Brieman, J. Friedman // Journal of the American Statistical Association, 1985. Vol. 80. - pp. 580-619.
133. Diaconis, P. On nonlinear function of linear combinations / P. Diaconis, M. Shahshahani // SIAM J. Sei. Statist. Computing, 1984.- Vol. 5.- pp. 175-191.
134. Friedman, J. Projection pursuit regression / J. Friedman, W. Stuetzle // Journal of the American Statistical Association, 1981. Vol. 76. - pp. 817-823.
135. Gordon, L. Consistent nonparametric regression from recursive partitioning schemes / L. Gordon, R.A. Olshen // Journal of Multivariate Analysis, 1980.1. Vol. 10.-P.611-627.
136. Lapko, A.V. Nonparametric Models Of Pattern Recognition Under Conditions Of Small Samples / A.V. Lapko, V.A. Lapko, S.V. Chentsov // Optoelectronics, Instrumentation And Data Processing, 1999. №6. - pp. 8390.
137. Lapko, A.V. Nonparametric algorithms and classification systems / A.V. Lapko, V.A. Lapko, S.V. Chentsov // Pattern recognition and image analysis,2000. Vol. 10. - № 1. - pp. 31 -42.
138. Lapko, A.V. Synthesis And Analysis Nonparametric Algorithms Of Pattern Recognition When Samples Are Large / A.V. Lapko, V.A. Lapko, S.V. Chentsov // Pattern recognition and image analysis, 2001. Vol. 11. - №1. -pp. 53-55.
139. Lapko, V.A. Synthesis And Analysis Of Nonparametric Collective-Type Models / V.A. Lapko // Optoelectronics, Instrumentation And Data Processing,2001.-№6.-pp. 83-90.
140. Lapko, V.A. Nonparametric Models of Pattern Recognition of Collective Type / V.A. Lapko // Pattern recognition and image analysis, 2002. Vol. 12. -№4.-pp. 354-361.
141. Lapko, V.A. Nonparametric Models Of Time Dependences Based On Double Collective Estimation / V.A. Lapko // Optoelectronics, Instrumentation And Data Processing, 2002. №1. - pp. 37-44.
142. Lapko, A.V. Hybrid Models Of Stochastic Dependences / A.V. Lapko, V.A. Lapko // Optoelectronics, Instrumentation And Data Processing, 2002. №5. -pp. 33-42.
143. Leontief, W. A note on the interrelation of subsets of independent variables of a continuons function with continuous first derivatives / W. Leontief // Bulletin of the American Mathematical Society, 1947. Vol. 53.- pp. 343-350.
144. Parzen, E. On estimation of a probability density / E. Parzen // Ann. Math. Statistic, 1969. pp. 1038-1050.
145. Rolinson, P.M. Asymptotically eficient estimation in the presence of heteroskedasticity of unknown from / P.M. Rolinson // Econometrica, 1987.-Vol. 55.-pp. 875-891.
146. Speckman, P. Kernel smoothing in partial linear models / P. Speckman // Journal of the Royal Statistical Society, 1988. Series B. - Vol. 50.- pp. 413446.
-
Похожие работы
- Многоуровневые непараметрические системы распознавания образов на основе декомпозиции обучающей выборки по ее размерности
- Непараметрические модели коллективного типа в задачах восстановления стохастических зависимостей
- Многоуровневая непараметрическая система обработки информации
- Непараметрические модели нестационарных временных зависимостей в условиях малых выборок
- Синтез и анализ непараметрических моделей стохастических зависимостей и распознавания образов в условиях малых выборок
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность