автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Идентификация состояний многомерных объектов на основе адаптивных моделей нечеткого логического вывода

кандидата технических наук
Матасов, Андрей Сергеевич
город
Воронеж
год
2004
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Идентификация состояний многомерных объектов на основе адаптивных моделей нечеткого логического вывода»

Автореферат диссертации по теме "Идентификация состояний многомерных объектов на основе адаптивных моделей нечеткого логического вывода"

На правах рукописи

МАТ АСОВ Андрей Сергеевич

ИДЕНТИФИКАЦИЯ СОСТОЯНИЙ МНОГОМЕРНЫХ ОБЪЕКТОВ НА ОСНОВЕ АДАПТИВНЫХ МОДЕЛЕЙ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА

Специальность 05.13.18 - Математическое моделирование, численные

методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Воронеж 2004

Работа выполнена в Воронежском государственном техническом университете

Научный руководитель

Заслуженный деятель науки РФ, доктор технических наук, профессор Подвальный Семен Леонидович

Официальные оппоненты:

доктор технических наук, профессор Юрасов Владислав Георгиевич;

кандидат технических наук Жданов Алексей Алексеевич

Ведущая организация -

Липецкий государственный технический университет

Защита состоится 4 ноября 2004 г. в Ю00 часов в конференц-зале на заседании диссертационного совета Д 212.037.01 Воронежского государственного технического университета по адресу: 394026,1. Воронеж, Московский просп., 14.

С диссертацией можно ознакомиться в библиотеке Воронежскою государственного технического университета.

Автореферат разослан «_»_сентября 2004 г.

Ученый секретарь диссертационного совета

^Г^М»^-^ Пиголин В.М.

2005-4 13011

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Активное использование современных информационных технологий для создания математических основ интеллектуальных систем в последние годы позволило по-новому взглянуть на проблему обработки многомерных данных в условиях неполной и неточной информации. Одной из наиболее актуальных задач в этой сфере является задача идентификации объектов - отнесение некоторого объекта, заданного набором параметров, к классу подобных объектов. Классические методы многомерной статистики, используемые в подобных задачах, основаны на определенных предположениях о структуре исходных данных, и, как следствие, попытки их применения приводили к высоким процентам ошибок при условии несоответствия обучающих наборов этим предположениям. Наиболее перспективным направлением при решении данной задачи является использование универсальных аппроксиматоров широкого класса многомерных нелинейных функций - адаптивных моделей нечеткого логического вывода. Они представляют собой дальнейшее развитие нечетких экспертных систем, исследованиям которых посвящены работы Л.А. Заде, А. Кофмана, Д.А. Поспелова, А.Н. Борисова, Е.А. Мамдани и др. Основная трудность их использования заключается в структурной и параметрической адаптации — поиске оптимального набора параметров термов лингвистических переменных, структуры множества правил логического вывода. Для ее решения обычно привлекаются эксперты в соответствующих областях знаний. Параметры адаптивной модели нечеткого логического вывода формируются путем их оптимизации в смысле некоторого критерия, формируемого по данным из обучающей выборки. Исследованиям отдельных элементов таких систем посвящены работы В.В. Круглова, А.П. Ротштейна, С.Д. Штовбы, Т. Фукуда и др. Однако в настоящий момент отсутствуют общепризнанные методы применения адаптивных моделей нечеткого вывода для идентификации многомерных объектов, отсутствуют методы их обучения в рамках этой задачи. Кроме того, несмотря на постоянное совершенствование средств хранения информации и увеличение объемов носителей проблема сжатия множества правил в базе знаний модели по-прежнему является актуальной.

Одним из путей решения перечисленных проблем является развитие моделей нечеткого вывода, методов структурной и параметрической оптимизации, алгоритмов сжатия базы знаний, оценки эффективности алгоритмических реализаций моделей.

Диссертационная работа выполнена в рамках тематики госбюджетной НИР ГБ01-04 «Разработка информационно-вычислительных систем непромышленного назначения».

Цель и задачи исследования. Целью работы является разработка моделей, численных методов и алгоритмов идентификации многомерных объектов на базе множества нечетких логических правил для повышения эффективности решения задачи идентификации, создание на.их-обнове средств

РОС. НАЦИОНАЛЬНАЯ , БИБЛИОТЕКА \ С. Петер' 09 *»<

специального математического и программного обеспечения, апробация моделей и методов.

Для достижения поставленных целей необходимо решить следующие задачи:

1. Провести анализ различных подходов к решению задачи идентификации состояний многомерных объектов.

2. Разработать модели идентификации многомерных объектов, базирующейся на аппарате нечеткой логики, и методы их структурной и параметрической оптимизации. Разработать методы построения набора правил из экспериментальных данных.

3. Реализовать на ЭВМ модели идентификации объектов и алгоритмы их оптимизации для применения моделей в прикладных программах.

4. Провести теоретический анализ эффективности предложенных методов идентификации при различных тестовых выборках, отличающихся начальными условиями и параметрами.

5. Осуществить практическую апробацию прикладных разработок применительно к задачам медицинской диагностики (идентификация состояния при диагностике урологических заболеваний).

Методы исследования. В ходе исследования использовались методы теории математического моделирования, нечеткая логика и нечеткие множества, теории оптимизации, эволюционного моделирования, системного анализа и принятия решений, математической статистики.

Научная новизна. В работе получены следующие результаты, характеризующиеся научной новизной:

- предложена структура адаптивной нечеткой модели идентификации многомерных объектов, отличающаяся возможностью автоматизации процесса формирования базы нечетких логических правил;

- разработан комбинированный алгоритм адаптивного построения множества нечетких правил модели, отличающийся использованием информации из обучающих выборок, что позволяет редуцировать множество правил;

- разработан алгоритм кодирования и оптимизации параметров модели на основе генетического аппарата, отличающиеся возможностью применения генетических алгоритмов оптимизации без дополнительных ограничений на пределы изменения параметров модели;

- разработан набор тестовых процедур для исследования адаптивных нечетких моделей идентификации, отличающийся возможностью исследования моделей при наличии множества классов объектов, описываемых одним и тем же набором признаков, и позволяющий получать числовые характеристики качества идентификации при различных параметрах модели и начальных условиях.

Практическая значимость работы. Проведенные теоретические и экспериментальные исследования позволили:

1. Разработан набор инвариантных алгоритмических модулей, в которых реализованы все компоненты адаптивной нечеткой системы

идентификации, позволяющий осуществить интеграцию разработанных алгоритмов в различные пакеты обработки данных.

2. Разработан унифицированный программный комплекс на базе адаптивной нечеткой модели идентификации, обеспечивающий информационную и алгоритмическую поддержку процесса исследования многомерных объектов.

3. Создана система автоматизации процесса медицинских исследований для сбора и обработки данных, а также проведения первичной диагностики заболеваний без привлечения высококвалифицированного персонала.

Выводы и научные положения, изложенные в диссертации, служат базой для создания различных программных комплексов идентификации многомерных объектов в различных системах промышленного и непромышленного назначения.

Реализация результатов работы. Теоретические и практические результаты работы реализованы в специальном программном комплексе исследования многомерных данных и анализа моделей многомерной идентификации, положенном в основу программного обеспечения «Анализ и идентификация многомерных данных», который внедрен в практическую деятельность дорожной поликлиники ЮВЖД (г. Воронеж).

Материалы диссертации, а также разработанное программное обеспечение используются в учебном процессе Воронежского государственного технического университета при обучении студентов специальности 230100 в дисциплинах «Системы искусственного интеллекта» и «Теория принятия решений».

Апробация работы. Основные положения диссертации докладывались и обсуждались на Международной открытой научной конференции «Математические методы в технике и технологиях - ММТТ-17» (Кострома, 2004), международной научно-технической конференции и Российской научной школе молодых ученых и специалистов "Системные проблемы качества, математического моделирования, информационных, электронных и лазерных технологий" (Сочи, 2002), V-VI Республиканских научных конференциях "Современные проблемы информатизации" (Воронеж, 2000-2003), а также на научных семинарах кафедры ABC ВГТУ (Воронеж, 2001-2004).

Публикации. По результатам исследований опубликовано 16 печатных работ, в том числе 7 без соавторов. В работах, опубликованных в соавторстве и приведенных в конце диссертации, лично соискателем предложены: в [2, 3] - основные принципы использования нечетких моделей для дискретной идентификации многомерных объектов, в [7, 10] - методы построения базы знаний на основе экспертной информации, в [1, 4] - методы редукции множества правил нечеткого вывода.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, двух приложений, изложена на 124 листах, содержит список литературы из 110 наименований, 45 рисунков, 14 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность работы, определены цели и задачи исследования, их научная новизна и практическая значимость, приведены сведения об апробации и внедрении результатов работы.

В первой главе вводится понятие образа как многомерного объекта, сформулирована общая постановка задачи идентификации многомерных объектов и рассмотрена проблема обучения распознаванию образов. Проведен анализ различных подходов к решению задачи идентификации - на основе дискриминантного анализа, кластерного анализа, метода максимального правдоподобия, коллективов нечетких правил.

Для задачи идентификации многомерных объектов в той или иной мере могут быть использованы все перечисленные методы. Однако каждый из них обладает своими характерными недостатками. Классические статистические методы строят линейные разделяющие поверхности, что во многих случаях недостаточно для успешной идентификации. Классификатор на основе метода максимального правдоподобия способен строить нелинейную разделяющую поверхность второго порядка, но, к сожалению, он основан на предположении о нормальности распределения объектов в обучающей выборке.

Являясь универсальными аппроксиматорами, нечеткие адаптивные системы логического вывода лишены перечисленных недостатков. Они представляются наиболее перспективными в задачах идентификации объектов. Однако, являясь системами с большим количеством параметров, они требуют реализации эффективных алгоритмов оптимизации. Кроме того, актуальным является вопрос метода редукции множества правил при условии их избыточности, возникающей при динамическом изменении набора правил вследствие обучения системы. При этом потеря количественной информации о структуре исходных данных должна быть компенсирована за счет элементов нечеткой системы вывода с целью повышения качества классификации.

Таким образом, на основании проведенного анализа нечетких систем логического вывода формулируются задачи диссертационного исследования.

Вторая глава посвящена синтезу структуры адаптивной модели идентификации многомерных объектов, а также разработке алгоритмов параметрической и структурной оптимизации.

Адаптивная нечеткая модель имеет смешанную структуру (рис. 1). Нечеткие правила хранятся в базе правил, а нечеткие множества, описывающие правила в виде функций принадлежности (ФП) - в базе данных. Вместе они образуют базу знаний нечеткой модели. На вход модели подается вектор переменных X, и после проведения операций фазификации и логического вывода на выходе системы генерируется вектор Н. Анализ составляющих выходного вектора позволяет сделать заключение о принадлежности анализируемого объекта к одному из классов эталонных объектов. Обучающий алгоритм на основе экспериментальных данных настраивает базу знаний, оптимизируя вектор параметров нечеткой модели.

Рис. 1. Структура адаптивной нечеткой модели идентификации многомерных объектов

Множество правил, используемое в модели, включает правила типа 8и§епо нулевого порядка:

г^ : если (х, есть а„( V™", у™]) и ... и (х„ есть ^(у™,у™))то уц есть Ь; гД : если (х, есть а12( V™",и ... и (хп есть ап2(у™;', V™")) то уц есть к2;

гД : если (х, есть а,2(<'2п,у™]) и ... и (х„ есть а„2(у™,V™*))то уц есть к3;

(1)

г^ : если (х, есть а,,(у™, V™]) и ... и (х„ есть ап)(у^, V™*)) то у^ есть к3; Го,„: если (х, есть а12(у™",у™]) и ... и (хп есть ап2(у^, у™)) то уп> есть к3:

г^ : если (х, есть у™]) и ... и (х„есть V™, у™ )) то уп_ есть к„

где А, = { а } - терм-множество значений лингвистической переменной ¡.

Обучающая выборка представляет собой множество эталонных объектов {со,}, ¡=1,к, на этом множестве имеется разбиение на конечное число подмножеств (классов) , к =],ш.

Разбиение задается путем выделения подмножеств объектов, однознач-

5

но относящихся к классу <Г2к. Объекты задаются значениями некоторых признаков j = ],N (этот набор всегда один и тот же для всех объектов, рассматриваемых при решении задачи). Совокупность значений признаков xJопределяет описание объекта 1(ю) = {х,,х2,...,хк}.

Основными недостатками классических нечетких систем логического вывода являются:

- исходный набор правил, описывающих все возможные состояния системы, формулируется человеком, как следствие - такой набор может быть неполным или, наоборот, избыточным, может содержать противоречивые правила;

- количество, форма и параметры функций принадлежности зачастую задаются экспертом субъективно. При наличии большого количества однообразной информации адекватно задать перечисленные характеристики модели очень сложно, что также может вести к снижению качества идентификации.

Необходимость устранения вышеуказанных недостатков привела к использованию алгоритмов параметрической и структурной адаптации нечеткой системы. Под параметрической оптимизацией будем понимать процесс поиска такого набора параметров лингвистических термов, при использовании которого система способна наиболее достоверно идентифицировать объекты. Для оценки достоверности идентификации необходимо сравнить экспертную идентификацию объектов из некоторого тестового набора с результатом идентификации, полученных при использовании модели. При отсутствии тестовой выборки ее может заменить обучающая выборка. При этом появляется возможность оценки устойчивости модели идентификации путем применения алгоритма плавающего экзамена.

Алгоритм структурной адаптации представляет собой итерационную процедуру построения множества правил нечеткого вывода. Исходной информацией для этой процедуры также является обучающая выборка. Как видно из (1), все множество правил разбито на группы, количество которых равно количеству классов объектов. Количество правил в разных группах может быть различно.

Очевидно, что для объекта со, из обучающего множества результат вычисления степени принадлежности к нечеткому множеству, описываемому порождаемым им правилом, должен быть максимальным среди прочих возможных правил, построенных на смежных комбинациях термов. Исходя из этого при построении правила, соответствующего объекту ш,, будем искать такой набор термов, при которых предпосылки правила принимают максимальные значения. То есть производится поиск таких аи, функция принадлежности которых принимает максимальное значение при заданном четком значении параметра среди прочих термов данной переменной

^а (х,)->тах, ¿ = . (2)

Такой поиск может быть произведен путем перебора значений |!а (х,)).

Однако рациональнее воспользоваться интервальным поиском соответствующего терма. Несложно заметить, что при правильном задании терм-множества лингвистической переменной термы покрывают всю шкалу базового множества. Можно выделить точки шкалы, в которых функции принадлежности принимают равные значения. Такие точки назовем границами термов. Если соблюдается условие полного покрытия, то только одна функция принадлежности внутри границ принимает максимальное значение. Таким образом, процедуру поиска терма, соответствующего значению признака, можно свести к поиску интервала, в который попадает значение параметра объекта. На рис. 2 приведен пример с использованием трапециевидной функции принадлежности.

Рис. 2. Геометрическая интерпретация процедуры выбора терма

Использование интервального поиска термов в итерационной процедуре оптимизации приводит к необходимости применения параметрической формы функций принадлежности. На рис. 3 приведен пример параметризации экспоненциальной функции принадлежности. Функция принадлежности задается выражением (4).

' (х-а)2

ц(х,а,Ь) = е1 " ^ (3)

Выразим функцию принадлежности через а, 3,, р

2'

Ца/?^'^?

ц(х,аД,р2) = е ^ Ь-Ь > . (4)

Использование интервального задания ФП позволит оптимизировать модель путем изменения точек взаимного пересечения смежных ФП. В этом случае отсутствует необходимость контроля порядка термов. Процесс формирования параметров выбранных функций лингвистических термов можно автоматизировать путем использования эволюционных процедур оптимизации.

Рис. 3. Экспоненциальная функция принадлежности и ее параметризация

Для выполнения ограничения на порядок следования термов в хромосому кодировались не абсолютные, а относительные значения параметров нечеткой модели в виде разности между ближайшими точками на оси X, которые и являются параметрами функций принадлежности (рис. 4). Будем искать параметры термов на каждом этапе оптимизации через изменение их границ с учетом заданного уровня а Отметим, что все параметры являются при этом вещественными.

Рис. 4. Кодирование параметров термов лингвистических переменных модели

При наличии большого числа объектов в обучающей выборке возможна ситуация, при которой два объекта будут порождать одно и тоже правило Однозначное исключение сходных правил в таких условиях привело бы к потере части информации о плотности размещения объектов в локальных областях многомерного пространства. Поэтому был предложен метод редукции множества правил. Основная процедура этого метода объединена с процедурой идентификации коэффициентов правых частей правил (рис. 5). В таком комбинированном варианте алгоритма коэффициенты трактуются как вероятность появления в обучающей выборке объекта, порождающего данное правило.

2-- -

Формирование множества лингвистических переменных, термов и их параметров

4---±-

Выбор из базы данных вектора X, параметров наблюдения 1

5--

Для каждого значения признака х^ производится поиск терма а,,, соответствующею значению в смысле интервального критерия

6-- -

Из множества найденных термов формируется правило г„, значение коэффициента С = 1

7--

Производится поиск правила гс=г,у в множестве Я правил нечеткой базы знаний

Удаление из системы правила IV, Увеличение коэффициента к,, - Г ' 1

I

Добавление в базу знаний нового правила г,у

-11-

Нормирование коэффициентов кн

с!:

Конец

3

Рис. 5. Комбинированный алгоритм адаптивного построения множества

нечетких правил

Таким образом, происходит одновременная идентификация коэффициентов кг, правых частей правил и редукция множества правил без потери информации о статистическом распределении объектов в многомерном пространстве признаков. В силу того, что значения принадлежности должны

находиться в интервале [0,1], окончательное значение к коэффициентов правых частей правил нормируется по правилу (5).

Обозначим через К - вектор коэффициентов правых частей правил, в -вектор границ лингвистических термов. Тогда настройка нечеткой модели типа Б^егю нулевого порядка сводится к следующей задаче нелинейной оптимизации: найти вектор (К,в), минимизирующий функционал вида (для случая с одной выходной переменной у)

где Н(К,С,Х^ - значение выхода нечеткой модели при значении входов, заданных вектором Х = (х,,х2,...,хт), вектор в - границы термов, вектор К -коэффициенты правых частей правил, у! - значение экспертной идентификации состояний объекта при заданных значениях параметров.

При этом применение параметрической формы задания термов, в которой в качестве параметров выступают границы термов, гарантирует линейную упорядоченность элементов терм-множеств и ограничения на пределы изменения переменных модели.

Комбинированный алгоритм Обобщенный алгоритм обучения адаптивной нечеткой модели логического вывода, как видно из рис. 6, представляет собой итерационную процедуру, в которой организовано взаимодействие процедур параметрической и структурной адаптации. Рассмотрим отдельные этапы обобщенного алгоритма обучения.

На подготовительном этапе (блок 2) у пользователя запрашивается информация о параметрах предполагаемой системы - вид функций принадлежности термов и количество термов лингвистических переменных. На этом же этапе производится формирование множества лингвистических переменных и терм-множества каждой переменной. Далее на этапе генерации начальной популяции (блок 3) формируются N наборов параметров функций принадлежности термов лингвистических переменных. Следующий цикл представляет собой эпохи генетического алгоритма (М - количество эпох). На каждой из них происходит модификация каждой популяции в соответствии с выбранной схемой применения генетических операторов (блок 5), формирование базы правил и вычисление коэффициентов левых частей правил (блок 6), вычисление приспособленности каждого экземпляра (блок 7) и ранжирование экземпляров по степени приспособленности в популяции (блок 8) Алгоритм итерационно повторяется заданное число раз. В конце из полученной популяции выбирается наиболее приспособленный экземпляр (блок 9), который является результатом оптимизации.

(5)

=> ГП1П ,

(6)

Рис. 6. Алгоритм оптимизации параметров модели

В третьей главе рассмотрены вопросы оценки качества системы идентификации, приведено описание программного комплекса исследования систем нечеткой идентификации и результаты тестовых экспериментов.

Для оценки качества идентификации были использованы количественные и качественные оценки. В качестве количественной оценки выступала доля неверно классифицированных объектов обучающей выборки. В качестве функции ошибки выступает усредненная среднеквадратическая ошибка по всем значениям вектора принадлежности, вычисленная на объектах обучающей выборки.

ё(Н) =-И-, (7)

2Т4

где Ь, - значения вектора принадлежности Н, N - количество классов объектов, длина вектора Н, р — номер класса, к которому отнесен объект экспертом.

Такие оценки формируются по всем объектам из обучающей выборки, тогда в качестве оценки качества всей системы примем среднюю ошибку классификации по всем объектам.

м

^(Ь.Ь)

Р= г' ХЛ , (8)

М

где с1(Ь,Ь) - ошибка идентификации одного объекта, М - количество объектов в обучающей выборке.

Исследование систем идентификации выполнялось на специально разработанной для этих целей программе анализа многомерных данных.

При этом был реализован следующий функциональный набор свойств:

- система обеспечивает решение задачи обработки и идентификации объектов независимо от структуры предметной области и безотносительно структуры исходных данных;

- создан интерфейс пользователя, обеспечивающий создание предметной области произвольной структуры и полный контроль над обрабатываемыми данными;

- реализован унифицированный доступ к данным посредством ОЕ>ВС-интерфейса;

- реализована возможность графического представления результатов исследования в пространстве двух и трех параметров, а также табличный вывод и печать.

Основные эксперименты проводились с целью получения численных характеристик качества идентификации объектов при различных конфигурациях классов в пространстве признаков. Были исследованы 3 набора экспериментальных данных, имеющих следующие характеристики:

1 набор - группа классов нормально распределенных объектов, общее количество 200 объектов;

2 набор - группа классов, каждый из которых образован смесью нормальных распределений, общее количество 200 объектов;

3 набор - «улитка», группа классов, распределение объектов в которых не может быть описана аналитически (рис. 7)

В табл. 1 представлены результаты исследования различных систем идентификации многомерных объектов. Как видно из таблицы, значительный выигрыш в качестве идентификации достигается при работе адаптивными системами нечеткой идентификации.

moo 16 00 14 00 12 00 10 00 воо

BOO 400 2/30

¿00 4Г.0 6 00 & 00 10 Ci M KO'I 1е I>J 1t 00 20 00 22 00 ¿4 00 Л V /d(X

Рис. 7. Размещение объектов тестового примера и комплекс разделяющих кривых нечеткой адаптивной системы идентификации

Таблица 1

Ошибка идентификации объектов различными методами

Метод Класс 1 Класс 2 Класс 3 Класс 4

Дискримимантнйй анализ 0 33 0 36 0 35 0 45

Метод максимального правдоподобия , ' 0 32 0 36 0 34 0 28

-Адаптивная система нечеткою вывода 0 16 001 0 1 0 08

Адаптивная система нечеткого вывода (после оптимизации) 0 03 0 001 0016 0 02

В табл 2 представлены сравнительные исследования всех трех тестовых наборов в смысле качества идентификации различными методами

Таблица 2

Средняя ошибка идентификации в различных тестовых примерах

Мет-од Доля неверно идентифицированных j объектов 1

Пример 1 Пример 2 Пример 3

Дискриминаитный анализ 0 14 0 24 0 35

Метод максимально! о правдоподобия 0 13 0 20 0 34

Адаптивная система нечеткого вывода 0 11 0 09 0 08 |

Адаптивная система нечеткого вывода {после оптими1ации) 0 05 0 04 0 016

• - класс 1

+ - класс 2

■ - класс 3

А - класс 4

Из результатов этих исследований можно сделать вывод, что статистические методы сохраняют точность идентификации при размещении объектов, близком к нормальному Однако при идентификации объектов, размещение которых не имеет аналитического выражения, статистические методы дают значительный процент ошибок, в то время как адаптивные системы нечеткого вывода сохраняют качество идентификации практически независимо от формы распределения объектов.

В четвертой главе приводится описание программного комплекса «Анализ и идентификация состояний пациентов», разработанного в ходе выполнения диссертационной работы и успешно внедренного в работу дорожной поликлиники ЮВЖД г. Воронежа.

Целью разработки является создание программного средства для обеспечения своевременности и улучшение качества принятия решений врачом-урологом при диагностике нарушений в нижнем отделе мочеполовой системы у мужчин посредством разработки основных элементов автоматизированной системы диагностики, осуществляющей поддержку процесса принятия решения. Структура программного обеспечения представлена на рис. 8.

Рис. 8. Структура программного обеспечения

В процессе анализа задачи были выбраны четыре вида состояний, на которые можно разделить больных с нарушениями предстательной железы -

14

периотическое наблюдение, хронический простатит, ДГПЖ (доброкачеи венная гиперппазия предстательной железы) с рекомендациями на оперативное лечение и ДГ ПЖ с рекомендациями на консервативное лечение При постановке задачи необходимо было обеспечить классификацию сосюяния пациента по этой шкале.

Параметры предметной области представляли собой 9 ранговых и 5 количественных признаков, характеризующих данные обследования больного. Обучающая выборка cocíавляла 91 четовек.

В процессе использования программного комплекса были получены сравнительные результаты исследования системы идентификации на базе адаптивной нечеткой модели и на базе алюритма дискриминангного анализа, применяемого в предыдущей версии программы (табл. 3)

Как видно из таблицы, качество идентификации состояний пациентов при использовании адаптивной нечеткой системы значительно выше (на 13%). чем при использовании статистических методов, что говорит о достоверности полученных результатов и перспективности применения адаптивных нечетких систем для решения задач идентификации многомерных объектов

Таблица 3

Доля неверно классифицированиьгх объектов при использовании различных методов в задаче медицинской диагностики

Класс Кот-во объектов в классе Доля неверно классифицированных объектов Дискриминант- Адаптивная ный анализ нечеткая система

Периодическое наблюдение 17 0 23 0 11

Хронический простатит 24 0 125 0 04

Д1 Г1Ж консервативное лечение 32 0 09 0 01

Д[ ПЖ оперативное лечение 8 0 38 ' 0 125

Среднее по ктассам 0 20 0 07

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1 Проведен анализ применяемых в различных системах алгоритмов

нотификации многомерных объектов, проанализированы и\ недостачи и особенное i и применения

2 Предюжена структура адаптивной нечеткой моде ш и тентификации многомерных объектов, явтяюшаяся модификацией мотет вывода Sugeno нулевою порячка и позвотяющая испочыовать информацию о распретете-нии обьемов в мноюмерном пространстве признаков с пеню ред\кции множества правит

\ Предложен комбинированным алгоритм адаптивною построения

множества правил, позволяющий использовать информацию из обучающей выборки для формирования базы нечетких правил

4 Предложен ал) оритм кодирования и оптимизации параметров модели (параметров функций принадлежности лингвистических термов), позволяющий примени ib методы эволюционной оптимизации без дополнительных ограничений на пределы изменения параметров и независимо о г выбранной формы функций принадлежности.

5 Предложен набор тесювых процедур для исследования адаптивных нечетких моделей идентификации, позволяющий получа(ь числовые характеристики качества идентификации при различных параметрах модели и начальных условиях.

6 Разработано программное обеспечение анализа нечетких моделей, приведены сравнительные исследования на различных наборах исходных данных

7 Результаты исследований в виде npoipawwHbrx разработок внедрены в работу отделения урологии дорожной поликлиники ЮВЖД i Воронежа, что позволило в значительной мере автоматизировать процесс первичной ди-а1Ностики и явтястся подтверждением cocíоятельносi и предложенных моделей и алгоритмов.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ В СЛЕДУЮЩИХ РАБОТАХ:

1 Матасов А.С Отимизация систем принятия решений'алгоритмы и методы Новые технологи в научных исследованиях, проектировании, управтении, производстве. Труды Региональной науч техн конференции. Воронеж ВГТУ, 2001. С 191.

2 Магасов А.С Испо 1ьзование нечеткой логики при моделировании и управтении сложными технологическими сис1емами Н Современные проблемы информажзации в технике и технологиях Сб тр VII Междчнар от-крьиой науч копф Воронеж: Центр-Чернозем, кн изд-во, 2002 С 15

3 Магасов А.С , Подвальный С.Л. Диагностические системы с использованием аппарата нечетких множеств // Системные проблемы качества, математическою моделирования, информационных, электронных и тзерных технологии. Сб ip Междунар науч.-техн конф Сочи, 2002 С 34-34

4 MaiatoB А С Алгоритмы оптимизации сис1ем принятия решении / Современные проблемы информатизации в непромышленной сфере и экономике Сб rp VIII Междунар огкрыюй науч конф Воронеж Центр-HepHoseM кн и п во, 2003. С 107.

5 Vlaiací.B А.С , Подвальный СЛ., Макаренков ДВ \нали>, и классификация многомерных данных /М ■ ФАП ВПТИЦ 2003 № 50200300754

6 Магасов АС Аппроксимация плотности распреде 1ения n,i основе нечетких моде ки // Современные проблемы информатизации в сист* ма\ мо-

делирования. программирования и телекоммуникациях' Об. тр IX Между-нар. открытой науч. конф Воронеж. Изд-во «Научная книга», 2004 С 298.

7 Мат асов А С Интервальная параметризация функций принадлежности в системах нечеткого вывода // Современные сложные системы управления- Сб тр V Междунар науч конф Краснодар, 2004 С 80-83

8. Абсат аров Р А., Черепухин А.Н , Матасов А.С Компоненты подсистем принятия решений при диагностике заболеваний в многопрофильном лечебном учреждении // Системы управления и информационные технологии-Межвуз сб науч. тр Воронеж-ВГТУ, 2002 С 102-108

9 Матасов A.C., Подвальный С JL, Бырко И А Методы многомерной классификации в задачах медицинской диагностики // Машиностроитель, M ООО «НТП «Вираж-Центр», 2002. №8. С. 18-26.

10. Матасов A.C., Савинков Ю.А. Программная поддержка процесса анализа и классификации многомерных данных на нечеткой логике // Системы управления и информационные технологии. 2003, №1-2. С. 86-89.

11. Матасов A.C. Исследование нечеткой экспертной системы медицинской диагностики // Современные сложные системы управления: Сб науч. гр. Междунар. конф. Воронеж. ВГТУ, 2003. Т.З. С. 65-67

12. Матасов A.C., Подвальный C.J1. Сравнение методов многомерной классификации в прикладной задаче медицинской диагностики урологических заболеваний // Системы управления и информационные технологии. Межвуз. сб. науч. тр. Воронеж: ВГТУ, 2001. С. 17-25.

13. Матасов A.C. Разрабоша экспертной системы диагностики невро-ло1ических заболеваний на базе нечеткой логики // Системы управления и информационные технологи. Межвуз сб. науч тр Воронеж- Центр.-Чернозем, кн. изд-во, 2001. С. 98-102.

14. Абсатаров P.A., Бондарев А.А , Матасов A.C. Интеллектуализация принятия решений в диагностике и оперативном лечении холецистита лапароскопическим методом- Монография. Воронеж. Центр -Чернозем кн. изд-во, 2002. 158 с

15 Клейн К.В., Кравец Б.Б , Матасов А С Актуальные вопросы управления региональной колопроктологической службой: системный подход, высокие технологии, перспективы развития: Монография. Липецк- ОАО «НМЛК». 2002 216 с.

16. Матасов A.C., Подвальный С Л., Бырко И.А Автоматизированное рабочее место врача-уролога /М - ФАП ВНТИЦ 2002 № 50200200654.

Подписано в печать 30.09.04. Формат 60x84/16 Бумага для множительных аппаратов. Усл. печ л. 1,0 1ираж 90 экз. Заказ № З-Зт

Воронежский государственный (ехнический университе! 394026 Воронеж, Московский просп , 14

I

В1 8 6 3

РНБ Русский фонд

2005-4 13011

Оглавление автор диссертации — кандидата технических наук Матасов, Андрей Сергеевич

Введение.

Глава 1 Анализ алгоритмов идентификации образов.

1.1 Понятие образа как многомерного объекта.

1.2 Общая постановка задачи распознавания образов.

1.2.1 Проблема обучения распознаванию образов.

1.2.2 Гипотеза компактности.

1.3 Современные подходы к проблеме идентификации наблюдений.

1.3.1 Геометрический и структурный подходы.

1.3.2 Дискриминантный анализ.

1.3.3 Кластерный анализ.

1.3.4 Вероятностный подход.

1.3.5 Нейросетевой подход.

1.3.6 Логические и лингвистические методы. Нечеткие системы.

1.4 Практическое применение систем идентификации в задачах медицинской диагностики.

1.5 Постановка задач диссертационного исследования.

Глава 2 Синтез адаптивной модели нечеткой идентификации.

2.1 Анализ базовых элементов системы нечеткого вывода.

2.2 Оптимизация параметров лингвистических переменных.

2.3 Формирование множества правил.

2.4 Взаимодействие алгоритмов структурной и параметрической адаптации.

2.5 Выводы.

Глава 3 Специальное математическое и программное обеспечение анализа эффективности адаптивных систем.

3.1 Алгоритмизация основных структурных элементов модели.

3.2 Программная реализация системы анализа многомерных данных.

3.3 Генерация многомерных тестовых распределений.

3.4 Критерия качества модели идентификации.

3.5 Анализ качества идентификации при различных геометрических структурах обучающих множеств.

3.6 Анализ оптимальности использования различных операторов импликации. fr 3.7 Выводы.

Глава 4 Комплекс программ для решения задач идентификации состояний объектов.

4.1 Выбор и формализация идентификационных признаков.

4.2 Постановка задачи диагностики урологических заболеваний.

4.3 Анализ результатов идентификации состояний пациентов.

4.4 Структура и организация программного комплекса.

4.5 Выводы.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Матасов, Андрей Сергеевич

Актуальность темы. Активное использование современных информационных технологий для создания математических основ интеллектуальных систем в последние годы позволило по-новому взглянуть на проблему обработки многомерных данных в условиях неполной и неточной информации. Одной из наиболее актуальных задач в этой сфере является задача идентификации объектов - отнесение некоторого объекта, заданного набором параметров, к классу подобных объектов. Классические методы многомерной статистики, используемые в подобных задачах, основаны на определенных предположениях о структуре исходных данных и, как следствие, попытки их применения приводили к высоким процентам ошибок при условии несоответствия обучающих наборов этим предположениям. Наиболее перспективным направлением при решении данной задачи является использование универсальных аппроксиматоров широкого класса многомерных нелинейных функций - адаптивных моделей нечеткого логического вывода. Они представляют собой дальнейшее развитие нечетких экспертных систем, исследованиям которых посвящены работы Л.А. Заде, А. Кофмана, Д.А. Поспелова, А.Н. Борисова, Е.А. Мамдани и др. Основная трудность их использования заключается в структурной и параметрической адаптации - поиске оптимального набора параметров термов лингвистических переменных, структуры множества правил логического вывода. Для ее решения обычно привлекаются эксперты в соответствующих областях знаний. Параметры адаптивной модели нечеткого логического вывода формируются путем их оптимизации в смысле некоторого критерия, формируемого по данным из обучающей выборки. Исследованиям отдельных элементов таких систем посвящены работы В.В. Круглова, А.П. Ротштейна, С.Д. Штовбы, Т. Фукуда и др. Однако в настоящий момент отсутствуют общепризнанные методы применения адаптивных моделей нечеткого вывода для идентификации многомерных объектов, отсутствуют методы их обучения в рамках этой задачи. Кроме того, несмотря на постоянное совершенствование средств хранения информации и увеличение объемов носителей проблема сжатия множества правил в базе знаний модели по-прежнему является актуальной.

Одним из путей решения перечисленных проблемы является развитие моделей нечеткого вывода, методов структурной и параметрической оптимизации, алгоритмов сжатия базы знаний, оценки эффективности алгоритмических реализаций моделей.

Диссертационная работа выполнена в рамках тематики госбюджетной НИР ГБО1 -04 «Разработка информационно вычислительных систем непромышленного назначения».

Цель и задачи исследования. Целью работы является разработка моделей, численных методов и алгоритмов идентификации многомерных объектов на базе множества нечетких логических правил для повышения эффективности решения задачи идентификации, создание на их основе средств специального математического и программного обеспечения, апробация моделей и методов.

Для достижения поставленных целей необходимо решить следующие задачи:

1. Провести анализ различных подходов к решению задачи идентификации состояний многомерных объектов.

2. Разработать модели идентификации многомерных объектов, базирующейся на аппарате нечеткой логики, и методы их структурной и параметрической оптимизации. Разработать методы построения набора правил из экспериментальных данных.

3. Реализовать на ЭВМ модели идентификации объектов и алгоритмы их оптимизации для применения моделей в прикладных программах.

4. Провести теоретический анализ эффективности предложенных методов идентификации при различных тестовых выборках, отличающихся начальными условиями и параметрами.

5. Осуществить практическую апробацию прикладных разработок применительно к задачам медицинской диагностики (идентификация состояния при диагностике урологических заболеваний).

Методы исследования. В ходе исследования использовались методы теории математического моделирования, нечеткая логика и нечеткие множества, теории оптимизации, эволюционного моделирования, системного анализа и принятия решений, математической статистики.

Научная новизна. В работе получены следующие результаты, характеризующиеся научной новизной:

- предложена структура нечеткой модели идентификации многомерных объектов отличающаяся возможностью автоматизации процесса формирования базы нечетких логических правил;

- разработан комбинированный метод адаптивного построения множества нечетких правил модели, отличающийся использованием информации из обучающих выборок, что позволяет редуцировать множество правил; разработаны методы кодирования и оптимизации параметров модели на основе генетического аппарата, отличающейся возможностью применения генетических алгоритмов оптимизации без дополнительных ограничений на пределы изменения параметров модели.

Практическая значимость работы. Практическая значимость работы заключается в создании специального программного обеспечения, позволяющего осуществлять анализ моделей идентификации объектов, а также инвариантных программно-алгоритмических модулей для применения моделей идентификации в различных приложениях.

Реализация результатов работы. Теоретические и практические результаты работы реализованы в специальном программном комплексе исследования многомерных данных и анализа моделей многомерной идентификации, положенный в основу программного обеспечения «Анализ и идентификация многомерных данных», который внедрен в практическую деятельность дорожная поликлиники ЮВЖД (г. Воронеж).

Материалы диссертации, а также разработанное программное обеспечение используются в учебном процессе Воронежского государственного технического университета при обучении студентов специальности 230100 в дисциплинах «Системы искусственного интеллекта» и «Теория принятия решений»

Апробация работы. Основные положения диссертации докладывались и обсуждались на Международной открытой научной конференции «Математические методы в технике и технологиях — ММТТ-17», (Кострома, 2004), международной научно-технической конференции и Российской научной школе молодых ученых и специалистов "Системные проблемы качества, математического моделирования, информационных, электронных и лазерных технологий" (Сочи, 2002), V-VIII Республиканских научных конференциях "Современные проблемы информатизации" (Воронеж, 2000-2003), а также на научных семинарах кафедры ABC ВГТУ (Воронеж, 2001-2004).

Публикации. По результатам исследований опубликовано 14 печатных работ, в том числе 8 без соавторов. В работах, опубликованных в соавторстве и приведенных в конце диссертации, лично соискателем предложены: в основные принципы использования нечетких моделей для дискретной идентификации многомерных наблюдений, методы построения базы знаний на основе экспертной информации, в методы редукции множества правил нечеткого вывода.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, двух приложений, изложена на 124 листах машинописного текста, содержит список литературы из 110 наименований, 45 рисунков, 14 таблиц.

Заключение диссертация на тему "Идентификация состояний многомерных объектов на основе адаптивных моделей нечеткого логического вывода"

4.5 Выводы

В данной главе было приведено описание программного пакета диагностики, построенной на основе адаптивной системы идентификации на базе набора нечетких логических правил. Успешное применении разработанной системы в работе отделения урологии поликлиники ЮВЖД г. Воронежа позволило улучшить качество периодического профилактического осмотра, проведенные сравнительные исследования показали увеличение эффективности диагностики по сравнению с ранее применяемыми методами.

Заключение

Развитие нечетких моделей идентификации многомерных наблюдений является одним из приоритетных направлений в исследованиях нечетких систем в целом. Качество подобных систем сильно зависит от их структуры и применяемых методов параметрической и структурной оптимизации. Поэтому актуальной проблемой по-прежнему остается поиск наиболее эффективных методов и алгоритмов параметрической и структурной оптимизации. В рамках исследования этих проблем были получены следующие результаты:

1. Проведен анализ применяемых в различных системах алгоритмов идентификации многомерных объектов, проанализированы их недостатки и особенности применения.

2. Предложена структура адаптивной нечеткой модели идентификации многомерных объектов, являющаяся модификацией модели вывода Зи^епо нулевого порядка и позволяющая использовать информацию о распределении объектов в многомерном пространстве признаков с целью редукции множества правил.

3. Предложен комбинированный алгоритм адаптивного построения множества правил, позволяющий использовать информацию из обучающей выборки для формирования базы нечетких правил.

4. Предложен алгоритм кодирования и оптимизации параметров модели (параметров функций принадлежности лингвистических термов), позволяющий применить методы эволюционной оптимизации без дополнительных ограничений на пределы изменения параметров и независимо от выбранной формы функций принадлежности.

5. Предложен набор тестовых процедур для исследования адаптивных нечетких моделей идентификации, позволяющий получать числовые характеристики качества идентификации при различных параметрах модели и начальных условиях.

6. Разработано программное обеспечение анализа нечетких моделей, приведены сравнительные исследования на различных наборах исходных данных.

7. Результаты исследований в виде программных разработок внедрены в работу отделения урологии дорожной поликлиники ЮВЖД г. Воронежа, что позволило в значительной мере автоматизировать процесс первичной диагностики и является подтверждением состоятельности предложенных моделей и алгоритмов.

Библиография Матасов, Андрей Сергеевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Абсатаров P.A. БондаревА.А. Матасов A.C. Интеллектуализация принятия решений в диагностике и оперативном лечении холецистита лапароскопическим методом / Глава 1, 2, 3 монография, Воронеж: Центрально-Черноземное книжное издательство, 2002

2. Аверкин А. Н., Батыршин И. 3., Блишун А. Ф., Силов В. Б., Тарасов В. Б. Нечеткие множества в моделях управления и искусственного интеллекта. // Под ред. Поспелова Д. А.-М.: Наука, Гл. ред. Физ.-мат. лит., 1986.-312 с.

3. Автоматизированное рабочее место для статистической обработки данных/ В.В.Шураков, Д.М.Дайитбегов, С. В. Мизрохи, С. В. Ясеновский. М.: Финансы и статистика, 1990. - 190с.

4. Автоматизированные медико-технологические системы. Ч. 1,2,3: Монография/ А. Г. Устинов, В. А. Ситарчук, Н. А. Кореневский; Под ред. А. Г. Астинова. Курск, гос. техн. ун-т. Курск, 1995. 139 с.

5. Айвазян С. А. Классификация многомерных наблюдений. М.: Статистика, 1974. 237 с.

6. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. М.: Финансы и статистика, 1985. -487с.

7. Алтунин А.Е., Семухин М.В. Модели и алгоритмы принятия решений в нечетких условиях: Монография. Тюмень: Издательство Тюменского государственного университета, 2000. 352 с.

8. Амосов A.A., Дубинский Ю.А, Копченова Н.В. Вычислительные методы для инженеров: Учеб. пособие. М.: Высш. шк., 1994. - 544 с.

9. Анисимов В. Ю., Борисов Э. В. Методы достоверности реализации нечетких отношений в прикладных системах искусственного интеллекта // Изв. АН: серия Техническая кибернетика, № 5, 1991.

10. Асаи К., Ватада Д., Иван С. и др. Прикладные нечеткие системы // под ред. Т. Тэрано, К. Асаи, М. Сугено. М.: Мир, 1993. - 386 с.

11. Аффифи А. Эйзен С. Статистический анализ: подход с использованием ЭВМ. М.: Мир, 1982. - 488с.

12. Баженова И.Ю. Visual С++ 6.0. М.: Диалог-МИФИ, 1999. 416 С.

13. Батыршин И. 3. Лексикографические оценки правдоподобности с универсальными границами. II. Операции отрицания. Теория и системы управления. Известия академии наук. РАН. — 1995.-№ 5.-е. 133-151.

14. Батыршин И. 3. Методы представления и обработки нечеткой информации в интеллектуальных системах. Новости искусственного интеллекса, 1996, № 2, с. 9-65.

15. Батыршин И. 3. Принятие решений на базе нечетких отношений предпочтения и функций выбора // Нечеткие системы поддержки принятия решений. Калинин: КГУ, 1989.-е. 29-35.

16. Беллман Р. Киберенитка и медицинская диагностика. /Пер. с англ. -М.: Знание, 1968. 50с.

17. Беллман Р., Заде Л. Принятие решений в расплывчатых условиях.-В кн. Вопросы анализа и процедуры принятия решений.-М.: Мир, 1976.-е. 172-215.

18. Берштейн Л.С., Коровин С.Я., Мелихов А.Н. Сжатие множества эталонных ситуаций в лингвистических моделях ситуационного управления. Автоматика и телемеханика, 1985, № 2.

19. Блишун А. Ф. Сравнительный анализ методов измерения нечеткости. Изв. АН СССР. Техн. Кибернетика.-1988.- № 5.-е. 152-175.

20. Богачев К.Ю. Основы параллельного программирования. М.: БИНОМ. Лаборатория знаний, 2003. - 342 с.

21. Божич В.И., Лебедев О.Б., Шницер Ю.Л. Разработка генетического алгоритма обучения нейронных сетей // Перспективные информационные технологии и интеллектуальные системы. 2001. -№1.- С. 21-24.

22. Борисов А. Н. Крумберг О. А. Федоров И. П. Принятие решений на основе нечетких моделей: примеры использования. Рига: Зинатне,1990.- 184с.

23. Борисов А. Н., Алексеев А. В., Меркурьева Г. В. и др. Обработка нечеткой информации в системах принятия решений.-М: Радио и связь. 1989.-304 с.

24. Борисов А. Н., Глушков В. И. Использование нечеткой информации в экспертных системах. Новости искусственного интеллекта, 3,1991, с. 13-41.

25. Борисов А.Н. Принятие решений на основе нечетких моделей: примеры использования/ А. Н. Борисов, О. А. Крумборг, И. П. Федоров. Рига: Зинатне, 1990. 184 с.

26. Васильев В. И., Коноваленко В. В., Горелов Ю. И. Имитационное управление неопределенными объектами. //К.: Наукова думка, 1989 216с.

27. Винокуров В. А. О понятии регуляризуемости разрывных отображений // "Журнал вычислительной математики и математической физики",-1971,-т. И, №5;30.