автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Алгоритмы и программные средства идентификации нечетких систем на основе метода роящихся частиц

кандидата технических наук
Синьков, Дмитрий Сергеевич
город
Томск
год
2013
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Алгоритмы и программные средства идентификации нечетких систем на основе метода роящихся частиц»

Автореферат диссертации по теме "Алгоритмы и программные средства идентификации нечетких систем на основе метода роящихся частиц"

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Томский государственный университет систем управления и радиоэлектроники» (ТУСУР)

Научный руководитель - доктор технических наук, профессор

Ходашинский Илья Александрович

Официальные оппоненты: Тимченко Сергей Викторович,

доктор физико-математических наук, Национальный исследовательский Томский государственный университет, профессор кафедры математической физики

Аксенов Сергей Владимирович,

кандидат технических наук,

Национальный исследовательский Томский

политехнический университет,

доцент кафедры оптимизации систем управления

Ведущая организация — Национальный исследовательский Иркутский

государственный технический университет

Защита состоится 19 декабря 2013 г. в 15 час. 15 мин. на заседании диссертационного совета Д 212.268.02 при ТУСУРе по адресу: 634050, г. Томск, пр. Ленина, 40.

С диссертацией можно ознакомиться в научной библиотеке ТУСУРа по адресу: г. Томск, ул. Вершинина, 74.

Автореферат разослан 19 ноября 2013 г.

Ученый секретарь диссертационного совета

Р.В. Мещеряков

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Традиционно разработка нечетких систем (НС) направлена на оптимизацию показателей качества: максимизацию точности в задачах классификации или минимизацию ошибки вывода в задачах аппроксимации. Указанные цели часто достигаются в ущерб понятности проектируемой НС. Остро стоит проблема выбора подходящей структуры и параметров НС для описания изучаемой предметной области, так как несложная и хорошо интерпретируемая НС более проста в настройке, требует меньше памяти и времени вывода, чем более сложная. От оптимального соотношения между сложностью и точностью зависит масштабируемость, адекватность и быстродействие создаваемых технических систем на основе технологии нечеткого моделирования.

Анализ литературных источников показал, что проблема нахождения компромисса между сложностью и точностью НС, не достаточно изучена, нет методики построения и выбора оптимальной НС для решения поставленной конкретной задачи. Таким образом, решение проблемы нахождения компромисса между точностью и сложностью НС и разработка методики построения оптимальных в Парето смысле НС являются важными задачами исследования и определяют актуальность настоящей работы.

Для оптимизации параметров НС в работе выбран активно исследуемый в последнее время метод роящихся частиц, так как он в классическом варианте описывается простыми математическими формулами и легко поддается гибридизации с другими алгоритмами и методами. Выбор метода роящихся частиц основан еще и на том, что данный метод относится к классу метаэвристик, хорошо себя зарекомендовавших в задачах многомерной оптимизации, к которым в частности и относится задача поиска оптимальных параметров НС. Построение алгоритмов на основе имитации поведения роя частиц основывалось на трудах Kennedy, J.; Eberhart, R.; Zhang, J.; Li; Chung; Z. Ruiyou , W. Dingwei, Y. G. Pétalas, V. Kalivarapu, S. B. Akat, V. Gazi, I. Scriven, W. Во, Q. Liguo, T. Desell, K. T. Chaturvedi, P. Boonyaritdachochai, A. Chatterjee, P. Siarry, L. Yufeng, S. Xianjun, P. K. Tripathi, F. Shahzad, M. Ben Ghalia.

Основополагающие результаты в области нечеткого моделирования получили А.Н. Аверкин, И.З. Батыршин, Л.С. Берштейн, Ю.Н. Золотухин, С.М. Ковалев, Л.Г. Комарцова, Ю.И. Кудинов, А.О. Недосекин, Ф.Ф. Пащенко, Пытьев Ю.П., В.Б.Тарасов, А.В. Язенин, Н.Г., Ярушкина, P. Angelov, R. Babuska, A. Bastían, J.C. Bezdek, J. Casillas, J.L. Castro, O. Cordon, D. Dubois, D. Filev, J. González, S. Guillaume, F.Herrera, H. Ishibuchi, U. Kaymak, B. Kosko, R. Krishnapuram, R. Kruse, E.H. Mamdani, J. M. Mendel, S. Oh, W. Pedrycz, H. Prade, M. Sugeno, T.Takagi, H. Tanaka, I. B. Turksen, R.R. Yager, T.Yasukawa, L.X.Wang, L.Zadeh.

Целью диссертационной работы является разработка алгоритмов и программных средств нахождения компромисса между точностью и сложностью НС за счет гибридных методов, использующих алгоритмы роящихся частиц и методы, основанные на производных.

Для достижения поставленной цели решены следующие основные задачи исследования:

1. Обзор и анализ существующих решений в области идентификации НС на основе алгоритмов роящихся частиц и метода наименьших квадратов.

2. Разработка методики построения Парето-оптимальных НС, учитывающей компромисс между сложностью и точностью.

3. Разработка численного метода решения задач аппроксимации, классификации и извлечения знаний, на основе гибридных алгоритмов роящихся частиц и метода наименьших квадратов.

4. Разработка унифицированного представления нечетких аппроксиматоров и нечетких классификаторов для решения задач имитационного моделирования.

5. Проведение исследований разработанных алгоритмов на типовых контрольных примерах.

6. Применение разработанных алгоритмов в прикладных задачах аппроксимации, классификации и извлечения знаний.

7. Проектирование и разработка \уеЬ-ориентированных программных комплексов построения и оптимизации НС и извлечения знаний на основе созданных алгоритмов и реализующих методику двухкритериальной настройки НС.

Объектом исследований является процесс идентификации НС и процесс извлечения знаний.

Предметом исследований является комплекс гибридных алгоритмов и программ идентификации параметров нечеткой системы, а так же комплекс алгоритмов и программ извлечения знаний.

Методы исследования. В диссертационной работе применялись методы искусственного интеллекта, теории нечетких множеств, математической статистики и объектно-ориентированного программирования.

Научная новизна полученных результатов. В диссертации получены следующие новые научные результаты:

1. Разработана оригинальная двухэтапная методика построения НС, учитывающая компромисс между сложностью и точностью НС, отличающаяся от существующих методов поиска компромисса возможностью сведения задачи к однокритериальной оптимизации.

2. Разработан численный метод настройки параметров НС, основанный на гибридном адаптивном алгоритме роящихся частиц с модифицированной топологией совместно с методом наименьших квадратов, включающий в себя достоинства входящих в него методов и алгоритмов по отдельности, показывающий лучшие результаты на большинстве тестовых выборок по сравнению с численными методами, применяемыми другими авторами в аналогичной задаче.

3. Разработана \уеЬ-ориентированная система нечеткого моделирования, реализующая предложенные методику и алгоритмы и использующая оригинальный формат представления НС ЦР^, отличающийся полнотой представления структурных элементов и позволяющий хранить,

редактировать и переносить настроенные НС, а так же упрощающий их использование на практике.

Практическая значимость работы. На основе разработанных алгоритмов создан ууеЬ-ориентированный комплекс программ, основанный на унифицированном представлении НС, позволяющий создавать, настраивать и использовать на практике НС.

Разработанные алгоритмы и программные средства использованы при выполнении проектов:

— грант РФФИ 06-08-00248 «Основанное на данных нечеткое моделирование технических систем» 2006 -2007 г.;

— грант РФФИ 09-07-99008 «Исследование и разработка технологии идентификации нечетких моделей на базе метаэвристик и методов, основанных на производных» 2009-20 Юг.;

— грант РФФИ 12-07-00055 «Методы построения Парето-оптимальных нечетких систем на основе гибридного подхода» 2012-2014г.;

— грант РГНФ 12-06-12008 «Программный комплекс для прогнозирования эффективности реабилитации лиц опасных профессий с наиболее распространенными социально значимыми неинфекционными заболеваниями» 2012-2014г.;

— проект УМНИК-2012 «Разработка облачного сервиса продвижения товаров и услуг на основе адаптивного алгоритма роящихся частиц».

На защиту выносятся:

1. Новая методика двухкритериального анализа данных, основанная на построении НС, включает два основных этапа:

— генерацию структуры НС, основанную на алгоритме генерации базы правил НС равномерным разбиением и перебором;

— оптимизацию параметров НС, основанную на алгоритмах моделирующих поведение роя частиц и методе наименьших квадратов.

Соответствует пункту 1 паспорта специальности: Разработка новых математических методов моделирования объектов и явлений.

2. Гибридные и адаптивные алгоритмы оптимизации на основе моделирования когнитивного поведения роя частиц и метода наименьших квадратов позволяют повысить точность вывода НС на порядок по сравнению с использованием алгоритмов по отдельности, и показывают меньшую ошибку вывода нечеткой системы на большинстве типовых контрольных примерах, по сравнению с алгоритмами представленными другими авторами.

Соответствует пункту 3 паспорта специальности: Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий.

3. Web-opиeнтиpoвaнный программный комплекс идентификации НС на основе наблюдаемых данных или знаний эксперта, отличающийся от аналогов методами анализа и приобретения знаний, алгоритмами обнаружения закономерностей в данных, основанными на гибридном алгоритме роящихся частиц, и позволяющий создавать, настраивать и

использовать оптимизированные НС, использующий в своей работе оригинальное унифицированное представление НС в формате UFS, и реализующий двухэтапную методику построения НС. Соответствует пункту 4 паспорта специальности: Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента

Достоверность полученных результатов обеспечена строгостью применения математических методов, результатами проведенных численных экспериментов, которые сопоставлены с данными, полученными другими авторами.

Внедрение результатов диссертационного исследования.

Разработанный программный комплекс используются при выполнении НИР Научно-исследовательского института курортологии и физиотерапии ФМБА Российской Федерации «Немедикаментозное восстановительное лечение участников вооруженных конфликтов и чрезвычайных ситуаций» для назначения комплексов реабилитации пациентам с постгравматическими стрессовыми расстройствами.

Результаты используются при выполнении курсовых, дипломных и научно-исследовательских работ студентами кафедры комплексной информационной безопасности электронно-вычислительных систем Томского государственного университета систем управления и радиоэлектроники (КИБЭВС ТУСУР).

Разработанные программные комплексы используются для извлечения знаний из истории о продажах в томском ресторане доставки «Хочу суши» (ИП Муравский Е.В. ОГРНИП 311702423700051).

Апробация работы. Основные положения работы докладывались и обсуждались на: Всероссийской конференции с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации» 2009г.; VII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Технологии Microsoft в теории и практике программирования» 2010г., г. Томск; Международной научной конференции (заочной) «Системный анализ в медицине» (САМ 2011) 25-26 мая 2011г., г. Благовещенск; Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых «Научная сессия ТУСУР» г. Томск, 2008, 2009, 2010, 2011, 2012, 2013гг; Томском IEEE семинаре «Интеллектуальные системы моделирования, проектирования и управления» г. Томск, 2012, 2013гг; VII-ой Международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте» 20-22 мая 2013 г., Коломна;

Публикации по теме диссертации. По результатам исследований опубликовано 17 печатных работ, из которых в рекомендованных ВАК РФ периодических изданиях - 4. Были получены 2 свидетельства о государственной регистрации программ для ЭВМ (номера свидетельств: №2013611468, № 2013619210).

Личный вклад автора. Постановка задачи, а также подготовка материалов к печати велась совместно с научным руководителем. Основные научные результаты получены лично автором. Автором самостоятельно разработан численный метод на основе гибридного алгоритма роящихся частиц для идентификации НС, программный комплекс настройки НС и комплекс программ по извлечению ассоциативных правил. Автором самостоятельно разработан \уеЬ-ориентированный комплекс настройки НС, в котором модуль управления оптимизацией был разработан совместно с Горбуновым И.В.

Структура и объем работы. Диссертационная работа состоит из введения, пяти глав и заключения. Объем работы составляет 163 страницы. Список литературы содержит 88 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы исследования, формулируется цель работы, излагаются полученные автором основные результаты проведенных исследований, показывается их научная новизна, теоретическая и практическая значимость, отражаются основные положения, выносимые на защиту.

В первой главе производится обзор проблемы исследования.

Под идентификацией понимается нахождение взаимосвязей между входными и выходными параметрами моделируемой системы. Идентификация НС состоит из двух основных этапов: идентификация структуры и идентификация параметров. Идентификация структуры - определение оптимального числа нечетких правил и лингвистических термов, на которое разбиты входные и выходные переменные. К задачам идентификации параметров относятся нахождение оптимальных значений параметров антецедентов и консеквентов правил НС. Идентификация структуры и параметров происходит на основе данных таблиц наблюдений.

В работе используются три типа систем основанных на нечетком представлении информации: нечеткие аппроксиматоры, нечеткие классификаторы и класс систем извлечения знаний с нечетким оцениванием.

Настройка параметров НС. Трудности применения классических методов оптимизации, в частности проблема локального экстремума и «проклятие размерности», заставляют обратиться ко второй группе методов -метаэвристических, таких как алгоритм имитации отжига, генетические алгоритмы, алгоритм дифференциальной эволюции. Достоинство метаэвристических методов заключается в большей устойчивости. Использование гибридных алгоритмов позволит объединить преимущества метаэвристических методов с преимуществами классических методов, основанных на производных. Такое объединение повысит качество решений при умеренном количестве ресурсов и за приемлемое время.

Постановка задачи. Рассматривается численный метод, основанный на алгоритме роящихся частиц для трех задач: аппроксимации, классификации, извлечения знаний.

При решении задачи аппроксимации НС представляется системой типа синглтон, описываемой по формуле

i Мм (■*! )• Рл2,(*г )••••■ Ил* (*. )•■г,

FW = ^-'

(*,) ■• Mau (*2 ) • - ■• САШ О- )

м

где х = [Xj,...,хт]т s 5Hm, п - количество правил HC; m - количество

входных переменных в HC; HAj- функция принадлежности нечеткой области.

Нечеткий аппроксиматор может быть представлен как

y = F(x, в),

где у - скалярный выход аппроксиматора, в = ||еь..., - вектор

оптимизируемых параметров, N = ¿а*6, ■ а - число параметров, описывающих

¡-1

одну функцию принадлежности, bt - число термов, описывающих /-тую входную переменную. Пусть дано множество обучающих данных (таблица наблюдений) {(хр; tp), р = 1 ,..., т}, тогда среднеквадратическая функция ошибки (RMSE), являющаяся численным критерием адекватности модели, вычисляется по следующей формуле:

Задача аппроксимации сводится к поиску параметров НС, при которых значение данного критерия минимально.

При идентификации НС для создания нечеткого классификатора, основной задачей является описание предполагаемого кластера нечетким прототипом, размерность которого определена размерностью пространства исследуемых данных. Таким образом, /-й кластер определяется нечетким правилом следующего вида:

R,f. ЕСЛИX\=A\i Ихг=Ац И...Ихт=Ат1 TOdass = ср w=CF,; где, х = (хь хг, х3, ...,хП) - вектор признаком классифицируемого объекта; A,j - нечеткий терм, характеризущий А>ый признак в /-том правиле (г'е [1 Д|), R -число правил; ^-идентификатор у-того класса,,/ е[1,/и]; CF, - вес правила или уровень доверия /-тому правилу, CFt е[0,1].

Задача традиционной классификации может быть описана функцией:

/:9?" {0,1}™

где _Дх)=(а, С2, ..., ст) причем с/= 1, а су=0 (je [1, т], i Ф j), когда объект, заданный вектором х, принадлежит к классу ct.

Нечеткая классификация описывается функцией /:9Г ->[0,1]™, которая относит классифицируемый объект к каждому классу с определенной степенью принадлежности, вычисленной по следующей формуле:

ßj(*) = = l.J» •

Текст работы Синьков, Дмитрий Сергеевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

Томский государственный университет систем управления

и радиоэлектроники

На правах рукописи

04201455191

Синьков Дмитрий Сергеевич

АЛГОРИТМЫ И ПРОГРАММНЫЕ СРЕДСТВА ИДЕНТИФИКАЦИИ НЕЧЕТКИХ СИСТЕМ НА ОСНОВЕ МЕТОДА РОЯЩИХСЯ ЧАСТИЦ

Специальность 05.13.18 — Математическое моделирование, численные методы и комплексы программ

Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель — доктор технических наук, профессор Ходашинский И.А.

Томск-2013

\

СОДЕРЖАНИЕ

Сокращения..............................................................................................................5

Введение...................................................................................................................6

Глава 1. Нечеткое моделирование. Идентификация нечетких систем. Обзор проблемы исследования.......................................................................................13

1.1 Нечеткое моделирование............................................................................13

1.2 Настройка параметров нечетких систем...................................................23

1.2.1 Алгоритм дифференциальной эволюции..........................................24

1.2.2 Определение роя. Основная идея алгоритма роящихся частиц......25

1.2.3 Концепция алгоритма роящихся частиц............................................27

1.2.4 Классификация АРЧ............................................................................30

1.3 Постановка задачи.......................................................................................37

Выводы...............................................................................................................40

Глава 2. Алгоритмическое обеспечение систем нечеткой идентификации.... 42

2.1 Методика двухкритериального анализа нечетких систем......................42

2.2 Алгоритмы генерации структуры нечетких систем................................44

2.2.1 Алгоритм генерации базы правил нечеткой системы равномерным разбиением и перебором..............................................................................45

2.3 Алгоритмы параметрической идентификации нечетких систем...........46

2.3.1 Алгоритм роящихся частиц.................................................................46

2.3.2 Модифицированная топологии обмена решением в АРЧ...............51

2.3.3 Гибридный алгоритм роящихся частиц совместно с МНК.............52

2.3.4 Квантовый алгоритм роящихся частиц..............................................52

2.3.5 Гибридный алгоритм роящихся частиц и метода дифференциальной эволюции......................................................................53

2.4 АРЧ в задаче классификации.....................................................................55

2.5 АРЧ для извлечения знаний.......................................................................56

2.5.1 Бинарный алгоритм роящихся частиц...............................................58

2.5.2 Описание алгоритма поиска ассоциативных правил.......................59

2.5.3 Бинарный алгоритм роящихся частиц с нечетким оцениванием.... 60 Выводы...............................................................................................................60

Глава 3. Программная реализация средств идентификации нечетких систем 62

3.1 Аналоги разрабатываемого программного обеспечения........................62

3.2 Выбор средств реализации.........................................................................63

3.3 Программный комплекс идентификации нечетких систем....................63

3.3.1 Моделирование системы.....................................................................63

3.3.2 Диаграмма последовательности.........................................................64

3.3.3 Диаграмма классов...............................................................................64

3.3.4 Диаграмма деятельности.....................................................................65

3.3.5 Описание комплекса «Fuzzy System»....................................................66

Работа с «Fuzzy System»...............................................................................67

3.4 Веб-ориентированная система настройки нечетких систем...................79

V w

3.4.1 Описание сайта.....................................................................................79

3.4.2 Описание панели администратора сайта...........................................83

3.4.3 Описание создания проекта на сайте.................................................85

3.4.4 Описание взаимодействия программного комплекса «FuzzySystem» и сайта.............................................................................................................88

3.5 Программный комплекс извлечения ассоциативных правил.................90

3.5.1 Технологические требования к системе............................................90

3.5.2 Моделирование системы.....................................................................91

3.5.3 Формат выгрузки ассоциативных правил..........................................91

3.5.4 Программа извлечения ассоциативных правил................................92

3.6 Унифицированное представление нечетких систем...............................93

3.6.1 Описание нечеткой системы...............................................................93

3.6.2 Описание лингвистических переменных...........................................95

3.6.3 Описание базы правил нечеткой системы.........................................98

3.6.4 Описание таблиц наблюдений..........................................................100

3.6.5 Описание значений целевых функций.............................................103

Выводы.............................................................................................................105

Глава 4. Исследование разработанных алгоритмов........................................106

4.1 Исследование алгоритма роящихся частиц............................................106

4.2 Апробация методики построения Парето оптимальных нечетких систем

...........................................................................................................................120

4.2.1 Построение Парето оптимальных аппроксиматоров на наборе данных 1.......................................................................................................121

4.2.2 Построение Парето оптимальных аппроксиматоров на наборе данных 2.......................................................................................................123

4.2.3 Построение Парето оптимальных аппроксиматоров на наборе данных 3.......................................................................................................124

4.2.4 Построение Парето оптимальных аппроксиматоров на наборе данных diabetes............................................................................................126

4.2.5 Построение Парето оптимальных аппроксиматоров на наборе данных ele-2.................................................................................................127

4.3 Исследование алгоритма роящихся частиц а задаче классификации.. 128

4.4 Исследование алгоритма роящихся частив задаче поиска ассоциативных правил....................................................................................130

Выводы.............................................................................................................132

Глава 5. Описание внедрения разработанных программных комплексов.... 134

5.1 Анализ ретроспективных данных в НИИКФ.........................................134

5.1.1 Методика анализа и предобработки ретроспективных данных.... 134

5.1.2 Исследование эффективности комплекса........................................137

5.2 Описание внедрения комплекса извлечения ассоциативных правил на сайт компании «Хочу Суши».........................................................................140

5.2.1 Модуль предложения товаров в интернет-магазине......................141

5.2.2 Тестирование работоспобности системы........................................141

Выводы.............................................................................................................142

ЗАКЛЮЧЕНИЕ...................................................................................................144

СПИСОК ЛИТЕРАТУРЫ...................................................................................146

ПРИЛОЖЕНИЕ А...............................................................................................157

ПРИЛОЖЕНИЕ Б................................................................................................158

ПРИЛОЖЕНИЕ В...............................................................................................160

ПРИЛОЖЕНИЕ Г................................................................................................161

ПРИЛОЖЕНИЕ Д...............................................................................................162

Сокращения

АРЧ - алгоритм роящихся частиц

ААРЧ - адаптивный алгоритм роящихся частиц

АМК - алгоритм муравьиной колонии

ДАМК — дискретный алгоритм муравьиной колонии

НАМК - непрерывный алгоритм муравьиной колонии

ПАМК — прямой алгоритм муравьиной колонии

МНК - метод наименьших квадратов

ГМ — градиентный метод

ДЭ - дифференциальная эволюция

НС - нечеткая система

ФП - функция принадлежности

ЛП - лингвистическая переменная

ФПВ — функция плотности вероятности

СКО - среднеквадратичная ошибка

CAO - среднеабсолютная ошибка

MSE - mean square error

Введение

Актуальность исследования. Традиционно разработка нечетких систем (НС) направлена на^ оптимизацию показателей качества: максимизацию точности в задачах классификации или минимизацию ошибки вывода в задачах аппроксимации. Указанные цели часто достигаются в ущерб понятности проектируемой НС. Остро стоит проблема выбора подходящей структуры и параметров НС для описания изучаемой предметной области, так как несложная и хорошо интерпретируемая НС более проста в настройке, требует меньше памяти и времени вывода, чем более сложная. От оптимального соотношения между сложностью и точностью зависит масштабируемость, адекватность и быстродействие создаваемых технических систем на основе технологии нечеткого моделирования.

Анализ литературных источников показал, что проблема нахождения компромисса между сложностью и точностью НС, не достаточно изучена, нет методики построения и выбора оптимальной НС для решения поставленной конкретной задачи. Таким образом, решение проблемы нахождения компромисса между точностью и сложностью НС и разработка методики построения оптимальных в Парето смысле НС являются важными задачами исследования и определяют актуальность настоящей работы.

Для оптимизации параметров НС в работе выбран активно исследуемый в последнее время метод роящихся частиц, так как он в классическом варианте описывается простыми математическими формулами и легко поддается гибридизации с другими алгоритмами и методами. Выбор метода роящихся частиц основан еще и на том, что данный метод относится к классу метаэвристик, хорошо себя зарекомендовавших в задачах многомерной оптимизации, к которым в частности и относится задача поиска оптимальных параметров НС. Построение алгоритмов на основе имитации поведения роя частиц основывалось на трудах Kennedy, J.; Eberhart, R.;

Zhang, J.; Li; Chung; Z. Ruiyou , W. Dingwei, Y. G. Pétalas, V. Kalivarapu, S. B. Akat, V. Gazi, I. Scriven, W. Во, Q. Liguo, T. Desell, K. T. Chaturvedi, P. Boonyaritdachochai, A. Chatterjee, P. Siarry, L. Yufeng, S. Xianjun, P. K. Tripathi, F. Shahzad, M. Ben Ghalia.

Основополагающие результаты в области нечеткого моделирования получили А.Н. Аверкин, И.З. Батыршин, Л.С. Берштейн, Ю.Н. Золотухин,

C.М. Ковалев, Л.Г. Комарцова, Ю.И. Кудинов, А.О. Недосекин, Ф.Ф. Пащенко, Пытьев Ю.П., В.Б.Тарасов, А.В. Язенин, Н.Г., Ярушкина, Р. Angelov, R. Babuska, A. Bastían, J.C. Bezdek, J. Casillas, J.L. Castro, O. Cordon,

D. Dubois, D. Filev, J. González, S. Guillaume, F.Herrera, H. Ishibuchi, U. Kaymak, B. Kosko, R. Krishnapuram, R. Kruse, Е.Ц. Mamdani, J. M. Mendel, S. Oh, W. Pedrycz, H. Prade, M. Sugeno, T.Takagi, H. Tanaka, I. B. Turksen, R.R. Yager, T.Yasukavva, L.-X.Wang, L.Zadeh.

Целью диссертационной работы является разработка алгоритмов и программных средств нахождения компромисса между точностью и сложностью НС за счет гибридных методов, использующих алгоритмы роящихся частиц и методы, основанные на производных.

Для достижения поставленной цели решены следующие основные задачи исследования:

1. Обзор и анализ существующих решений в области идентификации НС на основе алгоритмов роящихся частиц и метода наименьших квадратов.

2. Разработка методики построения Парето-оптимальных НС, учитывающей компромисс между сложностью и точностью.

3. Разработка численного метода решения задач аппроксимации, классификации и извлечения знаний, на основе гибридных алгоритмов роящихся частиц и метода наименьших квадратов.

4. Разработка унифицированного представления нечетких аппроксиматоров и нечетких классификаторов для решения задач имитационного моделирования.

5. Проведение исследований разработанных алгоритмов на типовых контрольных примерах.

6. Применение разработанных алгоритмов в прикладных задачах аппроксимации, классификации и извлечения знаний.

7. Проектирование и разработка шеЬ-ориентированных программных комплексов построения и оптимизации НС и извлечения знаний на основе созданных алгоритмов и реализующих методику двухкритериальной настройки НС.

Объектом исследований является процесс идентификации НС и процесс извлечения знаний.

Предметом исследований является комплекс гибридных алгоритмов и программ идентификации параметров нечеткой системы, а так же комплекс алгоритмов и программ извлечения знаний.

Методы исследования. В диссертационной работе применялись методы искусственного интеллекта, теории нечетких множеств, математической статистики и объектно-ориентированного

программирования.

Научная новизна полученных результатов. В диссертации получены следующие новые научные результаты:

1. Разработана оригинальная двухэтапная методика построения НС, учитывающая компромисс между сложностью и точностью НС, отличающаяся от существующих методов поиска компромисса возможностью сведения задачи к однокритериальной оптимизации.

2. Разработан численный метод настройки параметров НС, основанный на гибридном адаптивном алгоритме роящихся частиц с модифицированной топологией совместно с методом наименьших квадратов, включающий в себя достоинства входящих в него методов и алгоритмов по отдельности, показывающий лучшие результаты на большинстве тестовых выборок по сравнению с численными методами, применяемыми другими авторами в аналогичной задаче.

3. Разработана шеЬ-ориентированная система нечеткого моделирования, реализующая предложенные методику и алгоритмы и использующая оригинальный формат представления НС Ш^, отличающийся полнотой представления структурных элементов и позволяющий хранить, редактировать и переносить настроенные НС, а так же упрощающий их использование на практике.

Практическая значимость работы. На основе разработанных алгоритмов создан шеЬ-ориентированный комплекс программ, основанный на унифицированном представлении НС, позволяющий создавать, настраивать и использовать на практике НС.

Разработанные алгоритмы и программные средства использованы при выполнении проектов:

— грант РФФИ 06-08-00248 «Основанное на данных нечеткое моделирование технических систем» 2006 -2007 г.;

— грант РФФИ 09-07-99008 «Исследование и разработка технологии идентификации нечетких моделей на базе метаэвристик и методов, основанных на производных» 2009-20Юг.;

— грант РФФИ 12-07-00055 «Методы построения Парето-оптимальных нечетких систем на основе гибридного подхода» 2012-2014г.;

— грант РГНФ 12-06-12008 «Программный комплекс для прогнозирования эффективности реабилитации лиц опасных профессий с наиболее распространенными социально значимыми неинфекционными заболеваниями» 2012-2014г.;

— проект УМНИК-2012 «Разработка облачного сервиса продвижения товаров и услуг на основе адаптивного алгоритма роящихся частиц».

На защиту выносятся: 1. Новая методика двухкритериального анализа данных, основанная на построении НС, включает два основных этапа:

— генерацию структуры НС, основанную на алгоритме генерации базы правил НС равномерным разбиением и перебором;

— оптимизацию параметров НС, основанную на алгоритмах

моделирующих поведение роя частиц и методе наименьших квадратов. Соответствует пункту 1 паспорта специальности: Разработка новых математических методов моделирования объектов а явлений.

2. Гибридные и адаптивные алгоритмы оптимизации на основе моделирования когнитивного поведения роя частиц и метода наименьших квадратов позволяют повысить точность вывода НС на порядок по сравнению с использованием алгоритмов по отдельности, и показывают меньшую ошибку вывода нечеткой системы на большинстве типовых контрольных примерах, по сравнению с алгоритмами представленными другими авторами.

Соответствует пункту 3 паспорта специальности: Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий.

3. \УеЬ-ориентированный программный комплекс идентификации НС на основе наблюдаемых данных или знаний эксперта, отличающийся от аналогов методами анализа и приобретения знаний, алгоритмами обнаружения закономерностей в данных, основанными на гибридном алгоритме роящихся частиц, и позволяющий создавать, настраивать и использовать оптимизированные НС, использующий в своей работе оригинальное унифицированное представление НС в формате и реализующий двухэтапную методику построения НС.

Соответствует пункту 4 паспорта специальности: Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента

Достоверность полученных результатов обеспечена строгостью применения математических методов, результатами проведенных численных экспериментов, которые сопоставлены с данными, полученными другими авторами.

Внедрение результатов диссертационного исследования.

Разработанный программный комплекс используются при выполнении НИР Научно-исследовательского института курортологии и физиотерапии ФМБА Российской Федерации «Немедикаментозное восстановительное лечение участников вооруженных конфликтов и чрезвычайных ситуаций» для назначения комплексов реабилитации пациентам с посттравматическими стрессовыми расстройствами.

Результаты используются при выполнении курсовых, дипломных и научно-исследовательских работ студентами кафедры комплексной информационной безопасности электронно-вычислительных систем Томского государственного университета систем управления и радиоэлектроники (КИБЭВС ТУСУР).

Разработанные программные комплексы используются для извлечения знаний из истории о продажах в томском ресторане доставки «Хочу суши» (ИП Муравский Е.В. ОГРНИП 31170