автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений
Автореферат диссертации по теме "Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений"
На правах рукописи
ТОМАКОВА Римма Александровна
ГИБРИДНЫЕ МЕТОДЫ И АЛГОРИТМЫ ДЛЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ КЛАССИФИКАЦИИ СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ
Специальность 05.13.17 - Теоретические основы информатики
(в науке и технике)
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук
3 О МАЙ 2013
Белгород 2013
005060667
Работа выполнена на кафедре биомедицинской инженерии федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Юго-Западный государственный университет»
Емельянов Сергей Геннадьевич,
доктор технических наук, профессор
Вольфенгаген Вячеслав Эрнстович, доктор технических наук, профессор, профессор кафедры кибернетики федерального государственного автономного образовательного учреждения высшего профессионального образования «Национальный исследовательский ядерный университет «МИФИ», г.Москва
Глушак Александр Васильевич, доктор физико-математических наук, профессор, заведующий кафедрой прикладной математики и информационных технологий, декан факультета математики и информационных технологий федерального государственного автономного образовательного учреждения высшего профессионального образования «Белгородский государственный национальный исследовательский университет», г. Белгород
Истомина Татьяна Викторовна, доктор технических наук, профессор, профессор кафедры № 901, федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Московский авиационный институт (национальный исследовательский университет)» (МАИ), г. Москва
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Воронежский государственный технический университет», г.Воронеж
Защита диссертации состоится «26» июня 2013 года в 15.00 часов на заседании диссертационного совета Д 212.015.10 на базе ФГАОУ «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ») по адресу: 308015 г. Белгород, ул. Победы, д.85, ауд.3-8, к.15.
С диссертацией можно ознакомиться в библиотеке ФГАОУ ВПО «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ») по адресу: 308015 г. Белгород, ул. Победы, д.85.
Автореферат разослан « /£» 2013 г.
Ученый секретарь диссертационного совета кандитат технических наук, старший научный сотрудник
Научный консультант
Официальные оппоненты:
Ведущая организация
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Многие направления науки, техники и производства в значительной степени ориентируются на развитие систем, в которых информация представлена в виде изображений. При обработке такой информации возникает ряд сложных научных, технических и технологических проблем. На сегодняшний момент наиболее сложными являются анализ и распознавание изображений. О важности этой проблемы говорит тот факт, что исследования по распознаванию образов, анализу изображений и речи включены в перечень приоритетных направлений развития науки и техники и критических технологий федерального уровня.
В настоящее время интенсивно развиваются интеллектуальные системы, предназначенные для описания формы анализируемых изображений или выделения из них метрической или семантической информации. Анализ семантики является вершиной иерархической процедуры обработки изображений, сложность которой связана с тем, что изначально эта процедура решает нечеткую задачу.
Решению проблемы анализа и распознавания изображений посвящены работы отечественных , и зарубежных ученых, среди которых следует выделить труды Д. Балларда, Е. Дэвиса, Р. Гонсалеса, Ю.И. Журавлева, В.А. Сой-фера, Ж. Серра, Д. Марра, А. Демпстера, Г. Шафера, М. Павель, Ю.П. Пыть-ева, Я.А. Фурмана, Л.П. Ярославского. За последние десятилетия создано множество успешных систем машинного зрения, в которых в тех или иных сочетаниях используются разработанные ими парадигмы и подходы.
Тем не менее, существует ряд проблем, связанных с классификацией изображений, которые не решены в настоящее время. Для успешной классификации изображений необходима априорная информация о структуре и свойствах мира. Однако многие факторы (деформация формы, перекрытие, переход от ЗО-сцен к 2Б-изображениям и т.п.) снижают ценность априорных данных и затрудняют семантическую сегментацию изображения, при которой каждый сегмент рассматривается как объект определенного класса. В итоге изображение имеет альтернативные структуры, решение по выбору одной из которых не может быть принято однозначно, основываясь на принятой картине мира. Определим этот класс изображений как сложноструктури-руемые. Следовательно, если изображение является сложнострукгурируе-мым, то это ведет к значительному снижению качества его классификации или классификации его сегментов посредством обучаемых классификаторов.
Сложноструктурируемому изображению характерно искажение границ сегментов и появление ложных сегментов, а также наличие древовидных структур. Поэтому использование известных локальных градиентных операторов выделения границ и оконтуривающих морфологических операторов не дает ожидаемого эффекта в связи с тем, что они привязываются к априорно заданной картине мира и не анализируют локальные результаты принятого решения и многоальтернативные решения.
В настоящее время научно-техническое направление классификации сложноструктурируемых изображений активно развивается. В последнее десятилетие предложены методы определения дескрипторов изображений и их сегментов, позволяющие построить признаковые пространства, устойчивые к ряду аффинных преобразований, шуму, изменению в освещении: SIFT (Scale Invariant Feature Transform), SURF (Speeded Up Robust Features), PCA-SIFT (PCA - Principal Component Analysis) и т.д. Но эти дескрипторы предназначены для работы в интеллектуальных системах поиска аналогичных и подобных изображений, а не в системах классификации. В настоящее время для классификации успешно применяются алгоритмы, такие как Bagging и Boosting, основанные на использовании множества базовых классификаторов с последующей агрегацией их решений, направленной на снижение ошибок первого и второго рода. Использование этих алгоритмов предполагает наличие больших объемов выборок, позволяющих осуществить настройку множества классификаторов. Однако существует достаточно большой класс сложноструктурируемых изображений, для которых обеспечить необходимый объем обучающей выборки принципиально невозможно. Это, в частности, относится к медицинским изображениям, где эти ограничения обусловлены наличием сочетанной патологии и сложностью экспериментов на живых объектах. В этом случае для классификации целесообразно использовать методы и алгоритмы, основанные на различных парадигмах, что позволяет построить гибридные модели классификации, которые применяют как методы обучаемых систем распознавания образов, так и методы экспертного оценивания. Гибридные модели целесообразно использовать и в случае иерархической семантической классификации, когда для окончательной классификации необходимо учитывать не только класс сегмента, но и его геометрические характеристики и масштаб.
В качестве обучаемых систем классификации изображений в настоящее время наиболее часто используются искусственные нейронные сети. Однако известные структурно-функциональные решения для искусственных нейронных сетей не могут быть эффективно применены при анализе и классификации сложноструктурируемых изображений ввиду ограниченности объемов обучающих выборок и высокой степени пересечения классов в признаковом пространстве. Ограниченность объема обучающей выборки компенсируется посредством использования методов экспертного оценивания, основанных на нечетком логическом выводе. Но в случае классификации сложноструктурируемых изображений использование этих методов не приводит к приемлемому результату из-за того, что методология нечеткого вывода слабо адаптирована под задачи классификации. Поэтому отсутствие методов и алгоритмов разработки гибридных классификаторов сложноструктурируемых изображений является серьезной проблемой, затрудняющей и замедляющей разработку новых приложений и практических систем в области компьютерного зрения. В связи с этим возникает проблемная ситуация, связанная с противоречием между возможностями современной компьютерной и оптико-электронной техники и недостаточностью теоретической базы при
ее использовании в системах классификации, основанных на анализе сложноструктурируемых изображений.
Указанное противоречие определяет постановку и решение актуальной проблемы повышения качества анализа и классификации сложнострук-турируемых изображений на основе гибридных методов классификации при ограничениях на объемы обучающих выборок и высоком уровне пересечения классов в пространстве информативных признаков.
Объект исследования. Интеллектуальные системы анализа данных и поддержки принятия решений.
Предмет исследования. Методы, модели и алгоритмы для интеллектуальных систем сегментации и классификации сложноструктурируемых изображений.
Целью диссертационной работы является развитие методологии классификации сложноструктурируемых изображений на основе гибридных сетевых структур как средств унифицированного подхода к семантическому анализу яркостно-геометрических моделей изображений.
В соответствии с поставленной целью в работе решаются следующие основные задачи:
- анализ современного состояния методов и средств сегментации и классификации сложноструктурируемых изображений, исследование их критических свойств, поиск новых модификаций и обобщений этих методов, повышающих эффективность принятия решений;
- разработка математических и алгоритмических средств формирования интеллектуальных морфологических операторов, предназначенных для сегментации сложноструктурируемых изображений;
- разработка метода формального описания геометрических свойств сегментов сложноструктурируемых изображений, позволяющего получать адекватные пространства информативных признаков, предназначенных для сетевых моделей их классификации;
- разработка математического и алгоритмического обеспечения для гибридных нейросетевых структур, позволяющих осуществлять анализ и классификацию сложноструктурируемых изображений на основе их яркост-но-геометрического описания;
- создание специальных методов, алгоритмов и программного обеспечения анализа изображений для интеллектуальных систем прогнозирования и диагностики функционального состояния сложных объектов;
- проведение экспериментальных исследований интеллектуальных систем анализа и классификации сложноструктурируемых изображений для оценки релевантности полученных информативных признаков, а также обоснование эффективности разработанных информационных технологий при использовании их в интеллектуальных системах поддержки принятия решений по классификации и идентификации функциональных состояний сложных объектов.
Методы и средства исследований. Для решения поставленных задач использовались математический аппарат линейной алгебры, теория вероятностей, аппарат морфологического анализа изображений, теория нейронных
сетей и распознавания образов, методология спектрального анализа, теория множеств, методы экспертного оценивания и принятия решений. При разработке нейросетевых моделей и модулей нечеткого вывода в качестве инструментария использовался MATLAB 7.10 с графическим интерфейсом пользователя для Neural Network Toolbox и со встроенным пакетом Fuzzy Logic Toolbox.
Степень достоверности результатов проведенных исследований
обеспечивается корректным использованием математического аппарата, соответствием результатов вычислительных экспериментов выдвигаемым в диссертации положениям и выводам качественного характера, а также результатами практического использования методов, предложенных в диссертационной работе. Работоспособность разработанных методов и алгоритмов подтверждена статистикой обработки большого объема реальных изображений, отсутствием противоречий с известными положениями теории и практики анализа и классификации изображений.
Научную новизну составляют следующие результаты.
1. Метод сегментации сложноструктурируемых изображений, построенный на основе гибридной обработки исходного полутонового изображения, отличающийся тем, что процесс получения бинарного изображения, отражающего морфологическую структуру исходного изображения, разбит на три последовательных этапа: на первом этапе получают градиентное изображение, на втором этапе - препарированное градиентное изображение, а на третьем этапе осуществляют переход к бинарному изображению, отражающему контуры границ сегментов исходного изображения, осуществляемый посредством нечеткой нейросетевой модели.
2. Интеллектуальный оператор, предназначенный для формирования границы сегмента, реализованный в виде многослойной нечеткой сети, включающей базу решающих правил и агрегирующие и классифицирующие слои, позволяющий реализовать итерационный процесс активации пикселей границы сегмента.
3. Метод построения математической модели сегмента произвольной формы, основанный на морфологической обработке бинарных или полутоновых растровых изображений, отличающийся тем, что путем использования цепочки, состоящей из четырех морфологических операторов, множество пикселей изображения, описывающих границу сегмента, дополняется до двух непересекающихся подмножеств, границы которых устанавливаются по нижней и верхней границам координат пикселей, входящих в исходное изображение, позволяющий представить изображение произвольной кривой, в том числе и незамкнутой, в виде контура, имеющего формализованную структуру.
4. Метод формирования пространства информативных признаков для нейронной сети, классифицирующей кривую произвольной формы, основанный на определении дескрипторов Фурье соответствующего контура, отличающийся тем, что после получения отсчетов спектра Фурье контура число спектральных отсчетов дополняется нулевыми отсчетами, амплитуда
спектральных составляющих увеличивается на величину, прямо пропорциональную величине расширения спектра, обусловленной добавлением нулевых отсчетов, а затем число дескрипторов Фурье отсекается до оптимального значения, определяемого путем минимизации функционала ошибки, позволяющий получить адекватную классификационную модель независимо от числа отсчетов в анализируемых контурах.
5. Математическое и алгоритмическое обеспечение для проектирования многомодульных сетевых структур, предназначенных для классификации объектов по их полихроматическим изображениям, включающее:
- математическую модель для построения универсальных сетевых структур, предназначенных для классификации двухальтернативных выборок при решении задач сегментации сложноструктурируемых изображений;
- сетевую структуру классификации двухальтернативных данных, включающую два решающих модуля и отличающуюся тем, что первый решающий модуль имеет сетевую структуру, соответствующую модели Арнольда-Колмогорова, в котором узлы первого скрытого слоя выполняют нелинейные отображения, узлы второго скрытого слоя - нейроны айаИпе, а второй решающий модуль предназначен для управления формой нелинейных отображений в первом скрытом слое первого решающего модуля в зависимости от окружения анализируемого пикселя изображения, позволяющую формировать границу сегмента произвольной формы;
- модель гибридной нейронной сети, отличающуюся параллельным включением нейронных сетей прямого распространения, настроенных на классификацию сегментов по пространственно-яркостным характеристикам пикселей изображения, и последовательно включенной радиально-базисной нейронной сетью, позволяющую классифицировать морфологические образования на растровых сложноструктурируемых изображениях;
- модели нейронных сетей с макрослоями, которые используют для диагностических заключений по группам информативных признаков, получаемых по различным методикам и технологиям.
6. Комплекс алгоритмов для формирования и функционирования многомодульных сетевых структур, предназначенных для анализа сложно-структурируемых изображений, включающий:
- алгоритм функционирования нейронной сети с макрослоями, классифицирующей сегменты цветного изображения, построенный по двухступенчатой схеме, отличающийся тем, что на первой ступени обрабатывают изображение, полученное в результате сегментации исходного полутонового изображения после обработки морфологическим оператором «эрозия», а на второй ступени - изображение, полученное после обработки исходного черно-белого изображения посредством морфологического оператора «дилата-ция», при этом на каждой ступени решение принимается на основе агрегации двух оценок, полученных в результате анализа цвето-яркостных характеристик сегмента и характеристик формы сегмента; при этом на первой ступени завышают число ошибок первого рода, а на второй ступени - число ошибок
второго рода, а окончательное решение принимается на основе сопоставления решений, принятых на первой и на второй ступенях обработки;
- алгоритмы формирования моделей сетевых структур для классификации пикселей на сложноструктурируемом изображении, отличающиеся использованием итерационных процедур настройки решающих модулей и итерационным процессом управления структурой скрытых слоев решающих модулей, входящих в настраиваемую модель, которые позволяют получать модели сетевых структур, удовлетворяющие априорно заданным параметрам качества классификации;
- структуру базы данных обучающих выборок для нейронных сетей с макрослоями, отличающуюся тем, что записи в обучающих выборках распределены по двум уровням, причем для каждой Ь-й выборки г'-ые строки (записи) в первом и втором уровнях относятся к одному и тому же сегменту изображения, а атрибуты для /-го сегмента Ь-й выборки на втором уровне получены из атрибутов ¿-й выборки /-го сегмента на первом уровне посредством их анализа модулями обработки цветного и черно-белого изображений;
- алгоритм автоматизированного получения интегрированных моделей решающих модулей для классификации сегментов сложноструктурируемых изображений, отличающийся адаптацией классифицирующей модели к анализируемому изображению, осуществляемый, по меньшей мере по двум контурам управления;
- программное обеспечение для формирования сетевых моделей, предназначенных для классификации пикселей сегментов сложноструктурируемых изображений, включающее интерактивные среды настройки функциональных блоков сетевых структур и реализованное в среде МаНаЬ 7.10.
Практическая ценность диссертационной работы состоит в применении разработанных в ней методов и процедур анализа и классификации сложноструктурируемых изображений в ряде практических задач, в том числе в геоинформационных системах, в системах гематологического анализа, в автоматизированных системах гистологических исследований, в автоматизированных системах для офтальмологических исследований. Использование предлагаемых технических решений позволило повысить оперативность и достоверность принимаемых решений в системах диагностики и лабораторного анализа.
Реализация результатов исследования осуществлена: в НИЦ (г.Курск) ФГУП «18 ЦНИИ» МО РФ, Курском ОАО «Прибор», ОБУЗ «Офтальмологическая клиническая больница - Офтальмологический центр» (г.Курск), НУЗ «Отделенческая больница на ст. Курск ОАО «РЖД», ОБУЗ «Курская городская больница №1 им. Н.С. Короткова»; в учебном процессе факультета информатики и вычислительной техники ФГБОУ ВПО «Юго-Западный государственный университет» при подготовке специалистов по специальности «Биотехнические аппараты и системы», «Инженерное дело в медико-биологической практике».
Внедрения подтверждаются соответствующими документами.
Связь с научными и инновационными программами.
Диссертационные исследования проводились в рамках выполнения ряда проектов следующих программ фундаментальных, поисковых и инновационных исследований:
- федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы», государственные контракты № П705, № П2088, № П424;
- гранта Минобрнауки России на 2012-2013 годы «Гибридные технологии анализа и классификации сложноструктурируемых изображений для медицинских приложений» (Соглашение № 14. В37.21.1970).
Положения, выносимые на защиту.
1. Математические модели, схемы алгоритмической реализации и практическое использование теории формирования интеллектуальных морфологических операторов, позволяющие рассматривать сегментацию сложноструктурируемых изображений с позиций гомеостатического моделирования на основе гибридных нейросетевых структур, объединяющих парадигмы нейронных сетей прямого распространения и нечеткого моделирования.
2. Метод и схемы алгоритмической реализации для построения и спектрального анализа контуров произвольной формы, позволяющие использовать методологии спектрального и морфологического анализа сигналов и изображений для классификации сегментов полутоновых и/или цветных сложноструктурируемых изображений.
3. Методы и алгоритмические средства формирования гибридных нейросетевых структур, позволяющие осуществлять анализ и классификацию сложноструктурируемых изображений по их цвето-яркостным и геометрическим характеристикам с последующей агрегацией решений.
4. Модели нейронных сетей с макрослоями, позволяющие принимать многоальтернативные решения по результатам нейросетевого анализа групп информативных признаков, получаемых по различным методикам и технологиям.
5. Специальное математическое, алгоритмическое и программное обеспечение для интеллектуальных систем классификации сложноструктурируемых изображений.
6. Типовые структурно-функциональные решения по анализу сложно-структурируемых изображений, апробация которых в системах поддержки принятия решений по классификации сложных объектов показала их преимущество перед известными техническими решениями.
Специальность, которой соответствует диссертация. Содержание диссертации соответствует паспорту специальности 05.13.17 - теоретические основы информатики (технические науки) по следующим областям исследования:
и.5. Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений;
п.7. Разработка методов распознавания образов, фильтрации, распознавания и синтеза изображений, решающих правил.
Апробация результатов диссертационных исследований.
Основные положения диссертации докладывались и получили положительную оценку на 24 научно-технических конференциях: Международная конференция по аппликативным вычислительным системам «АВС'2012» (Москва) в 2012 году; Международная научная конференция «Информационные технологии и компьютерные системы для медицины» (Маврикий) в 2012 году; Международная научная конференция «Компьютерное моделирование в науке и технике» (Андорра) в 2012 году; Международная научная конференция «Физика и радиоэлектроника в медицине и экологии ФРЭМЭ» (Владимир) в 2010, 2012 годах; Международная научно-техническая конференция «Оптико-электронные приборы и устройства в системах распознавания образов и обработки изображений и символьной информации» (Курск) в 2012 году; Международная научная конференция «Современные наукоемкие технологии» (Испания-Франция) в 2012 году; Международная научная конференция «Фундаментальные и прикладные исследования в медицине» (Сочи) в 2012 году; Международная научно-практическая конференция «Перспективы развития информационных технологий» (Новосибирск) в 2011, 2012 годах; Международная научно-практическая конференция «Медико-экологические информационные технологии» (Курск) в 2009, 2010, 2011 годах; Международная научно-техническая конференция «Компьютерные науки и технологии» (Белгород) в 2011 году; Международная научно-практическая конференция «Интегративные процессы в науке» (Москва) в 2010, 2011 годах; Международная научная конференция «Лазерно-информационные технологии в медицине, биологии и геоэкологии» (Новороссийск) в 2008,2009,2010, 2011 годах; Всероссийская научно-техническая конференция «Информационные и управленческие технологии в медицине и экологии» (Пенза) в 2009 году; Международная научно-техническая конференция «Информационно-измерительные диагностические и управляющие системы» (Курск) в 2009 году; Всероссийская научно-техническая конференция «Искусственный интеллект в XXI веке. Решения в условиях неопределенности» (Пенза) в 2008 году; Международный радиоэлектронный форум «Прикладная радиоэлектроника. Состояние и перспективы развития» (Харьков) в 2008 году.
Публикации. По результатам исследований опубликованы 59 работ, из них 21 работа - в изданиях из списка ВАК РФ, 3 монографии, 2 заявки на изобретение, 2 свидетельства о регистрации программы, 23 публикации материалов докладов, 8 статей в других изданиях.
Структура и объем диссертации. Диссертация состоит из введения, 6 глав, заключения и двух приложений. Работа изложена на 296 страницах машинописного текста, включающего 127 рисунков, 21 таблицу и список литературных источников из 211 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертации, сформулирована проблема, цель и задачи исследований, научная новизна и практическая ценность, приведены результаты реализации работы.
В первой главе выполнен анализ состояния предметной области: введено понятие сложноструктурируемого изображения, особенностей его получения, обзор существующих методов обработки изображений, а также описание основных направлений развития способов сегментации и классификации изображений. Приведен анализ основных направлений развития алгоритмов сегментации и классификации сложноструктурируемых изображений.
Многие изображения не имеют четкого морфологического описания сегментов и относятся к классу сложноструктурируемых изображений. Очень часто изображения получают в условиях различной освещенности как всего изображения, так и его частей. Также возникают ситуации, когда сегменты, относящиеся к одному и тому же классу, на различных изображениях имеют различную цветовую окраску. Во многих случаях сложности при сегментации изображения обусловлены тем, что объемные изображения с явно выраженными сегментами проецируются на двумерную плоскость. Проекции сегментов накладываются друг на друга, при этом образуются псевдосегменты или искаженные сегменты, что приводит к снижению ценности априорных данных.
По результатам проведённого анализа сделаны следующие выводы.
1. Задача повышения качества сегментации и классификации сложноструктурируемых изображений является актуальной в диагностических и научных исследованиях. 2. Большинство объектов на сложноструктурируемых изображениях является слабоконтрастным и характеризуется большой вариабельностью геометрических и оптических характеристик, в связи с чем при анализе подобных изображений возникают определенные трудности. Поэтому для выбора эффективных методов сегментации и классификации требуется использование гибридных информационных технологий.
Для реализации гибридных технологий сегментации и классификации сложноструктурируемых объектов в системах искусственного интеллекта в диссертации предложено использовать нейросетевые и нечеткие технологии, которые позволяют устранить недостатки формальных логических систем.
Большинство способов сегментации включают последовательную обработку изображения градиентным и пороговым операторами. Как правило, используют два анизотропных градиентных оператора, в результате чего получают изображение, каждый пиксель которого характеризуется двумя параметрами, определяемыми как
Ы^дв/дх; С1у=дС/ду,
(1) (2)
где й - исходное (сегментируемое) растровое изображение, С1-изображение, полученное в результате обработки изображения в градиентным оператором; х иу- направления, характеризующие анизотропию градиентного оператора.
Однако операторы типа (1)-(2) и последующие операторы пороговой обработки не удовлетворяют критериям точности выделения границ сегментов, так как не учитывают морфологические особенности изображения и помех. Поэтому наиболее рациональным решением проблемы сегментации представляется использование гибридных технологий сегментации и классификации изображений, включающих совместное использование градиентных методов обработки, нечеткой логики принятия решений и нейросетевого моделирования.
Во второй главе разработаны теоретические аспекты получения граничных кривых для сложноструктурируемых изображений, учитывающие главное требование к процедуре анализа - подбор оптимальной системы признаков, позволяющие сократить размерность признакового пространства. Показано, что для надежного выделения граничных кривых на сложноструктурируемых изображениях необходима модель системы искусственного интеллекта, способная осуществлять выбор из множества альтернативных решений. В работе предлагается модель, обладающую такими способностями, назвать «интеллектуальным морфологическим оператором».
Для сегментации сложноструктурируемых изображений разработан метод, реализующий три последовательных этапа: на первом этапе получают градиентное изображение, согласно операторам (1) и (2); на втором - препарированное градиентное изображение £2; на третьем - выполняют переход к бинарному изображению, отражающему контуры границ сегментов исходного изображения, осуществляемый посредством интеллектуального морфологического оператора, построенного на основе нечеткой нейросетевой модели.
Бинарное изображение границ сегментов а может быть получено непосредственно из градиентных изображений а или 02. Сетевая модель преобразования изображения 61 в изображение ОЗ показана на рис.1. Эта модель включает пять слоев. За основу формирования слоя взята девятиэле-ментная маска с восьмью направлениями в (в = 0,7) в активном пикселе, определяющими возможные координаты следующего пикселя границы сегмента. Для формирования множества альтернативных решений по выбору пикселя границы сегмента сформированы три решающих правила. Эти правила реализуются тремя слоями сети (см. рис. 1), четвертый слой агрегирует решающие правила для каждой из восьми альтернатив, а пятый слой, включающий всего один узел, активирует только один пиксель из восьми, для которого функция активации 2, полученная в результате агрегации трех решающих правил, имеет наибольшее значение.
Первое решающее правило поддерживает утверждение о том, что движение границы сегмента должно осуществляться в направлении, перпендикулярном направлению градиента яркости.
1-е решающее правило
2 3 4 5
слой слой слой слой слой
Рис. 1. Пятислойная модель нечеткой сети, реализующей интеллектуальный оператор выделением границ сегмента
Второе решающее правило поддерживает утверждение, что наибольшую уверенность активации имеет тот пиксель, аргумент градиента которого Ц/, наиболее близок к аргументу градиенту текущего активизированного пикселя у/9, то есть необходимо проверить условие:
/=1,8. (3)
Третье решающее правило основано на том положении, что яркость активируемого пикселя должна быть близка к яркости предшествующего пикселя границы сегмента:
|/9-/,|-мшп, / = Тд (4)
Таким образом, в первом слое сетевой модели (см. рис.1) происходит формирование условий для трех используемых решающих правил. Второй слой сети (см. рис.1) реализует математическую обработку условий, полученных в первом слое. Для первого решающего правила (узлы 1-1 ...1-8) математическая обработка сводится к нахождению минимального значения сигнала, приходящего в узел. В узел поступают два сигнала, каждый из которых вычисляется в первом слое как
/ = й§. (5)
В каждом из узлов второго слоя вычисляется минимальный сигнал, который и поступает на третий слой (узлы 1-1 ... 1-8):
и^иЦ^'), (6)
где к = Г8; в, 1вк .
В узлах второго слоя вычисляются правые части уравнений (3), (4) и (6) соответственно.
В третьем слое осуществляется формирование нечетких решающих правил. Каждое из трех решающих правил выполняет нелинейное преобразование величин, вычисленных в узлах второго слоя, в соответствующее число, лежащее в диапазоне 0 ... v. Величина v определяет вес решающего правила, задается эмпирически с последующим его уточнением в зависимости от вида исследуемого объекта и качества изображений (наличие шума) и лежит в диапазоне 0...1.
В качестве преобразований используем нелинейные преобразования кусочно-линейного типа, или гауссианы.
Таким образом, имеем три решающих правила:
51 = /,(и1); (7)
52 = /2(м2); (8)
53 = /З(«3), (9) где и\, и2, иЪ - выходы узлов второго слоя (вычисляются в каждом / -м узле, ¡ = Т,8).
Нелинейное преобразование 51 описывается следующим выражением: О при и1<-я74;
(4-у1/я)-м1 + VI при -яг/4<м1<0; -(4-у1/я-)-и1 + VI при 0<и1 < я74; О при м1>я74.
Нелинейное преобразование 52 позволяет оценить уверенность в выборе пикселя границы сегмента на основе сравнения аргументов градиента в текущем и выбираемом пикселе.
Кусочно-линейная аппроксимация функции 52 аналогична (10).
Нелинейное преобразование 53 позволяет оценить уверенность в выборе границы пикселя на основе сравнения яркостей текущего и выбранного пикселя. Нелинейная зависимость 53 имеет кусочно-линейную аппроксимацию, аналогичную 51 и 52.
В четвертом слое сети осуществляется агрегация решающих правил 51,52,53 для каждого из восьми пикселей девяти элементной маски.
В пятом слое выбирается один из восьми пикселей, агрегирующая функция 2 для которого имеет максимальное значение. Максимальное значение этой функции определяется путем сравнения ее значений в восьми пикселях. Для осуществления сравнения вводится расстояние в пространстве (51, 52, 53) с использованием манхэтгенской метрики. Агрегатор определяется как
2 = 51 + 52 + 53. (11)
Одной из основных процедур выделения границы сегмента является определение конца границы сегмента. В качестве детектора конца границы сегмента используется следующее решающее правило: Если { (последующая координата пикселя границы вышла за кадр изображения) или (последующая координата пикселя границы сегмента уже выбрана) }, то «конец границы сегмента», иначе « текущий пиксель принадлежит границе сегмента». (12)
Разработанные модели и алгоритмы реализованы в пакете МаЙаЬ 7.10 и апробированы на задачах сегментации сложноструктурируемых изображений.
В третьей главе разработаны алгоритмы спектрального анализа граничных кривых произвольной формы. В результате сегментации сложно-структурируемые изображения представляются в виде граничных кривых, которые имеют разнообразные формы. Граничные кривые рассматриваются как растровые бинарные или полутоновые изображения. Для описания формы этих кривых использован математический аппарат, посредством которого кривая любого типа преобразуется к формализованному виду, позволяющему представить ее множеством коэффициентов Фурье.
С этой целью разработан метод морфологического описания граничной кривой, основанный на теоретико-множественном подходе и отличающийся тем, что множество точек, описывающих граничную кривую, представляется в виде двух непересекающихся подмножеств, границы которых устанавливаются по нижней и верхней границам координат точек, входящих в исходное множество, позволяющий представить любую кривую, в том числе и незамкнутую, в виде периодической двумерной числовой последовательности.
Пусть функция Р(х,у) представлена в файле данных в виде последовательности координат пикселей
(x^lkeK, (13)
таким образом, что множество {(xk,yk)}j является объединением двух непересекающихся подмножеств Pt и Qt, то есть
{(w*)W/Uß, (14)
где множество
(15)
[G е К„ inf(g) = arg xt(g) = 1, sup(g) = arg^(g) = n], в котором элементы упорядочены по возрастанию^, а множество
(16)
[L е К,, inf(^) = argxN((.) = n, sup(0 = arg*,(() = 2N - 2] , в котором элементы упорядочены по убыванию хе, при этом в паре {(Vs)}'eF' и {(XN+(N-g)>yNHN-g))}iSQi
yN+(N.g)>yg, (17)
а в паре
{(W<)}/£^ И {(XNHN-tyyNHN-())},GQi
xt>xN+(N_iy (18)
Граничные кривые не являются замкнутыми для всех возможных топологий сегментов, поэтому не удовлетворяют условиям (16) и (17). Для замыкания граничных кривых разработан метод, основанный на морфологической обработке бинарных изображений, позволяющий описать граничную кривую, в том числе и принадлежащую к классам самопересекающихся и древовидных (рис.2,а), контуром формализованной структуры, описываемой множествами Pj и Qiy удовлетворяющими условиям (14-18), который назовем «контуром минимальной толщины» (рис.2,б).
а) б)
Рис. 2. Преобразование древовидной граничной кривой в «контур минимальной толщины»: а - исходная кривая (I - ветвление); б - «контур минимальной толщины», соответствующий кривой а
Метод позволяет трансформировать исходную границу сегмента в «контур минимальной толщины», используя пять последовательно выполняемых морфологических операций над растровым изображением границы сегмента (сегментом): imfill (заполнение отверстий на исходном бинарном изображении); skel (строит остов изображения); dilate (совершает дилатацию с использованием структурообразующего элемента 3x3); bwperim (выделяет
границы бинарных объектов); shrink (сжимает объекты без внутренних дыр в точки, а с дырами - в кольца).
Первый и последний операторы применяются для устранения артефактов, связанных с наличием изолированных пикселей на границе контура и возможностью неоднозначного обхода контура. Назначение остальных морфологических операторов иллюстрирует рис. 3.
в) г)
Рис. 3. Трансформация тестового изображения граничной кривой в процессе осуществления цепочки морфологических преобразований: а - исходная граничная кривая; б - исходная граничная кривая осуществления морфологических операций imfill —> skel\ в - исходная граничная кривая после осуществления морфологических операций imfill —> skel—* dilate; г - исходная граничная кривая после осуществления морфологических операций imfill —> skel-*
dilate—* bwperim
Так как кривая, описываемая множествами Pi и <2,-. замкнутая, следовательно, она является периодической, и для ее описания в пространстве информативных признаков может быть использовано дискретное преобразование Фурье.
В качестве отсчетов используем отсчеты, полученные на дискретной сетке с равномерным шагом по оси абсцисс, вычисленным как
Л = (%-xl)/N, (19)
где 2N-2 - число отсчетов, описываемых границы контура, причем для растрового изображения число элементов в множествах Р. и Qt одинаково (равно N) и их индексация соответствует условию
xk=xN+(N_k), V (хк,ук)еР„ V{xN+iN_k),yN<N_k))&Qr (20)
Объединение множеств Pj и Qt рассматриваем как массив упорядоченных комплексных чисел
\zc=xc+jycl С = 1,2,...,2ЛГ-2; (21)
для анализа, которого применяем спектральное преобразование Фурье.
После представления границы «контура минимальной толщины» множеством (20), получаем дискретное преобразование Фурье конечной последовательности z(k) :
т = (22)
2Н-2 £О для и = 0,1,2.....2И -Ъ.
При использовании только М первых пар коэффициентов Фурье результатом восстановления является следующее приближение ¿(к):
'тЛ'те^1^ (23)
и=О
для £ = 0,1,2,...,2ЛГ-3.
Несмотря на то, что при вычислении каждой компоненты используется лишь М отсчетов, к по-прежнему пробегает весь диапазон от 0 до 2И-3, т.е. в приближенной границе будет то же самое число точек, но для восстановления их координат используется меньшее число отсчетов.
Дескрипторы Фурье позволяют синтезировать пространство информативных признаков в области пространственных частот для идентификации формы границы, при этом они должны быть инвариантны относительно перемещения и поворота. Инвариантность дескрипторов Фурье относительно масштаба не обязательна, однако изменение масштаба контура при решении задач классификации, в зависимости от конкретного случая, может являться как помехой, так и информативным источником.
Для того чтобы система распознавания была адекватна, необходимо, чтобы частотный диапазон, соответствующий дескриптору Фурье с определенным номером, не зависел от числа отсчетов в контуре, спектр которого вычисляется. Для обеспечения этого требования был разработан метод формирования пространства информативных признаков, позволяющий получить адекватную классификационную модель, независимо от числа отсчетов в анализируемых контурах, заключающийся в дополнении числа спектральных отсчетов до максимального в выборке путем добавления нулевых отсчетов слева и справа от граничных частот и увеличении амплитуды спектральных составляющих на величину, прямо пропорциональную величине расширения спектра, с последующим отсечением дескрипторов Фурье до числа, оптимальное значение которого определяется путем минимизации ошибки, вычисляемой как разность между площадью восстановленного контура и площадью исходного контура.
На первом этапе реализации метода задаем общее число отсчетов в контурах, которое должно быть одинаковым для всех контуров контрольных и обучающих выборок. Это число определяется по результатам статистических исследований изображений исследуемых классов. Для того чтобы сравнивать дискретные отсчеты частот, соответствующие разным контурам, необходимо, чтобы контуры имели одно и то же количество отсчетов (априорно полагается, что частота дискретизации у них одинакова и равна одному пикселю). Чтобы выровнять число отсчетов в выборке анализируемых контуров, необходимо довести их число в каждом контуре до максимального в выборке. Если заполнить высокочастотную часть спектральной полосы ну-
лями и тем самым довести число отсчетов в спектре каждого контура границы сегмента до максимальной в выборке, то в пространстве сигналов появятся виртуальные отсчеты между реальными отсчетами. Таким образом, первый этап реализует следующую цепочку преобразований: АГпих—>спектр—»дополнение нулями спектральных отсчетов до £тах.
В результате выполнения первого этапа в исходном пространстве появятся дополнительные (ненулевые) отсчеты. Поэтому на втором этапе необходимо все спектральные составляющие в спектре г'-го контура умножить на величину Гтах/А:;, что позволит привести модифицированное изображение и его спектральный образ в соответствие равенству Парсеваля.
Третий этап - оптимизация числа используемых дескрипторов. Для оптимального выбора числа анализируемых дескрипторов (под оптимальностью здесь понимается минимизация их числа) необходимо осуществить обратные преобразования Фурье модифицированного спектра контура и сравнить его с исходным контуром.
Учитывая, что преобразование Фурье обратимо, и используя уравнение (23), по дескрипторам Фурье можем восстановить границы контура исследуемого сегмента.
На рис. 4 показаны результаты контрольного сравнения исходного контура (рис.4, а) с двумя: восстановленными по пяти дескрипторам (рис.4, 6) и по 99 дескрипторам (рис.4, в). Более толстые линии восстановленных контуров на рисунках справа объясняются тем, что каждой точке контура на рис. 4, а соответствует несколько точек, расположенных на рис. 4,6 и в.
а) б)
Рис. 4. Третий этап: сравнение исходного контура с контуром, полученным после обратного преобразования Фурье модифицированного спектра контура
Чтобы оценить информационные потери при приравнивании к нулю части дескрипторов, предложен критерий восстановления контура, основанный на определении площади
Я = (24)
Л I—п '
где К - число отсчетов в контурах выборки, и координаты параметра к* (восстановленного контура), находящегося на минимальном расстоянии от к (исходного контура), причем для растровых изображений к= к*. Для «контура минимальной толщины»
к* =Ы{К12)+к (25)
и при отсутствии ошибки площадь 8=1. Если уравнение (24) применить к исходному контуру, то близость его правой части к единице станет условием того, что контур является «контуром минимальной толщины».
Для определения левой части (24) использовались известные приемы, например, критерий информационной осыпи Кэттеля.
Используя разработанные методы и алгоритмы спектрального анализа граничных кривых, получаем адекватное описание кривой произвольного типа конечной, априорно определенной длины последовательностью дескрипторов Фурье.
В четвертой главе исследуются теоретические аспекты разработки сетевых технологий, предназначенных для сегментации и классификации сложноструктурируемых изображений. Так как при решении задач такого класса возможно множество альтернативных решений, то необходимо иметь универсальную сетевую структуру, позволяющую объединить достоинства обучаемых систем и систем, работа которых осуществляется на основе экспертных технологий.
Универсальная сетевая структура построена на основе теоремы Арнольда-Колмогорова, согласно которой любая непрерывная функция п переменных /, заданная на единичном кубе и-мерного пространства Г = I х / х .../, может быть представлена в виде
2л+1
/{х^,х2,. ..,*„)=
ч=\
(26)
,р=1
где функции \(и)- непрерывные функции одной переменной, а функции срР(Хр) - фиксированные возрастающие, непрерывные, определенные на I = [0,1], стандартные (не зависящие от выбора функции/) функции.
Чтобы упростить процесс аппроксимации, заменим достаточно сложную гиперповерхность, соответствующую (26), гиперплоскостью
/{х^,х2,...,хп) = а1хх +а2х2 +...+апхп-Ь, (27)
где а, и Ь -константы (/ = 1, 2, ..., и).
При построении гиперплоскости (27) используется обучающая выборка, содержащая множество векторов {Хь Х2..^...Хт} определенного класса. В реальных системах классификации т>п и система линейных уравнений, посредством которой определяется гиперплоскость (27), переопределена, следовательно, соответствующая ей однородная система не имеет нетривиального решения.
Компонентам вектора Р={/(Хх)ЛХ2).../{Хт))Т присваиваются произвольные, одинаковые для каждого из разделяемых классов значения. В этом случае коэффициент Ъ целесообразно представить в виде нечеткого числа, которое описывается некоторой функцией принадлежности с базовой переменной, лежащей в диапазоне (±е). В случае такого представления область признакового пространства, соответствующая искомому классу, за-
клочена между двумя параллельными гиперплоскостями, отстоящими друг от друга на расстояние не более 2е. В наиболее благоприятном случае все векторы обучающей выборки лежат на гиперплоскости, заданной вектором Л=(а1а2 ...атЬ),с1е(Х^0 и £=0.
От одной пары параллельных гиперплоскостей осуществляется переход к множеству, непараллельных пар, пар параллельных гиперплоскостей путем расщепления исходной системы уравнений на множество подсистем и уменьшения расстояний между параллельными гиперплоскостями. Очевидно, что чем больше число пар гиперплоскостей, на которое расщепляется исходная пара гиперплоскостей, тем более сложной может быть форма аппроксимируемой функции.
На рис. 5 представлена сетевая структура, реализующая описанный способ аппроксимации, в котором исходная пара гиперплоскостей расщепле-
Рис. 5. Сетевая структура универсального классификатора
Сеть состоит из четырех слоев и является однородной. Первый (входной) слой определяет вектор состояния системы классификации. Второй слой синтезирует аппроксимирующие функции согласно уравнению (27). Для реализации этих функций в узлах второго слоя используются нейроны типа «ас]аИпе» с линейной функцией активации. Число X таких аппроксимирующих функций определяется структурой данных - обучающей выборкой - и априорно неизвестно.
Сеть, представленная на рис. 5, настроена на один класс - ЭТ, поэтому при поступлении на ее входы компонентов вектора Хр соответствующих исследуемому классу, на выходах нейронов второго слоя появятся числа, близкие к нулю. При этом наиболее близким к нулю будет выходу того нейрона, расстояние между соответствующей гиперплоскостью которого и точкой Х1
минимально. Решение принимается по минимальному значению из всех компонентов вектора состояния второго слоя (.у, у2 ...уг...ух), которые характеризуют степень близости вектора А" к классу 9?.
Так как выходы второго слоя могут приближаться к нулю с двух сторон, то над ними должны быть осуществлены симметричные нелинейные преобразования. В частном случае эти преобразования не зависят от выхода нейрона второго слоя и имеют или треугольную форму или форму гауссиана. При использовании нелинейных преобразований в четвертом слое сети реализуется операция «нечеткое или»:
шахСцОЛ МУ2)>-МУЛ -Ма(Ух)) = /(х„х7,...,х„). (28)
Аппроксимирующая модель для сетевой структуры рисунка 5 определяется следующим уравнением:
.....
2
(29)
где шах(М(*),ц2(*)) = £МЛ«> Л=2>/((*/(х,)) = !>(*/)• ,'=1 /=0 /=о
Сетевая структура на основе модели рис. 5, предназначенная для классификации двух альтернативных выборок, представлена на рис. 6.
Рис. 6. Сетевая структура для классификации пикселей сложноструктурируемых изображений
Так как объекты на сложноструктурируемых изображениях имеют различный уровень освещенности, то ЯвВ-коды не позволяют однозначно отделить сегменты изображения. Поэтому для повышения качества классификации необходимо либо ввести дополнительные информативные признаки, отражающие уровень освещенности в окрестности исследуемого пикселя, либо изменить вид используемого нелинейного отображения в зависимости от уровня освещенности, задавшись при этом определенным количеством уровней освещенности и для каждого уровня построив соответствующее нелинейное отображение. В данной работе используется последний подход. При этом выделяются три класса фона, которые определяются освещенностью (цветовой палитрой) зоны интереса на изображении.
На вход сети подаются два вектора информативных признаков. Первый вектор информативных признаков описывает атрибуты исследуемого пиксе-
ля. Он подается на первый решающий модуль (например, трехкомпонентный вектор 1ШВ-кодов).
На второй решающий модуль подается трехкомпонентный вектор фона, значение компонент которого определяется усредненными характеристиками 1ШВ-кодов пикселей в окрестности анализируемого пикселя, форма и размеры которой зависят от вида решаемой задачи. Второй решающий модуль осуществляет управление структурой первого решающего модуля, который настроен на класс 1, принадлежность к которому принимается на основании анализа исходных данных.
Для каждого класса фона у/к формируются три нелинейных отображения:
(Л), €к (О), <р1к (Я)|, *=1, 2, 3. (30)
В таком случае для каждого 1ШВ-кода строится три нелинейных отображения, соответствующие трем классам фона.
Для получения нелинейных отображений для первого скрытого слоя первого решающего модуля предложен алгоритм, реализующий следующие этапы: 1 - синтез обучающих выборок; 2 - формирование таблицы экспериментальных данных для параметра (параметров) описания фона, анализируемого пикселя в динамическом окне; 3 - ранжирование параметра фона; 4 -получение гистограмм 1ШВ-кодов сегментов для каждого из выделенных поддиапазонов параметра фона; 5 - синтез нелинейных отображений посредством интерактивной среды специального программного обеспечения.
Для реализации сетевой модели (рис.6), были разработаны соответствующие алгоритмическое и программное обеспечения, которые ориентированы на интерактивный режим работы. Укрупненная схема алгоритма формирования сетевой модели для классификации пикселей сложноструктури-руемого изображения показана на рис. 7.
В блоке 1 осуществляется формирование обучающих и контрольных выборок для классификации пикселей на «сегмент» и «не сегмент».
В блоке 2 осуществляется формирование обучающих выборок для второго решающего модуля. Второй решающий модуль выполнен на основе многослойных нейронных сетей прямого распространения. Исследования показали, что по критерию точности классификации целесообразно использовать нейронные сети блочной структуры.
Ранжирование уровня освещенности области интереса изображения осуществляется на экспертном уровне. Вектор информативных признаков получают посредством анализа 1ШВ-кодов пикселей, попавших в некоторое окно прямоугольной формы.
В блоке 3 формируются нелинейные отображения для настройки первого решающего модуля (см. рис. 7).
После завершения настройки второго решающего модуля (блок 4) устанавливается в единицу Флаг, который позволяет выполнять диспетчерские функции, осуществляющие переход от настройки первого решающего модуля ко второму в процессе итераций настройки системы, и осуществляется настройка первого решающего модуля.
После настройки первого решающего модуля осуществляются контрольные испытания сетевой системы в целом (рис. 7, блок 7). Так как они ничем не отличаются от контрольных испытаний первого решающего модуля, то Флаг позволяет перейти к следующей итерации настройки параметров второго решающего модуля после того, как ресурсы первого решающего модуля исчерпаны при заданных параметрах второго решающего модуля, и наоборот.
С
Начало
формирование обучающих и контрольных выборок класса «сегмент» и - «не сегмент»
-2" 1 Формирование обучающих и контрольных выборок класса «фон» },{*:>}
-3 формирование нелинейных отображений <р\, ^ ,
Все обучающие и контрольные выборки должны быть прикреплены к файлу исходного изображения, чтобы была возможность определить уровень освещенности в зоне анализируемого пикселя
Выборки предназначены для - настройки второго решающего [модуля
I Первый слой первого решающего [модуля
Г 6"
Настройка первого
решающего модуля
Контрольные испытания первого решающего модуля
Флаг=0
Рис. 7. Схема алгоритма формирования сетевой модели
Для предложенных в работе алгоритмов разработано программное обеспечение, позволяющее формировать сетевые модели, которые предназначены для классификации пикселей сложноструктурируемых изображений, включающее интерактивные среды настройки функциональных блоков сетевых структур, реализованное в среде Matlab 7.10 с графическим интерфейсом пользователя для Neural Network Toolbox и со встроенным пакетом Fuzzy Logic Toolbox.
Пятая глава посвящена теоретическим вопросам разработки алгоритмического и программного обеспечения, а также экспериментальным исследованиям интеллектуальных систем классификации сегментов на изображениях мазков периферической крови, построенных на основе теоретических положений, разработанных во второй, третьей и четвертой главах.
Форменные элементы крови классифицируются по двум независимым группам признаков. К первой группе относятся цветовые показатели - RGB-коды. Ко второй группе - геометрические параметры элемента - дескрипторы Фурье {л(а>п)}, n = UV.
Алгоритм классификации построен по двухступенчатой схеме, на каждой из которых выделяется четыре класса: «эритроцит» - «не эритроцит» и «лейкоцит» - «не лейкоцит».
На каждой ступени анализируются черно-белые изображения, полученные из исходных цветных изображений, с применением морфологических операторов «эрозия» и «дилатация». Установлено, что применение оператора «эрозия» приводит к увеличению числа ошибок первого рода за счет того, что часть форменных элементов, относящихся к классам «не лейкоцит» и «не эритроцит», «растворяется» в классах «эритроциты» и «лейкоциты». В свою очередь применение оператора «дилатация» приводит к увеличению числа ошибок второго рода за счет искусственного объединения форменных элементов крови. При этом число форменных элементов класса «не лейкоцит» и «не эритроцит» растет за счет лейкоцитов и эритроцитов.
В работе показано, что двухступенчатый анализ позволяет избежать ошибок второго рода, связанных с агломерацией (склеиванием) эритроцитов или образованием ауторозеток. На второй ступени анализируется изображение, в котором за счет искусственного склеивания эритроцитов между собой и эритроцитов и лейкоцитов получаем ложные форменные элементы классов «не лейкоцит» и «не эритроцит». Это уменьшает число ошибок первого рода при решении задачи выбора между классом «не лейкоцит и не эритроцит» и классом «лейкоцит».
Выходами блоков принятия решений каждой из ступеней анализа являются переменные Z1...Z3, которые рассматриваются как элементы нечетких множеств, соответствующих термам разделяемых классов.
Блоки принятия решений построены по принципу макрослоев, позволяющему объединить модули нейросетевых моделей. На рис. 8 приведена иллюстрация этого принципа на примере макрослоя для классификации по классам «эритроциты» - «не эритроциты» посредством двухуровневой схемы.
Решающие модули 1, 2, 3 (см. рис. 8) имеют два выхода, которые соответствуют двум разделяемым классам: «лейкоцит» - «не лейкоцит» или «эритроцит» - «не эритроцит».
На выходах нейронной сети присутствуют числа в диапазоне от нуля до единицы, которые интерпретируются как коэффициенты уверенности в принадлежности анализируемого сегмента к вышеперечисленным классам.
Рис. 8. Схемы соединения нейронных сетей для классификации форменных элементов крови на каждой ступени анализа по классам «эритроцит» - «не эритроцит» (модуль 1 может быть построен как на основе нейронной сети, так и на основе нечетких решающих правил)
Анализ выходов блоков принятия решений обеих ступеней осуществляется по правилам нечеткой продукции:
ЕслиXI = «не лейкоцит» и Х3 = «эритроцит», то 2\= «эритроцит»;
ЕслиХХ = «лейкоцит» иХ-4= «не эритроцит», то 12= «лейкоцит»;
Если Х2= «не лейкоцит» и Х4= «не эритроцит», то 23= ««не лейкоцит» и «не эритроцит»». (31)
Нечеткая сеть имеет три выхода, соответствующие классам, на которые классифицируются форменные элементы. Выбор соответствующего класса осуществляется по максимальному значению выхода. Если заданы нечеткие множества, соответствующие классам на выходе нечеткой сети, то имеется возможность воспользоваться известными методами дефуззификации, например, по среднему центру.
База данных микроскопических изображений имеет библиотеку шести стандартных окрасов мазков, взятых из практики работы различных лабораторий. В разработанной базе данных использовались шесть окрасов. База данных включает два уровня. На первом уровне хранятся выборки сегментов, предназначенные для обработки модулями 1 и 2 (см. рис. 8). После обработки каждой записи из выборки Ь, соответствующей первому уровню, этой записи ставится в соответствие запись в выборке Ь в базе данных второго уровня. Соответствие записей в выборках первого и второго уровней обеспечивает блок синхронизации записей данных.
Порядок формирования базы данных второго уровня состоит в следующем. Обучающая выборка с номером Ь подается на модуль обработки цветного изо-
бражения и модуль обработки черно-белого изображения. В результате записи 1-й выборки базы данных первого уровня соответствует /-я запись L-й выборки второго уровня. Такое соответствие записей обеспечивается посредством блока синхронизации. Обучающие выборки базы данных записей второго уровня используются для обучения модуля 3 принятия решений (см. рис. 8).
Входной информацией для формирования обучающей выборки служат пары файлов: файл цветного изображения мазка и бинарный файл сегментированного изображения на классы «форменные элементы» - «плазма». Процесс формирования обучающих выборок начинается с формирования третьего файла, который относится к базе данных обучающих выборок и содержит информацию о принадлежности каждого сегмента бинарного изображения к определенному классу.
Программное обеспечение для интеллектуальной системы классификации форменных элементов крови разработано в среде Matlab 7.10 в виде модуля MedlmProc.
На первом этапе формирования обучающей выборки программа MedlmProc осуществляет опрос сегментов согласно их нумерации, хранящейся во втором файле базы данных изображений (классификация сегментов обучающей выборки осуществляется в интерактивном режиме по данным из первого файла базы изображений).
Поля записей файла базы данных обучающих выборок формируются в автоматическом режиме в результате взаимодействия файлов цветного и сегментированного изображения и маркеров сегментов по классам.
На рис. 9 представлен алгоритм получения интегрированных моделей решающих модулей для классификации форменных элементов крови.
Алгоритм реализует непрерывный процесс получения моделей нейронных сетей, образующих блоки принятия решений по классификации форменных элементов крови, а также сам процесс классификации в результате «прогона» полученных моделей нейронных сетей на контрольных изображениях.
В блоках 1 и 2, а также 10 и 11 (рис. 9) формируются обучающие (контрольные) выборки и задается архитектура формируемой нейронной сети. Для обучения нейронных сетей используются блоки 5, 6, 7, и 8, а также блоки 12, 13, 14 и 15. Обучающую выборку, или входные данные для модели нейронной сети NET3, получают посредством «прогона» нейронных сетей NET1 и NET2 на соответствующих обучающих выборках (см. рис. 8).
Обучающие выборки формировались из сертифицированных баз данных: банка изображений американского общества гематологов (American Society of Hematology) и электронного атласа гематологии, доступных на сайте: http://hematologyatlas.com/.
В рамках эксперимента были проведены исследования качества классификации разработанной интеллектуальной системы классификации форменных элементов крови в сравнении с существующими программными комплексами анализа изображений.
К,з=8ОТ1СКЕТЗ, СЗ)
_ I«Прогон» обученной ЫЕТЗ, в результате чего ~ {формируется вектор выхода N£73 (Куэ)
с
3
Рис. 9. Алгоритм получения интегрированных моделей нейронных сетей для классификации форменных элементов крови
Эксперименты показали, что разработанное специальное программное обеспечение характеризуется меньшим числом ложных тревог (разрушенные клетки, скопления тромбоцитов, грязь, пятна краски, ошибочно принятые за лейкоциты) и превосходит аналогичные по показателям качества классификации в среднем на 4%, а также позволяет полностью исключить человека из процедуры классификации форменных элементов крови.
Шестая глава посвящена экспериментальным исследованиям системы поддержки принятия решения врача-офтальмолога, отражающей теоретические положения анализа и классификации сложноструктурируемых изображений, обоснованные в первых четырех главах диссертации.
Для анализа патологий глазного дна разработана автоматизированная система, которая позволяет осуществлять в интерактивном режиме измерения морфологических характеристик объектов глазного дна (области кровоизлияния, участки отслоения сетчатки, диск зрительного нерва, кровеносные сосуды и т.д.); документировать произведенные измерения, осуществлять наглядное сравнение изображений глазного дна пациента, относящихся к разным моментам времени; наблюдать изменения морфологических характеристик объектов глазного дна в ходе лечения; выполнять математическое моделирование глобальных и локальных свойств сосудов.
Программное обеспечение автоматизированной системы включает три модуля. Программный модуль 1 интегрирует все возможности обработки изображений, представленные в пакете МаНаЬ 7.10, а также дополнительные программы, позволяющие выполнять арифметические и логические операции в пространстве изображений и их спектров, а также выделять 1ШВ-составляющие цветных изображений.
Второй программный модуль предназначен для получения скалярных характеристик изображения или его фрагментов, таких как среднее арифметическое яркости пикселей или 1ЮВ-коды, моды, амплитуды мод, площади изображения. Этот программный модуль не имеет собственной интерактивной среды, и выбрать его функции можно посредством горизонтального меню изображения, хранящегося в файл-буфере. Если в файл-буфере находится обрабатываемое изображение, то второй программный модуль предоставляет возможность использования диагностических программ, построенных как на статическом анализе выделенных сегментов, так и на анализе их динамики в процессе терапевтических процедур.
Третий модуль программного обеспечения предназначен для визуализации патологических образований и морфологических структур изображения глазного дна и включает технологии нейронных сетей, ориентированные на работу с 1ШВ-кодами изображения, и технологии, реализованные на спектральном анализе контуров минимальной толщины.
Исследование эффективности спектрального анализа контуров минимальной толщины, с точки зрения разделимости классов, проводилось на выборке, состоящей из 352 элементов, из которых 214 элементов относятся к классу «норма» (слабо извилистые сосуды), 138 - к классу «патология» (из-
вилистые сосуды). Отнесение контура минимальной толщины к одному из классов производилось медицинским экспертом (офтальмологом).
Для разделения на два класса использовалась нейронная сеть прямого распространения. Контрольная выборка состояла из 90 элементов, отбор- которых носил случайный характер. В качестве расчетных показателей качества диагностических решающих правил использовались: диагностическая чувствительность (ДЧ), диагностическая специфичность (ДС), диагностическая эффективность решающего правила (ДЭ). На контрольной выборке эти параметры приняли следующие значения: ДЧ = 95%, ДС = 92%, ДЭ = 93%. Для сравнения выбраны три метода, обеспечивающие наиболее эффективные виды оценки извилистости сегментов, полученных автоматически (с использованием программных средств). Для этих методов показатель качества классификации принимает следующие значения: ДЭ1 = 91,3%; ДЭ2 = 89,5%, ДЭЗ = 89,1%.
Для надежной постановки диагноза или прогноза сосудистой патологии сетчатки необходимо кроме извилистости сосудов анализировать ряд других факторов, среди которых целесообразно выделить величину артериального давления, наличие атеросклероза, группу признаков, получаемых в результате опроса пациента, группу признаков, получаемых в результате осмотра и инструментальных исследований пациента.
Таким образом, на входе сетевой модели анализа и классификации сосудистой патологии глазного дна имеем некоторую совокупность групп информативных признаков, полученных в результате использования различных методик и технологий диагностики, которые необходимо интегрировать в единую сетевую структуру классификации.
Технология анализа патологических образований на изображении глазного дна включает два этапа. На первом этапе выделяются центральные линии сосудов сетчатки, которые определяют множество пикселей, по которым строятся контуры минимальной толщины. На втором этапе необходимо проверить гипотезу о принадлежности сосудов сетчатки к определенному классу. Гипотеза, как правило, двухальтернативная, поэтому при исследовании изображения на наличие патологических отклонений принимается бинарное решение: изображение принадлежит к искомому классу (патологии или морфологическому образованию) или не принадлежит.
Для формализации процесса классификации выделенной патологии необходимо поставить в соответствие вектор информативных признаков, коррелируемый с искомой патологией или морфологическим образованием.
Определив множество векторов информативных признаков, соответствующее выбранной совокупности методик и технологий диагностики, строим классифицирующие модели, позволяющие принять диагностическое решение.
Использование многослойных персептронов для классификации таких данных является затруднительным в связи с тем, что дополнительное обучение многослойного персептрона в некоторой области признакового пространства, например по группе признаков «опрос», приводит к потере обученного состояния в другой рабочей области нейронной сети, например по
группе признаков «осмотр». Это не позволяет использовать тип многослойных персептронов в задачах реального времени.
Поэтому при проектировании нейронных сетей для классификации сосудистых заболеваний сетчатки использовались нейронные сети с макрослоями (НСМ). В НСМ за каждую патологию I, определяемую по к-й группе информативных признаков, отвечает нейронная сеть прямого распространения КЕТ1к. Если выделяются I заболеваний сетчатки, то для каждой группы
информативных признаков 1к получаем макрослой, содержащий столько нейронных сетей прямого распространения, сколько заболеваний сосудов сетчатки выделяется данной НСМ. Число макрослоев определяется числом групп информативных признаков К, используемых для диагностики. Так как решения о принадлежности к заданному заболеванию сетчатки принимаются в каждом из К слоев НСМ, то НСМ должна иметь К+1 слой. Выходной слой предназначен для агрегирования решений, принимаемых в каждом слое, и тоже выполняется в виде макрослоя нейронных сетей прямого распространения.
Структурная схема НСМ, выполняющая все вышеперечисленные функции, представлена на рис. 10. Каждая нейронная сеть в макрослоях настраивается по алгоритму обратного распространения ошибки. Вначале настраиваются нейронные сети в К первых слоях. После их настройки осуществляется настройка нейронных сетей выходного слоя.
Нейронные сети в макрослоях имеют структуру, которая предполагает наличие нелинейных отображений в первом скрытом слое. Нелинейные отображения определяются для каждого из компонентов анализируемого вектора информативных признаков по диагностируемому заболеванию сок .
Рис. 10. Структурная схема нейронной сети с макрослоями
В качестве примера рассматривается интеллектуальная система, предназначенная для диагностики тромбоза центральной вены сетчатки и ее ветвей (ТЦВСиВ).
Оценка эффективности правил прогнозирования возникновения ТЦВСиВ производилась по показателю оценки вероятности правильной классификации искомого заболевания, вычисляемой через величину частости, определяемую на контрольной выборке относительно здоровых и больных ТЦВСиВ.
Объем контрольной выборки определялся по методике, принятой в медицинской практике. Для прогнозирования риска возникновения ТЦВСиВ использовалась выборка объемом в 100 пациентов. Отобранные 100 человек имели 80% факторов риска из выбранного перечня и наблюдались в течение 8 лет. Через 4 - 4,5 года у 93 человек отмечалось наличие претромбоза и начинающего тромбоза, что подтверждалось объективным анализом картины глазного дна. Таким образом, оценка вероятности правильного прогноза составляет 0,93 при одновременном наличии большинства факторов риска.
Результаты контрольной проверки качества классификации на контрольной выборке показали практическое совпадение с результатами экспертного оценивания (допустимая погрешность 3%), что позволяет сделать выводы о целесообразности использования полученных прогностических и диагностических правил для решения задач рационального управления лечебно-профилактическими мероприятиями при предупреждении и лечении тромбозов центральной вены сетчатки и ее ветвей.
Для решения задач классификации флюоресцентных ангиограмм глазного дна (ФАГД) разработан метод классификации морфологических образований, основанный на пространственно-яркостных характеристиках пикселей кортежа фотографий ФАГД.
Проиллюстрируем метод на клиническом примере анализа ФАГД, представленных на рис. 11. В верхней части рисунка показаны два снимка, соответствующие двум моментам времени: артериальная фаза и поздняя фаза. На приведенных снимках патологический сегмент находится в зоне пери-папиллярной неоваскуляризации (зоне патологического соскообразного разрастания сосудов).
Яркостной характеристикой окна является гистограмма яркости, которая показана в нижней части рис. 11. Гистограмма состоит из 14 элементов, которые используются в качестве информативных признаков на входе нейронной сети прямого распространения. Выбрав фотографию ФАГД с теми же координатами окна, для другого момента времени получаем другую гистограмму яркости. На рис.11,6 внизу показана такая гистограмма, полученная в окне с теми же координатами и тем же размером, но для изображения ФАГД рис. 11,6 вверху. Таким образом, каждое окно интереса описывается 14-элементным вектором, компоненты которого являются отсчетами гистограммы яркости пикселей в окне.
Так как яркость изменяется от снимка к снимку, то есть зависит от времени, то каждс ттвом гистограмм:
где *=1, 2, ..., К - номер снимка ФАГД, ранжированный во времени, К -число используемых для диагностики снимков ФАГД.
(32)
При моделировании нейронных сетей для классификации ФАГД воспользуемся гибридным подходом, который объединяет парадигмы нейронных сетей прямого распространения (НСПР) и радиально-базисных нейронных сетей (РБНС).
Рис.11. Фрагменты окон автоматизированной системы при анализе ФАГД: фотографии ФАГД при пролиферативной диабетической ретинопатии, полученные в артериальной фазе (а) и поздней фазе (б) - вверху, и соответствующие гистограммы яркости, полученные в выделенных окнах, - внизу (по осям абсцисс отложены восьмибитные коды яркости пикселей)
Если рассматривать НСПР как двухальтернативный классификатор, то после соответствующего обучения, при присутствии на входе вектора из множества (32), на выходе нейронной сети имеем величину г(о</<1), характеризующую степень принадлежности /-го входного вектора к классу ц.
Число нейронных сетей НСЫ определяется числом фотографических снимков ФАГД, используемых для анализа, то есть количеством реализаций К случайного процесса [Hg{ík)].
Процесс обучения ведется отдельно для каждой НСПР, входящей в модель, путем подбора соответствующей обучающей выборки:
(/*)],}, (33)
где ¿=соп51, I =сош1, т=\аг.
Параметр т определяет координаты и размеры окна, параметр I -класс (диагноз), параметр к - временную фазу флюоресценции и является постоянным для каждой НСПР, входящей в модель.
Настроив соответствующие сигмоиды нейронных сетей для каждого множества (33), получим на выходе нейронных сетей возможные комбинации, описываемые бинарной матрицей, число элементов которой определяется числом фотографий исследуемого изображения, представляющим элемент выборки.
Принимая во внимание то, что на выходе нейронных сетей может присутствовать любой вектор из диапазона 1.. .2К, а его компоненты не являются бинарными, в задачу агрегатора модели входит отнесение этого вектора к одному из двух классов, то есть получение бинарного скаляра Zt.
В качестве агрегатора используем РБНС. Имея на входе этой нейронной сети одну из строк бинарной матрицы, необходимо определить оператор W, который преобразует двоичный вектор в двоичный скаляр, то есть
4?(Y) = Zt, (34)
где
y=net ({x=cl({gk}m) , (35)
где net - операция нейросетевого моделирования; £2 - оператор, формирующий векторы информативных признаков X из отсчетов (пикселей) окна интереса {gk}m, т = \,м.
Координаты локальных центров РБНС определяют статистические характеристики выходов НСПР.
В процессе настройки сети нси входной вектор задается двумя параметрами: I - параметр, определяемый искомой патологией; к - параметр, определяемый номером фотографии ФАГД.
После настройки нейронных сетей прямого распространения осуществляется настройка параметров РБНС, которая используется в качестве агрегатора в гибридной нейронной сети.
Результаты диагностики различных стадий диабетической ретинопатии (ДР) у больных сахарным диабетом, полученные посредством разработанной автоматизированной системы, в сравнении с результатами диагностики посредством программы EyePacs, используемой в качестве прототипа скрининга ДР, подтвердили, что предложенные методы и алгоритмы позволяют повысить основные показатели качества диагностики ДР на 10... 15%.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
В диссертационной работе в рамках решения поставленной научно-технической проблемы повышения качества анализа и классификации слож-ноструктурируемых изображений на основе гибридных методов классификации при ограничениях на объемы обучающих выборок и высоком уровне пересечения классов в пространстве информативных признаков, получены следующие основные результаты.
1. Выполнен анализ современного состояния методов и средств классификации сложных объектов, основанных на анализе сложноструктурируемых изображений, исследованы их критические свойства, выявлены пути их модификаций, обеспечивающих повышение эффективности принятия решений.
2. Разработаны математические и алгоритмические средства формирования интеллектуальных морфологических операторов, предназначенных для сегментации сложноструктурируемых изображений, включающие:
- метод сегментации сложноструктурируемых изображений, построенный на основе гибридной обработки исходного полутонового изображения;
- интеллектуальный оператор, предназначенный для формирования границы сегмента, реализующий итерационный процесс активации пикселей границы сегмента.
3. Разработаны методы формального описания геометрических свойств сегментов сложноструктурируемых изображений, позволяющие получать адекватные пространства информативных признаков, предназначенные для сетевых моделей классификации, включающие:
- метод построения математической модели сегмента произвольной формы, основанный на морфологической обработке бинарных или полутоновых растровых изображений, позволяющий представить изображение любой кривой, в том числе и незамкнутой, в виде «контура минимальной толщины»;
- метод формирования пространства информативных признаков для нейронной сети, классифицирующей кривую произвольной формы, в том числе и незамкнутую, основанный на определении дескрипторов Фурье, позволяющий получить адекватную классификационную модель, независимо от числа отсчетов в анализируемых кривых.
4. Разработан аппарат математических и алгоритмических средств формирования гибридных сетевых структур, позволяющих осуществлять анализ и классификацию сложноструктурируемых изображений на основе их яркостно-геометрического описания, включающий:
- математическую модель для построения универсальных сетевых структур, предназначенных для классификации двухальтернативных выборок при решении задач сегментации сложноструктурируемых изображений;
- сетевую структуру классификации двухальтернативных данных, включающую два решающих модуля, позволяющую формировать границу сегмента произвольной формы;
- модель гибридной нейронной сети, позволяющую классифицировать морфологические образования на растровых сложноструктурируемых изображениях;
- модели нейронных сетей с макрослоями, которые используют для диагностических заключений по группам информативных признаков, получаемых по различным методикам и технологиям.
5. Создано специальное математическое, алгоритмическое и программное обеспечение для интеллектуальных систем классификации сложноструктурируемых изображений, включающее:
- алгоритм функционирования нейронной сети с макрослоями, классифицирующей сегменты цветного изображения, построенный по двухступенчатой схеме;
- алгоритмы формирования моделей сетевых структур для классификации пикселей на сложноструктурируемом изображении, позволяющие получать модели сетевых структур, удовлетворяющие априорно заданным параметрам качества классификации;
- структуру базы данных обучающих выборок для нейронных сетей с
макрослоями;
- алгоритм автоматизированного получения интегрированных моделей решающих модулей для классификации сегментов сложноструктурируемых изображений;
- программное обеспечение для формирования сетевых моделей, предназначенных для классификации пикселей сегментов сложноструктурируемых изображений, включающее интерактивные среды настройки функциональных блоков сетевых структур, реализованное в среде Matlab 7.10.
6. Проведены экспериментальные исследования интеллектуальных систем поддержки принятия решений, использующих предложенные методы и алгоритмы для анализа и классификации сложноструктурируемых изображений в области гематологического анализа и офтальмологии, клинические и лабораторные испытания которых показали:
- диагностическую эффективность при решении задачи классификации сосудов сетчатки глаза «норма» - «патология» 93%;
- уверенность в правильном принятии решений на уровне 0,9 при прогнозе и дифференциальной диагностике степени тяжести тромбозов центральной вены сетчатки и ее ветвей;
- превосходство по показателям качества аналогичных систем такого же назначения при выявлении больных диабетической ретинопатией в среднем на 14%;
- превосходство по показателям качества классификации аналогичных систем такого же назначения при определении межклеточных соотношений в среднем на 4%, а также снижение числа ложных тревог (разрушенные клетки, скопления тромбоцитов, грязь, пятна краски, ошибочно принятые за лейкоциты).
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в рецензируемых научных журналах из перечня ВАК
1. Томакова, P.A. Нейросетевые модели в автоматизированных системах анализа фотографий флюоресцентных ангиограмм глазного дна [Текст] / P.A. Томакова, A.A. Маслак, H.A. Швецова // Биомедицинская радиоэлектроника. 2012 —№ 4. - С.56-61.
2. Томакова, P.A. Метод обработки сложносегментируемых изображений с использованием многослойных морфологических операторов [Текст] / P.A. Томакова //Известия Юго-Западного государственного университета.
Серия «Управление, вычислительная техника, информатика. Медицинское приборостроение». 2012. -№ 2, ч.2. - С. 158-164.
3. Томакова, P.A. Программное обеспечение и анализ плохоструктури-рованных изображений в пакете MATLAB для медицинских приложений [Текст] / P.A. Томакова // Ученые записки Российского государственного социального университета (Москва). 2012. -№ 2(102). -С.350-355.
4. Томакова, P.A. Спектральные технологии морфологического описания сегментов в задачах классификации сложноструктурированных изображений [Текст] / P.A. Томакова, В.В. Серебровский, JI.B. Шульга [и др.]// Известия Юго-Западного государственного университета. 2012. -№ 1(40), ч. 1. - С.22-28.
5. Томакова, P.A. Метод обработки и анализа сложноструктурируемых изображений на основе встроенных функций среды MATLAB [Текст] / P.A. Томакова, С.А. Филист // Вестник Читинского государственного университета 2012.-№ 1 (80). - С.3-9.
6. Томакова, P.A. Нечеткие нейросетевые технологии для выделения сегментов с патологическими образованиями и морфологическими структурами на медицинских изображениях [Текст] / P.A. Томакова, С.А. Филист,
A.A. Насер // Биомедицинская радиоэлектроника. 2012. -№ 4. - С.43-49.
7. Томакова, P.A. Универсальные сетевые модели для задач классификации биомедицинских данных [Текст] / P.A. Томакова, С.А. Филист, Яа Зар До // Известия Юго-Западного государственного университета. 2012. -№ 4(43). -С.44-50.
8. Томакова, P.A. Гибридные технологии на основе многомерного спектрального анализа и нейросетевого моделирования для обработки офтальмологических изображений глазного дна [Текст] / P.A. Томакова, М.А. Ефремов, A.A. Насер//Наукоемкие технологии. 2012. Т.13,-№9.-С.59-65.
9. Иванов, A.B. Интеллектуальная система морфологического анализа патологических изменений при ретинопатии [Текст] / A.B. Иванов, P.A. Томакова,
B.Н. Мишустин // Известия Юго-Западного государственного университета. 2012.-№ 2(41), ч.1. ~ С. 19-27.
10. Томакова, P.A. Проектирование гибридной нейронной сети для анализа сложноструктурированных медицинских изображений [Текст] / P.A. Томакова, // Системный анализ и управление в биомедицинских системах. 2011 Т. 10, -№ 4. - С.916-923.
11. Томакова, P.A. Нечеткая сетевая модель интеллектуального морфологического оператора для формирования границ сегментов [Текст] / P.A. Томакова, С.А. Филист, В.В. Руденко // Научные ведомости БелГУ. -Белгород: Изд-во БелГУ, 2011. -№ 1(96). Вып. 17/1. - С.188-195.
12. Томакова, P.A. Способ сегментации плохоструктурированных изображений на основе нечеткой сетевой модели [Текст] / P.A. Томакова // Ученые записки Российского государственного социального университета. (Москва). 2011. -№ 6(94). - С.377-408.
13. Томакова, P.A. Гибридные технологии выделения медленных волн из квазипериодических сигналов [Текст] / P.A. Томакова, М.А. Ефремов, С.А. Филист [и др.]// Известия Юго-Западного государственного университета. 2011 -№ 1(34). - С.66-73.
14. Томакова, P.A. Анализ гистологических изображений посредством морфологических операторов, синтезированных на основе преобразования Фурье и нейросетевого моделирования [Текст] / P.A. Томакова, С.А. Филист, с.а. Горбатенко [и др.]//Биотехносфера. 2010. -№3(9). -С.54-60.
15. Борисовский, С.А. Нейросетевые модели с иерархическим пространством информативных признаков для сегментации плохоструктуриро-ванных изображений [Текст] / С.А. Борисовский, А.Н. Брежнева, P.A. Томакова// Биомедицинская радиоэлектроника. 2010. -№ 2. -С.49-53.
16. Брежнева, А.Н. Нейросетевые модели сегментации ангиограмм глазного дна на основе анализа RGB кодов пикселей [Текст] / А.Н.Брежнева, С.А. Борисовский, P.A. Томакова // Системный анализ и управление в биомедицинских системах. 2010. Т.9, -№ 1.-С.72-77.
17. Белобров, А.П. Нейросетевые модели морфологических операторов для сегментации изображений биомедицинских сигналов [Текст] / А.П. Белобров, С.А. Борисовский, P.A. Томакова // Известия Южного федерального университета. Серия «Технические науки». Тематический выпуск «Медицинские информационные системы». Таганрог. 2010. -№ 8.-С.28-32.
18. Томакова, P.A. Способ сегментации ангиограмм глазного дна на основе нейросетевого анализа RGB-кодов пикселей [Текст] / P.A. Томакова, А.Н. Брежнева, С.А. Филист // Известия Южного федерального университета. Серия «Технические науки». Тематический выпуск «Перспективы медицинского приборостроения». Таганрог. 2009. - № 9. - С.171-176.
19. Брежнева, А.Н. Спектральный анализ сегментов изображения глазного дна для количественной оценки сосудистой патологии [Текст] / А.Н. Брежнева, P.A. Томакова, С.А. Филист // Биомедицинская радиоэлектроника. 2009. - № 6. -С.15-18.
20. Пихлап, C.B. Нечеткие нейросетевые структуры для сегментации изображений глазного дна [Текст] / C.B. Пихлап, P.A. Томакова, С.А. Филист // Вестник Воронежского государственного технического университета. 2009.
Т.5, -№ 4. - С.42-45.
21. Филист, С.А. Математическая модель системы автоматического регулирования давления в сердечно-сосудистой системе [Текст] / С.А. Филист, A.A. Кузьмин, P.A. Томакова // Системный анализ и управление в биомедицинских системах. 2005. Т.4, -№ 1. -С.50-53.
Монографии
22. Томакова, P.A. Интеллектуальные технологии сегментации и классификации биомедицинских изображений [Текст] / P.A. Томакова, С.Г. Емельянов, С.А. Филист. - Курск: Юго-Зап. гос. ун-т, 2012. - 222с.
23. Томакова, P.A. Компьютерные технологии обработки и анализа микроскопических изображений биоматериалов [Текст] / P.A. Томакова, С.Г. Емельянов, С.А. Филист. - Курск: Юго-Зап. гос. ун-т, 2011.-214с.
24. Томакова, P.A. Теоретико-множественный подход и теория графов в обработке сложноструктурируемых изображений [Текст]/ P.A. Томакова, О.В. Шаталова, М.В. Томаков. - Курск: Юго-Зап. гос. ун-т, 2012. - 119с.
Патенты, заявки на патенты и свидетельства о госрегистрации программ
25. Заявка 2012133594 Российская Федерация. Способ сегментации сложноструктурируемых растровых полутоновых изображений на основе составных морфологических операторов/ Томакова P.A., Филист С.А., Коре-невский H.A. [и др.]; заявитель Юго-Западный государственный университет. № 2012133594; заявл. 27.07.2012; приоритет 06.08.2012.
26. Заявка 2012128471 Российская Федерация. Устройство для контроля анизотропии электрической проводимости биотканей/ Томакова P.A., Филист С.А., Кузьмин A.A. [и др.]; заявитель Юго-Западный государственный университет. № 2012128471; заявл. 19.06.2012;приоритет 06.07.2012.
27. «Программное обеспечение морфологического спектрального анализа изображений» Свидетельство о государственной регистрации программы для ЭВМ, № 2011613254 от 26.04.2011 года / С.А. Борисовский, P.A. Томакова.
28. «Программа построения разделяющей границы на основе потенциальных функций» Отраслевой фонд алгоритмов и программ «Государственный координационный центр информационных технологий». Свидетельство об отраслевой регистрации разработки № 9937от 04.02.2008 года Р.А.Томакова, И.С. Зерин, А.О. Зиборов [и др.].
Наиболее значимые статьи, опубликованные в других изданиях
29. Tomakova, R.A. Measurement of intercellular relations in peripheral blood on the basis of hybrid algorithm/ R.A. Tomakova, S.A. Filist, E.V. Ru-dakova// International journal of experimental education. 2012. -№ 3. - P. 26-28.
30. Томакова, P.A. Методы описания форм сложноструктурируемых изображений на основе спектрального анализа граничных кривых [Текст] / Томакова P.A., A.A. Насер, С.А. Борисовский //Перспективы развития информационных технологий: сб. тр. IX Междунар. науч.-практ. конф.- Новосибирск: Изд-во НГТУ, 2012. - С.44-50.
31. Емельянов, С.Г. Интеллектуальные операторы в задачах морфологического анализа плохоструктурированных изображений [Текст] / С.Г. Емельянов, P.A. Томакова, А.Н. Брежнева [и др.] // Лазеры. Измерения. Ин-формация—2011: сб. тр. XXI Междунар. конф. - СПб.: Изд-во политехи, унта, 2011. Т. 3. -С.145-155.
32. Томакова, P.A. Информационные технологии для исследования эритроцитометрических показателей крови на основе дескрипторов Фурье [Текст] / P.A. Томакова, С.А. Филист, Л.В. Шульга // Известия Юго-Западного государственного университета. Серия «Управление, вычислительная техника, информатика. Медицинское приборостроение». 2011. - № 1. - С.67-74.
33. Томакова, P.A. Использование вейвлет-преобразования дня синтеза образов квазипериодических сигналов в спектральной области [Текст] / P.A. Томакова, А.П. Белобров, С.А. Филист // Лазеры. Измерения. Информация 2010: сб. тр. XX Междунар. конф. — СПб.: Изд-во политехи ун-та 2010 Т 3 — С. 159-169.
34. Томакова, P.A. Модели сегментации ангиограмм глазного дна на основе нечеткого анализа RGB-кодов пикселей [Текст] / P.A. Томакова, А.Н. Брежнева, С.А. Филист // Лазеры. Измерения. Информация-2009: сб. тр. IXX Междунар. конф. - СПб.: Изд-во политехи, ун-та, 2009. Т. 3. - С. 281-289.
35. Томакова, P.A. Прогнозирование адаптационных возможностей человека на основе принципа «Порядка и хаоса» [Текст] / P.A. Томакова, С.А. Филист // Медицинские приборы и технологии: межвуз. сб. науч. ст. - Тула: Изд-во ТулГУ, 2005. - С.185-188.
36. Филист, С.А. Модель системы автоматического регулирования давления в сердечно-сосудистой системе [Текст] / С.А. Филист, A.A. Кузьмин, P.A. Томакова // Медицинские приборы и технологии: межвуз. сб. науч. ст. -Тула: Изд-во ТулГУ, 2005. - С.181-184.
Материалы докладов, опубликованные в трудах меяедународных и всероссийских конференций
37. Томакова, P.A. Гибридные информационные технологии для анализа и классификации сложноструктурируемых биомедицинских изображений [Текст] / P.A. Томакова, А.Н. Брежнева //Аппликативные вычислительные системы (АВС'2012): тр. III Междунар. науч. конф. -М., 2012.-С.27.
38. Томакова, P.A. Математическое обеспечение распознавания и классификации сложноструктурируемых биологических объектов [Текст] / P.A. Томакова, A.A. Насер, О.В. Шаталова // Компьютерное моделирование в науке и технике: матер. Междунар. науч. конф. Опубл. в Междунар. журнале прикладных и фундаментальных исследований. 2012. -№4. -С.48-49.
39. Томакова, P.A. Гибридный алгоритм измерения межклеточных соотношений в периферической крови [Текст] / P.A. Томакова, С.А. Филист, H.A. Швецова // Информационные технологии и компьютерные системы для медицины: матер. Междунар. науч. конф. Опубл. в Междунар. журнале прикладных и фундаментальных исследований. 2012. -№2. -С.87-89.
40. Томакова, P.A. Универсальные сетевые структуры в задачах классификации многомерных данных [Текст] / P.A. Томакова, А.А.Насер [и др.] //Фундаментальные и прикладные исследования в медицине: матер. Междунар. науч. конф. Опубл. в журнале «Современные наукоемкие технологии». 2012. -№ 8. -С.48-51.
41. Томакова, P.A. Нейронные сети с макрослоями для классификации флюоресцентных ангиограмм глазного дна [Текст] / P.A. Томакова, С.А. Филист, А.А.Насер // Физика и радиоэлектроника в медицине и экологии ФРЭМЭ 2012: тр. X Междунар. науч. конф. - Владимир, 2012.-С.178-182.
42. Томакова, P.A. Метод принятия решений по классификации состояний живых систем на основе гибридного подхода к обработке данных о системных ритмах [Текст] / P.A. Томакова, И.И. Волков // Современные наукоемкие технологии: матер. Междунар. науч. конф. Опубл. в Междунар. журнале прикладных и фундаментальных исследований. 2012. -№7. - С.48-51.
43. Насер, A.A. Исследование эффективности сегментации плохострук-турированных изображений на основе чередования морфологических опера-
торов типа «размыкание» - «замыкание» [Текст] / A.A. Насер, P.A. Томакова // Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации: матер. X Между-нар. науч.-техн. конф. - Курск, 2012. - С.302-304.
44. Томакова, P.A. Спектральные методы в идентификации плохострукгу-рированных объектов [Текст]/Р.А. Томакова, А.Н. Брежнева, H.A. Швецо-ва//Лазерно-информационные технологии в медицине, биологии и геоэкологии-2010: тр. XIX Междунар. науч. конф. - Новороссийск, 2011. - С.82-84.
45. Емельянов, С.Г. Структура гибридной нейронной сети для анализа флюоресцентных ангиограмм глазного дна [Текст] / С.Г. Емельянов, P.A. Томакова, А.Н. Брежнева // Интегративные процессы в науке - 2011: матер. Междунар. науч.-практ. конф,-М., 2011. -С.34-39.
46. Томакова, P.A. Метод классификации для плохоструктурированных черно-белых изображений [Текст] / P.A. Томакова, О.В. Шаталова, H.A. Швецова // Компьютерные науки и технологии: тр. II Междунар. науч.-техн. конф. - Белгород: НИУ «БелГУ», 2011. - С.661-665.
47. Томакова, P.A. Анализ биомедицинских изображений различными методами сегментации, основанными на операторах вычисления градиента [Текст] / P.A. Томакова, С.А. Филист, О.В. Шаталова // Перспективы развития информационных технологий: матер. III Междунар. науч.-практ. конф. - Новосибирск, 2011. 4.1. - С.146-150.
48. Томакова, P.A. Способ морфологического анализа для сегментации изображений [Текст] / P.A. Томакова, М.А. Ефремов // Медико-экологические информационные технологии - 2011: матер. XIV Междунар. науч.-практ. конф -Курск, 2011. -С.215-219.
49. Брежнева, А.Н. Сегментация гистологических структур посредством адаптивных морфологических операторов и пороговой обработки [Текст] /А.Н. Брежнева, С.А. Борисовский, P.A. Томакова // Физика и радиоэлектроника в медицине и экологии (ФРЭМЭ-2010): тр. IX Междунар. науч. конф. - Владимир, 2010.-С.302-304.
50. Борисовский, С.А. Исследование дескрипторов Фурье при частотной селекции масштабных преобразований [Текст] / С.А. Борисовский, P.A. Томакова, С.А. Филист // Интегративные процессы в науке - 2010: матер. Междунар. науч.-практ. конф. -М., 2011. -С.11-14.
51. Томакова, P.A. Морфологический анализ плохоструктурированных изображений биоматериалов на основе преобразования Фурье границ сегментов и нейросетевого моделирования [Текст] / P.A. Томакова, А.Н. Брежнева, С.А. Борисовский [и др.] // Лазерно-информационные технологии в медицине, биологии и геоэкологии-2010: тр. XVIII Междунар. науч. конф. - Новороссийск, 2010.-С.76-77.
52. Ефремов, М.А. Исследование эффективности сегментации плохоструктурированных изображений на основе чередования морфологических операторов типа «размыкание»- «замыкание» [Текст] / М.А. Ефремов, В.В. Руден-ко, P.A. Томакова // Медико-экологические информационные технологии-2010: матер. XIII Междунар. науч.-практ. конф.-Курск, 2010. -С.224-227.
53. Брежнева, А.Н. Модель сегментации ангиограмм глазного дна на основе нечеткого анализа RGB-кодов пикселей [Текст] / А.Н. Брежнева, P.A. Томакова, С.А. Филист // Лазерно-информационные технологии в медицине, биологии и геоэкологии-2009: тр. XVII Междунар. науч. конф. - Новороссийск, 2009. -С.88-90.
54. Пихлап, C.B. Способ настройки нейронной сети в гибридной системе идентификации объектов на изображении [Текст]/С.В. Пихлап, И.А. Ключиков, P.A. Томакова // Медико-экологические информационные технологии-2009: матер. XII Междунар. науч.-практ. конф. - Курск, 2009. - С.173-175.
55. Пихлап, C.B. Способ получения функций принадлежности, предназначенных для нечеткой сегментации изображений глазного дна по RGB-кодам [Текст] / C.B. Пихлап, P.A. Томакова, И.А. Ключиков //Информационно-измерительные диагностические и управляющие системы: матер. III Всерос. науч.-техн. конф. - Пенза, 2009. -С.19-21.
56. Пихлап, C.B. Гибридная нейронная сеть для сегментации изображений глазного дна с интерактивным синтезом эталонов [Текст] / C.B. Пихлап, И.А. Ключиков, P.A. Томакова // Информационно-измерительные диагностические и управляющие системы. Диагностика-2009: матер. Междунар. науч.-техн. конф.-Курск, 2009. -С.141-144.
57. Пихлап, C.B. Спектральный анализ изображений глазного дна в автоматизированной системе диагностики сосудистых патологий [Текст] /C.B. Пихлап, P.A. Томакова, И.А. Ключиков// Искусственный интеллект в XXI веке. Решения в условиях неопределенности: матер. VI Всерос. науч.-техн. конф. - Пенза, 2008. - С.46-48.
58. Пихлап, C.B. Автоматизированная система анализа сосудистой патологии глазного дна [Текст] / C.B. Пихлап, P.A. Томакова, С.А. Филист // Лазерно-информационные технологии в медицине, биологии и геоэкологии-2008: тр. XVI Междунар. науч. конф. - Новороссийск, 2008. - С.43-44.
59. Пихлап, C.B. Интерактивная среда для обработки и анализа изображений глазного дна [Текст] / C.B. Пихлап, P.A. Томакова, С.А. Филист // Прикладная радиоэлектроника. Состояние и перспективы развития (МРФ-2008): тр. III Междунар. радиоэлектронного форума. - Харьков, 2008. - С. 75-78.
Подписано в печать 22.03.2013. Формат 60x84 1/16. Печатных листов 2,0. Тираж 100 экз. Заказ 22. Юго-Западный государственный университет, 305040 г. Курск, ул. 50 лет Октября, 94. Отпечатано в ЮЗГУ.
Текст работы Томакова, Римма Александровна, диссертация по теме Теоретические основы информатики
МИНОБРНАУКИ РОССИИ
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Юго-Западный государственный университет»
(ЮЗГУ)
05201351191
На правах рукописи
ТОМАКОВА Римма Александровна
ГИБРИДНЫЕ МЕТОДЫ И АЛГОРИТМЫ ДЛЯ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ КЛАССИФИКАЦИИ СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ
05.13.17 - Теоретические основы информатики
Диссертация на соискание ученой степени доктора технических наук
Научный консультант доктор технических наук, профессор, лауреат премии Правительства Российской Федерации в области науки и техники Емельянов Сергей Геннадьевич
Курск 2013
СОДЕРЖАНИЕ
ВВЕДЕНИЕ..........................................................................................................................................5
ГЛАВА 1. МЕТОДЫ И СРЕДСТВА КЛАССИФИКАЦИИ СЛОЖНЫХ ОБЪЕКТОВ НА ОСНОВЕ АНАЛИЗА
С ЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ..........................................................18
1.1. Сложные объекты и методы их описания....................................................18
1.2. Математические модели изображений............................................................25
1.3. Анализ методов и алгоритмов сегментации сложноструктурируемых изображений......................................................................................29
1.3.1. Сегментация на основе пороговой обработки..................................33
1.3.2. Методы сегментации, основанные на кластеризации..............36
1.3.3. Методы сегментации, основанные на градиентных операторах............................................................................................................................................................37
1.3.4. Сегментация с помощью модели..................................................................41
1.4. Математическая морфология и обработка изображений..............46
1.5. Процедуры и методы классификации изображений..........................49
1.6. Цели и задачи исследований....................................................................................52
ГЛАВА 2. ИНТЕЛЛЕКТУАЛЬНЫЕ ОПЕРАТОРЫ ДЛЯ
СЕГМЕНТАЦИИ СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ... 55
2.1. Обобщенный алгоритм сегментации сложноструктурируемых изображений......................................................................................55
2.2. Синтез морфологического оператора для препарирования изображения £1................................................................................................................................................61
2.3. Нечеткая модель формирования бинарного изображения границы сегмента............................................................................................................................................72
2.4. Выводы второй главы....................................................................................................85
ГЛАВА 3. МЕТОДОЛОГИЯ СПЕКТРАЛЬНОГО ОПИСАНИЯ 8?
КРИВЫХ СЛОЖНОЙ ФОРМЫ ...................................................
3.1. Метод морфологической обработки бинарных изображений.. 87
3.2. Исследования методов спектрального представления контуров минимальной толщины................................................... 96
3.3. Выбор и оптимизация числа используемых дескрипторов Фурье при анализе границ сегментов сложноструктурируемых изображений............................................................................ 104
3.4. Выводы третьей главы................................................. 113
ГЛАВА 4. РАЗРАБОТКА И ИССЛЕДОВАНИЯ СЕТЕВЫХ ТЕХНОЛОГИЙ, ПРЕДНАЗНАЧЕННЫХ ДЛЯ КЛАССИФИКАЦИИ
СЕГМЕНТОВ НА СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЯХ 115
4.1. Разработка универсальной сетевой структуры для задач двухальтернативной классификации............................................................................................115
4.2. Нейросетевые структуры для сегментации изображений по параметрам пикселей и их окрестностей....................................................................................124
4.2.1. Структура первого решающего модуля................................................127
4.2.2. Структура второго решающего модуля..............................................135
4.3. Алгоритмическое и программное обеспечение моделирования решающих модулей..............................................................................................139
4.4. Выводы четвертой главы............................................................................................148
ГЛАВА 5. РАЗРАБОТКА АЛГОРИТМОВ ИДЕНТИФИКАЦИИ СЕГМЕНТОВ НА ИЗОБРАЖЕНИЯХ МАЗКОВ ПЕРИФЕРИЧЕСКОЙ КРОВИ................................................................................... 150
5.1. Алгоритм измерения межклеточных соотношений
в периферической крови............................................................................................................................150
5.2. Модуль анализа цветного изображения сегмента................................158
5.3. Модуль анализа сегментов черно-белого изображения..................176
5.4. Структура базы данных для настройки модуля принятия решений....................................................................................................................................................................180
5.5. Программное обеспечение интеллектуальной системы классификации форменных элементов крови........................................................................183
5.5.1. Общая структура программного обеспечения................. 183
5.5.2. Программный модуль сегментации микроскопических изображений мазков крови.......................................................... 187
5.5.3. Программный модуль для классификации форменных элементов крови....................................................................... 192
5.5.4. Схема формирования файлов обучающих выборок.......... 199
5.5.5. Алгоритм формирования интегрированных моделей решающих модулей для классификации форменных элементов крови.... 210
5.6. Экспериментальные исследования разработанной системы анализа микроскопических изображений форменных элементов крови... 212
5.7. Выводы пятой главы.................................................... 219
ГЛАВА 6. ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ АНАЛИЗА СЛОЖНЫХ ОБЪЕКТОВ И СЛОЖНОСТРУКТУРИРУЕМЫХ ИЗОБРАЖЕНИЙ В ОФТАЛЬМОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ.. 223
6.1. Структура автоматизированной системы поддержки
принятия решений врача-офтальмолога.......................................... 223
6.2. Экспериментальные исследования эффективности классификации извилистости сосудов сетчатки................................. 226
6.3. Нейронные сети с макрослоями для классификации и прогнозирования сосудистой патологии глазного дна........................ 230
6.4. Формирование нелинейных отображений на входах НСМ для диагностики и прогнозирования тромбоза центральной вены
сетчатки и ее ветвей.................................................................. 233
6.5. Оценка эффективности правил прогнозирования и диагностики степени тяжести тромбозов центральной вены сетчатки и
ее ветвей................................................................................. 240
6.6. Разработка нейросетевых моделей принятия решений по результатам анализа фотографий флюоресцентных ангиограмм
глазного дна............................................................................ 242
6.7. Экспериментальные исследования качества сегментации изображения глазного дна при различных видах патологий.................. 258
6.8. Экспериментальные исследования автоматизированной системы анализа изображений сетчатки глаза диагностики диабетической ретинопатии......................................................... 261
6.9. Выводы шестой главы.................................................. 266
ЗАКЛЮЧЕНИЕ................................................................. 269
СПИСОК ПРИНЯТЫХ ОБОЗНАЧЕНИЙ И СОКРАЩЕНИЙ........ 272
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ..................... 274
ПРИЛОЖЕНИЕ А............................................................ 297
ПРИЛОЖЕНИЕ Б............................................................ 305
ВВЕДЕНИЕ
Актуальность исследования. Многие направления науки, техники и производства в значительной степени ориентируются на развитие систем, в которых информация представлена в виде изображений. При обработке такой информации возникает ряд сложных научных, технических и технологических проблем. Одной из самых сложных из них на сегодняшний момент являются анализ и распознавание изображений. О важности этой проблемы говорит тот факт, что исследования по распознаванию образов, анализу изображений и речи включены в перечень приоритетных направлений развития науки и техники и критических технологий федерального уровня.
В настоящее время интенсивно развиваются интеллектуальные системы, предназначенные для описания формы анализируемых изображений или выделения из них метрической или семантической информации. Анализ семантики является вершиной иерархической процедуры обработки изображений, сложность которой связана с тем, что изначально эта процедура решает нечеткую задачу.
Решению проблемы анализа и распознавания изображений посвящены работы отечественных и зарубежных ученых, среди которых следует выделить работы Д. Балларда, Е. Дэвиса, Р. Гонсалеса, Ю.И. Журавлева, В.А. Сойфера, Ж. Серра, Д. Марра, А. Демпстера, Г. Шафера, М. Павель, Ю.П. Пытьева, Я.А. Фурмана, Л.П. Ярославского. За последние десятилетия создано множество успешных систем машинного зрения, в которых в тех или иных сочетаниях используются разработанные ими парадигмы и подходы.
Тем не менее, существует ряд проблем, связанных с классификацией изображений, которые не решены в настоящее время. Для успешной классификации изображений необходима априорная информация о структуре и свойствах мира. Однако многие факторы (деформация формы, перекрытие, переход от ЗО-сцен к 2Б-изображениям и т.п.) снижают ценность априорных
данных и затрудняют семантическую сегментацию изображения, при которой каждый сегмент рассматривается как объект определенного класса. В итоге, изображение имеет альтернативные структуры, решение по выбору одной из которых не может быть принято однозначно, основываясь на принятой картине мира. Определим этот класс изображений как сложноструктурируемые. Следовательно, если изображение является сложноструктурируемым, то это ведет к значительному снижению качества его классификации или классификации его сегментов посредством обучаемых классификаторов.
Сложноструктурируемому изображению характерно искажение границ сегментов и появление ложных сегментов, а также наличие древовидных структур. Поэтому использование известных локальных градиентных операторов выделения границ и оконтуривающих морфологических операторов не дает ожидаемого эффекта в связи с тем, что они привязываются к априорно заданной картине мира и не анализируют локальные результаты принятого решения и многоальтернативные решения.
В настоящее время научно-техническое направление классификации сложноструктурируемых изображений активно развивается, в последнее десятилетие предложены методы определения дескрипторов изображений и их сегментов, позволяющие построить признаковые пространства, устойчивые к ряду аффинных преобразований, шуму, изменению в освещении: SIFT (Scale Invariant Feature Transform), SURF (Speeded Up Robust Features), PCA-SIFT (PCA - Principal Component Analysis) и т.д. Но эти дескрипторы предназначены для работы в интеллектуальных системах поиска аналогичных и подобных изображений, а не в системах классификации. В настоящее время для классификации успешно применяются алгоритмы, например, такие как Bagging и Boosting, основанные на использовании множества базовых классификаторов с последующей агрегацией их решений, направленной на снижение ошибок первого и второго рода. Использование этих алгоритмов предполагает
наличие больших объемов выборок, позволяющих осуществить настройку множества классификаторов. Однако существует достаточно большой класс сложноструктурируемых изображений, для которых обеспечить необходимый объем обучающей выборки принципиально невозможно. Это, в частности, относится к медицинским изображениям, где эти ограничения обусловлены наличием сочетанной патологии и сложностью экспериментов на живых объектах. В этом случае для классификации целесообразно использовать методы и алгоритмы, основанные на различных парадигмах, что позволяет построить гибридные модели классификации, которые используют как методы обучаемых систем распознавания образов, так и методы экспертного оценивания. Гибридные модели целесообразно использовать и в случае иерархической семантической классификации, когда для окончательной классификации необходимо учитывать не только класс сегмента, но и его геометрические характеристики и масштаб.
В качестве обучаемых систем классификации изображений в настоящее время наиболее часто используются искусственные нейронные сети. Однако известные структурно-функциональные решения для искусственных нейронных сетей не могут быть эффективно использованы при анализе и классификации сложноструктурируемых изображений ввиду ограниченности объемов обучающих выборок и высокой степенью пересечения классов в признаковом пространстве. Ограниченность объема обучающей выборки компенсируется посредством использования методов экспертного оценивания, основанных на нечетком логическом выводе. Но в случае классификации сложноструктурируемых изображений использование этих методов не приводит к приемлемому результату из-за того, что методология нечеткого вывода слабо адаптирована под задачи классификации. Поэтому отсутствие методов и алгоритмов разработки гибридных классификаторов сложноструктурируемых изображений является серьезной проблемой, затрудняющей и замедляющей разработку новых приложений и практических систем в области компьютерного зрения. В связи с этим
возникает проблемная ситуация, связанная с противоречием между возможностями современной компьютерной и оптико-электронной техники и недостаточностью теоретической базы при ее использовании в системах классификации, основанных на анализе сложноструктурируемых изображений.
Указанное противоречие определяет постановку и решение актуальной проблемы повышения качества анализа и классификации сложноструктурируемых изображений на основе гибридных методов классификации при ограничениях на объемы обучающих выборок и высоком уровне пересечения классов в пространстве информативных признаков.
Объект исследования. Интеллектуальные системы анализа данных и поддержки принятия решений.
Предмет исследования. Методы, модели и алгоритмы для интеллектуальных систем сегментации и классификации сложноструктурируемых изображений.
Целью диссертационной работы является развитие методологии классификации сложноструктурируемых изображений на основе гибридных сетевых структур как средств унифицированного подхода к семантическому анализу яркостно-геометрических моделей изображений.
В соответствии с поставленной целью в работе решаются следующие основные задачи:
- анализ современного состояния методов и средств сегментации и классификации сложноструктурируемых изображений, исследование их критических свойств, поиск новых модификаций и обобщений этих методов, повышающих эффективность принятия решений;
- разработка математических и алгоритмических средств формирования интеллектуальных морфологических операторов, предназначенных для сегментации сложноструктурируемых изображений;
- разработка метода формального описания геометрические свойства сегментов сложноструктурируемых изображений, позволяющего получать
адекватные пространства информативных признаков, предназначенных для сетевых моделей их классификации;
- разработка математического и алгоритмического обеспечения для гибридных нейросетевых структур, позволяющих осуществлять анализ и классификацию сложноструктурируемых изображений на основе их яркостно-геометрического описания;
- создание специализированных методов, алгоритмов и программного обеспечения анализа изображений для интеллектуальных систем прогнозирования и диагностики функционального состояния сложных объектов;
- проведение экспериментальных исследований интеллектуальных систем анализа и классификации сложноструктурируемых изображений для оценки релевантности полученных информативных признаков, а также эффективность разработанных информационных технологий при использовании их в интеллектуальных системах поддержки принятия решений по классификации и идентификации функциональных состояний сложных объектов.
Методы и средства исследований. Для решения поставленных задач использовались математический аппарат линейной алгебры, теория вероятностей, аппарат морфологического анализа изображений, теория нейронных сетей и распознавания образов, методология спектрального анализа, теория множеств, методы экспертного оценивания и принятия решений. При разработке нейросетевых моделей и модулей нечеткого вывода в качестве инструментария использовался MATLAB 7.10 с графическим интерфейсом пользователя для Neural Network Toolbox и со встроенным пакетом Fuzzy Logic Toolbox.
Степень достоверности результатов проведенных исследований обеспечивается корректным использованием математического аппарата, соответствием результатов вычислительных экспериментов, выдвигаемым в диссертации положениям и выводам качественного характера, а также
результатами практического использования методов, предложенных в диссертации. Работоспособность разработанных методов и алгоритмов подтверждена статистикой обработки большого объема реальных изображений, отсутствием противоречий с известными положениями теории и практики анализа и классификации изображений.
Научную новизну составляют следующие результаты.
1. Метод сегментации сложноструктурируемых изображений, построенный на основе гибридной обработки исходного полутонового изображения, отличающийся тем, что процесс получен
-
Похожие работы
- Методы и алгоритмы морфологического анализа изображений в автоматизированной системе диагностики диабетической ретинопатии
- Метод, модели и алгоритмы обработки сложноформализуемых видеоданных в локальных информационных системах
- Методы и алгоритмы интеллектуальной системы диагностики сосудистой патологии сетчатки глаза на основе контурного спектрального анализа и нейросетевого моделирования
- Разработка цифровых устройств устранения шума и геометрических искажений цветных телевизионных изображений в реальном масштабе времени
- Гибридные модели и алгоритмы для анализа сложноструктурированных изображений в интеллектуальных системах медицинского назначения
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность