автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Гибридные модели и алгоритмы для анализа сложноструктурированных изображений в интеллектуальных системах медицинского назначения

кандидата технических наук
Борисовский, Сергей Александрович
город
Курск
год
2012
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Гибридные модели и алгоритмы для анализа сложноструктурированных изображений в интеллектуальных системах медицинского назначения»

Автореферат диссертации по теме "Гибридные модели и алгоритмы для анализа сложноструктурированных изображений в интеллектуальных системах медицинского назначения"

На правах рукописи

00501иэи.

Борисовский Сергей Александрович

ГИБРИДНЫЕ МОДЕЛИ И АЛГОРИТМЫ ДЛЯ АНАЛИЗА СЛОЖНОСТРУКТУРИРОВАННЫХ ИЗОБРАЖЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ МЕДИЦИНСКОГО НАЗНАЧЕНИЯ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (технические и медицинские системы)

Автореферат диссертации на соискание ученой степени кандидата технических наук

9 ФЕВ 2012

Курск - 2012

005010507

Работа выполнена в Юго-Западном государственном университете на кафедре биомедицинской инженерии.

Научный руководитель: доктор технических паук,

старший научный сотрудник Ключиков Игорь Алексеевич

Официальные оппоненты: доктор технических наук, профессор

Дегтярев Сергей Викторович

доктор технических наук, доцент Работкииа Ольга Евгеньевна

Ведущая организация: Белгородский государственным

национальный .ледовательскин университет, г. Белгород

Защита диссертации состоится 29 февраля 2012 года в 13-30 часов в конференц-зале на заседании совета по защите докторских и кандидатских диссертаций Д 212.105.03 при Юго-Западном государственном университете по адресу: 305040, г. Курск, ул. 50 лет Октября, 94.

С диссертацией можно ознакомиться в библиотеке Юго-Западного государственного университета.

Автореферат разослан 27 января 2012 г.

Ученый секретарь совета по защите докторских и кандидатских диссертаций Д 212.105.0? к.ф-м.н., профессор

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Системный подход к задачам распознавания и классификации состояния сложных объектов требует высокой надежности, точности и достоверности результатов исследований. При анализе медицинских изображений эти требования выполнить весьма трудно в связи с их высокой вариабельностью' и неоднородностью структуры. Все эти особенности медицинских изображений проявляются в системах автоматизированного анализа гистологических изображений, которые, наряду с неоднородностью структуры, характеризуются слабой контрастностью, высокой вариабельностью цветового окраса и большим количеством объектов, подлежащих классификации на одном кадре изображения.

Для повышения качества работы автоматических анализаторов изображения используются гибридные модели обработки информации, которые позволяют применять как методы обучаемых систем распознавания образов, так и методы экспертного оценивания, что существенно повышает качество классификации за счет компенсации недостатков тех или иных методов и подчеркивания их достоинств. Такие технические возможности позволяют значительно расширить круг исследований, открывают новые пути решения задач, касающихся анализа изображений.

Однако существующие в настоящее время интеллектуальные системы обработки гистологических' изображений, основанные на гибридном подходе, не предполагают взаимную адаптацию и эволюцию компонент, что не позволяет им обеспечить требуемое качество анализа гистологических структур.

Таким образом, актуальной научно-технической задачей исследования является повышение качества анализа изображений сложных объектов - на основе гибридных моделей и алгоритмов в интеллектуальных системах медицинского назначения. , :

Работа выполнена в рамках Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы (государственный контракт № П424 от 12 мая 2010 г.) по проблеме «Гибридные информационные. технологии для ранней диагностики инфекционных и онкологических заболеваний на основе многочастотной импедансометрии биоматериалов» и в соответствии с научным направлением Юго-Западного государственного университета «Разработка медико-экологических информационных технологий».

Цель работы. Разработка решающих модулей, алгоритмов и специального программного обеспечения для интеллектуальных систем анализа сложноструктурированных изображений, обеспечивающих повышение качества классификации их сегментов.

Для достижения поставленной цели необходимо решить следующие задачи:

- проанализировать существующие методы анализа

сложноструктурированных изображений, выявить их достоинства и недостатки;

- разработать способы и модели анализа сегментов сложноструктурированных изображений на основе атрибутивных характеристик их формы;

- построить алгоритмы классификации сегментов на изображениях мазков периферической крови;

- разработать специальное алгоритмическое и программное обеспечение для измерения межклеточных соотношений в периферической крови;

- провести апробацию предложенных моделей, алгоритмов и специального программного обеспечения на репрезентативных контрольных выборках.

Объект_______исследования. Микроскопические изображения

сложноструктурированных объектов.

Предмет исследования. Модели, алгоритмы и специальное программное обеспечение для анализа гистологических объектов на цветных изображениях препаратов оптической микроскопии.

Соответствие паспорту научной специальности. Содержание диссертации соответствует п.5 «Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации» и п. 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации» паспорта специальности 05.13.01 - Системный анализ, управление и обработка информации.

Методы исследований. В работе использовались методы системного анализа, методы цифровой обработки изображений, спектрального анализа, математической статистики, теории нейронных сет ей и распознавания образов, экспертного оценивания и нечеткой логики принятия решений. При разработке модулей спектральной обработки данных, нейронных сетей и нечеткого вывода в качестве инструментария использовался Matlab 7.10 с графическим интерфейсом пользователя для Neural Network Toolbox и со встроенным пакетом Fuzzy Logic Toolbox.

Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной и выносимые на защиту:

- модель морфологического описания сегмента, основанная на теоретико-множественном представлении границы сегмента, отличающаяся тем, что множество точек, описывающих границы сегмента, представляется в виде двух непересекающихся подмножеств, границы которых устанавливаются по нижней и верхней границам координат точек, входящих в исходное множество, позволяющая представить любую кривую, в том числе и незамкнутую, в виде периодической двумерной числовой последовательности;

- способ формирования информативных признаков для нейронных сетей, классифицирующих форменные элементы крови по геометрическим признакам, основанный на определении дескрипторов Фурье геометрической фигуры, полученной в результате сегментации микроскопических изображений

мазков крови, отличающийся тем, что после вычисления отсчетов спектра Фурье геометрической фигуры, число спектральных отсчетов дополняется до наперед заданного максимального числа путем добавления нулевых отсчетов слева и справа от граничных отрицательной и положительной частот, а амплитуда спектральных составляющих, характеризующих форму границы анализируемого сегмецтд, увеличивается на величину, прямо пропорциональную величине расширения спектра, позволяющий получить адекватную классификационную модель, независимую от числа отсчетов границ сегментов форменных элементов крови.

- алгоритм измерения межклеточных соотношений в периферической

крови, включающий двухступенчатую обработку изображения, заключающуюся в том, что на первой ступени обрабатывают изображение, полученное в результате сегментации исходного черно-белого изображения, после обработки морфологическим оператором «эрозия», а на второй ступени -изображение, полученное после обработки исходного черно-белого изображения посредством морфологического оператора «дилатация», отличающийся тем, что на каждой ступени решение принимается на основе агрегации двух оценок, полученных в результате анализа цветного изображения и в результате анализа черно-белого изображения, причем на первой ступени завышают число ошибок первого рода, а на второй ступени - число ошибок второго рода, а окончательное решение принимается на основе сопоставления решений, принятых на первой и на второй ступенях обработки; >

- структура базы данных обучающих выборок, отличающаяся тем, что записи в них распределены по двум уровням, причем для каждой Ь-й выборки /е строки (записи) в первом и втором уровнях относятся к одному и тому же сегменту изображения, а атрибуты для /-го сегмента Ь-п выборки на втором уровне получены из атрибутов 1-й выборки г'-го сегмента на первом уровне посредством их обработки модулями анализа цветного и черно-белого изображений, позволяющая формировать обучающие выборки для нейронных сетей модуля принятия решений по классификации форменных элементов крови.

Практическая значимость и результаты внедрения. Практическое значение работы определяется возможностью применения результатов исследования для обработки и анализа сложноструктурированных изображений.

Разработанные модели, алгоритмы и специальное программное обеспечение составили основу построения интеллектуальной системы анализа микроскопических изображений мазков крови. Программные средства ориентированы на практическое здравоохранение.

Результаты работ используются в учебном процессе Юго-Западного государственного университета при обучении студентов по специальностям 200401 «Биотехнические и медицинские аппараты и системы» и 200402 «Инженерное дело в медико-биологической практике» (дисциплина «Методы обработки биомедицинских сигналов и данных») и в опытно-конструкторских

работах НИЦ (г. Курск) ФГУП «18 ЦНИИ» МОРФ, что подтверждено соответствующими актами.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих научно-технических конференциях: Международных конференциях с элементами научной школы для молодежи «БИОМЕДСИСТЕМЫ - 2009, 2010» (Рязань, 2009, 2010); XIII и XIV Международных научно-технических конференциях «Медикоэкологические информационные технологии» (Курск, 2010, 2011); IX

Международной конференции «Распознавание - 2010» (Курск, 2010); XVIII Международной конференции «Лазерно-информационные технологии в медицине, биологии и геологии» (Новороссийск, 2010); XXVI Международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании» (Пенза, 2010); Всероссийской научно-технической конференции «Медицинские информационные системы МИС-2010» (Таганрог, 2010); IX Международной научно-технической конференции «Физика и радиоэлектроника в медицине и экологии (Владимир-Суздаль, 2010); Всероссийском конкурсе научных работ бакалавров и магистрантов «Биосовместимые материалы и покрытия» (Саратов, 2010); Международной научно-технической конференции «Интегративные процессы в науке - 2010» (Курск, 2010); Международной научной конференции «Молодежь и XXI век» (Курск, 2011); на научнотехнических семинарах кафедры биомедицинской инженерии ЮЗГУ (Курск, 2009,2010,2011).

Публикации. Самостоятельно и в соавторстве по теме диссертации опубликовано 16 печатных работ, в том числе 3 работы в рецензируемых научных журналах и два свидетельства на регистрацию программы для ЭВМ.

Личный вклад автора. Все научные результаты диссертационного исследования получены автором лично. В основных научных работах по теме диссертации, опубликованных в соавторстве и приведенных в конце автореферата, личный вклад соискателя состоит в следующем: в [1, 2 и 3] разработаны нейросетевые модели для гибридных технологий автоматизированного анализа сложноструктурированных изображений; в [6,7,

10, И и 12] - математические модели для спектрального анализа границ сегментов на основе теории дескрипторов Фурье; в [8 и 14] - способы формирования морфологических операторов для обработки гистологических изображений; в [15 и 16] - специальное программное обеспечение для обработки и анализа сложноструктурированных изображений.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и библиографического списка, включающего 104 отечественных и 15 зарубежных наименований. Работа изложена на 179 страницах машинописного текста, содержит 63 рисунка и 7 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы, определяются цели и задачи исследования, научная новизна и практическая значимость работы. Кратко излагается содержание глав диссертации.

В первой главе выполнен анализ состояния предметной области: дано описание гистологических объектов и особенностей их изображений, обзор существующих методов и систем обработки медицинских изображений, а также приведен анализ основных направлений развития алгоритмов

сегментации и классификации сложноструктурированных объектов. По результатам проведённого анализа сделаны следующие выводы: 1) задача повышения качества сегментации и классификации медицинских изображений является актуальной в диагностических и научных исследованиях; 2) большинство объектов на гистологических препаратах представлены слабоконтрастными изображениями и характеризуются большой

вариабельностью геометрических и оптических характеристик, в связи с чем при анализе подобных изображений возникают определенные трудности,

которые могут быть преодолены путем использования гибридных

информационных технологий.

Для реализации гибридных технологий сегментации и классификации сложноструктурированный объектов в системах искусственного интеллекта в диссертации предложено использовать нейросетевые и нечеткие технологии, которые позволяют устранить недостатки формальных логических систем.

Вторая глава посвящена разработке моделей и алгоритмов анализа сложноструктурированных изображений на основе спектральных методов.

Постановка задачи морфологического описания сегмента состоит в следующем. Пусть мы имеем на кадре Л2 бинарного изображения некоторое множество/замкнутых кривых

(Р,(х,у)} е И, ¡е1. (1)

Пусть функция Р((х,у) представлена в файле данных в виде последовательности координат пикселей

(Хк>Ук)> к 6 К! (2)

таким образом, что множество {(хк’Ук)}I является объединением двух

непересекающихся подмножеств Р( и Qj.

Так как кривая, описываемая множествами Р и 2 замкнутая, то, следовательно, она является периодической и может быть представлена в виде дискретного преобразования Фурье. Отсчеты спектра Фурье полученной замкнутой кривой используются для ее параметрического представления.

В качестве отсчетов рассматривались комплексные отсчеты, полученные на дискретной сетке с равномерным шагом по оси абсцисс, вычисленным как

Ь = (хт-хш)/М, '

где 2Л'-число отсчетов, описывающих границы сегмента, причем полагаем, что число элементов в множествах Р и £> одинаково, что соответствует условию

хк~хЫЦН-к)’ У(хк > Ук) е У(хи+(М-к)’Уи+№-к))еО- (4)

В частном случае в качестве шага дискретизации выбран один пиксель.

Объединение множеств Р и (2 рассматривается как упорядоченное множество комплексных чисел

к=** + У>Л. * = 1,2,...,к-1, К = 2Ы, (5)

для обработки которого используем спектральные методы анализа.

Представление (5) позволяет свести двумерную задачу к одномерной.

Дискретное преобразование Фурье конечной последовательности комплексных чисел ^ (к) задается уравнением

Ф) = ^К11з(к)е~-12тк/К, для и=0, 1,2,..., К-1. (6)

к к=О

Комплексные коэффициенты а(и) называются Фурье-дескрипторами границы. Обратное преобразование Фурье, примененное к этим коэффициентам, позволяет восстановить границу ¿(к):

т = К1а(и)е~]2т,к1К. (7)

и=О

В процессе проведенных исследований показано, что нескольких коэффициентов низшего порядка достаточно для описания общей формы границы сегмента, однако для точного восстановления резких деталей, например, углов и прямолинейных участков, требуется значительно большее число членов высокого порядка.

Формирование пространства информативных признаков рассматривалось на примере задачи классификации форменных элементов крови.

Учитывая, что преобразование Фурье обратимо, по дескрипторам Фурье можем восстановить границы контура исследуемого сегмента, используя уравнение (7). В любом случае, для восстановления контура используются столько дескрипторов, сколько было получено отсчетов на контуре.

Способ, позволяющий сократить число информативных признаков, и тем самым, значительно упростить модель, основан на приравнивании части дескрипторов к нулю. Чтобы оценить информационные потери при приравнивании к нулю части дескрипторов, производится сравнение по определенному критерию исходного контура и контура, восстановленного по ограниченному набору дескрипторов. С этой целью контур представлен двумя параметрическими кривыми. После перехода от К дескрипторов к М дескрипторам (М < К), получены параметрические кривые, отражающие геометрию границы сегмента и представленные в виде

**=/(*); й =/:(*)• (8)

Примеры исходных и восстановленных по М дескрипторам параметрических кривых (8) изображены на рис. 1.

о 20 40 60 80 100 120 140 £ ^ 0 20 40 оО 80 100 120 140 £

----Исходная граница

....Воссгановлшнпя граница

/

/

Рис. 1. Параметрические кривые исходной и восстановленной границы контура (кривые описывают истинные и восстановленные по дескрипторам Фурье границы форменного элемента крови)

Так как параметр кривых, примеры которых представлены на рис.1, один и тот же, то в качестве критерия информационных потерь, подлежащего минимизации, выбирается следующий критерий

Таким образом, задавшись А, определяется минимальное Число дескрипторов Фурье, вводящих в модель границы сегмента, которое обеспечивает заданную точность моделирования для всех границ сегментов, входящих в исследуемую совокупность. '

Для того, чтобы система распознавания была адекватна, необходимо, чтобы частотный диапазон, соответствующий дескриптору Фурье с определенным номером, не зависел от числа отсчетов в контуре, спектр которого вычисляется. Так как в различных контурах, определяющих границы сегмента, содержится различное число отсчетов, то при формировании информативных признаков из спектральных отсчетов они должны соответствовать одним и тем же частотным диапазонам. При одинаковой частоте дискретизации и различных количествах отсчетов в контурах это требование нарушается.

В связи с выше изложенным, был предложен следующий способ формирования пространства информативных признаков. На первом этапе задаем общее число отсчетов в контурах, которое должно быть одинаковым для всех контуров контрольных и обучающих выборок. Это число определяется по результатам статистических исследований. Для микроскопических изображений мазков крови и в данных исследованиях его значение принято равным 500. Дополнительные отсчеты можно получить в результате интерполирования замкнутой кривой, соответствующей контуру границы сегмента. Но в нашем случае такой путь неприемлем, так как контур дискретизирован с предельной частотой дискретизации, то есть один пиксель.

Р),

Тогда обратимся к спектральной области. Известно, что интерполяция в пространстве сигналов соответствует увеличению полосы частот, занимаемой сигналом в спектральной области. Следовательно, если заполнить высокочастотную часть спектральной полосы, занимаемой контуром, нулями и тем самым довести число отсчетов в спектре каждого контура границы сегмента до 500, то в пространстве сигналов появятся виртуальные отсчеты между реальными отсчетами. Однако характерной особенностью дескрипторов Фурье является то, что их амплитуда связана с частотой. Поэтому любые частотные трансформации в реальном сигнале должны сопровождаться амплитудными изменениями спектральных составляющих. Критерием адекватности любых трансформаций изображения в частотной области служит обратное преобразование Фурье и соответствующие различия между прямым и обратным преобразованием Фурье. При увеличении числа отсчетов увеличивается площадь под кривой, соответствующей исследуемому сигналу. Чтобы трансформируемый сигнал был эквивалентен исходному, необходимо увеличить сами спектральные составляющие во столько раз, во сколько было увеличено число отсчетов.

Таким образом, на втором этапе необходимо все спектральные составляющие в спектре ;-го контура умножить на величину Л'„м/Л/, , где Ы„1ги=50и, Л?, - количество отсчетов в г-м контуре.

Третий этап - контрольный. Осуществляются обратные преобразования Фурье модифицированных спектров контуров границ сегментов и сравнение их с исходными границами сегментов.

Глава 3 посвящена вопросам разработки и моделирования алгоритмов классификации сегментов на изображениях мазков периферической крови.

Форменные элементы крови классифицируются по двум независимым группам признаков. К первой группе относятся цветовые показатели - КОВ. Ко второй группе - геометрические параметры элемента - дескрипторы Фурье {л(йм)}, П = 1...N.

Алгоритм классификации построен по двухступенчатой схеме, на каждой из которых выделяется четыре класса: «эритроцит» - «не эритроцит» и «лейкоцит» - «не лейкоцит». Это значит, что каждый элемент на каждой ступени может быть отнесен к двум из этих четырех классов.

На каждой из двух ступеней анализируются различные изображения, получаемые путем применения морфологических операторов «эрозия» и «дилатация» к исходному черно-белому изображению. В первом случае увеличивается число ошибок первого рода, то есть часть форменных элементов, относящихся к классам «не лейкоцит» и «не эритроцит», «растворяется» в классах «эритроциты» и «лейкоциты». Во втором случае растет число ошибок второго рода за счет того, что осуществляется искусственное объединение форменных элементов крови, и число форменных элементов класса «не лейкоцит» и «не эритроцит» растет за счет лейкоцитов и эритроцитов.

Двухступенчатый анализ позволяет избежать ошибок второго рода, связанных с агломерацией (склеиванием) эритроцитов или образованием

и

ауторозеток. На второй ступени анализируется изображение, в котором за счет искусственного склеивания эритроцитов между собой и эритроцитов и лейкоцитов получаем ложные форменные элементы классов «не лейкоцит» и «не эритроцит». Это уменьшает число ошибок первого рода при решении задачи выбора между классом «не лейкоцит и не эритроцит» и классом «лейкоцит».

Выходами блоков принятия решений каждой из ступеней анализа являются переменные 21...23, которые рассматриваются как элементы нечетких множеств, соответствующих термам разделяемых классов.

Блоки принятия , решений построены по принципу макрослоев, позволяющему объединить модули нейросетевых моделей. На рис. 2 приведена иллюстрация этого принципа на примере макрослоя для классификации по классам «эритроциты» - «не эритроциты» посредством двухуровневой схемы.

Рис. 2. Схемы соединения нейронных сетей для классификации форменных элементов крови на каждой ступени анализа по классам «эритроцит» - «не эритроцит» (модуль 1 может быть построен как на основе нейронной сети, так и на основе нечетких решающих правил)

Решающие модули 1, 2, 3 (рис. 2) имеют два выхода, которые соответствуют двум разделяемым классам: «лейкоцит» - «не лейкоцит» или «эритроцит» - «не эритроцит». На выходах нейронной сети присутствуют числа в диапазоне от нуля до единицы, которые интерпретируются как коэффициенты уверенности в принадлежности анализируемого сегмента к вышеперечисленным классам.

Анализ выходов блоков принятия решений обеих ступеней осуществляется по правилам нечеткой продукции:

Если Х2= «не лейкоцит» и Х3= «эритроцит», то 21 = «эритроцит»;

Если XI = «лейкоцит» и Х4= «не эритроцит», то 22= «лейкоцит»;

Если Х2= «не лейкоцит» и Х4= «не эритроцит», то 23= ««не лейкоцит» и «не эритроцит»».

(10)

На рис.З представлена структурная схема нечеткой нейронной сети, реализующая систему нечетких продукций (10).

Нечеткая сеть имеет три выхода, соответствующие классам, на которые классифицируются форменные элементы. Выбор соответствующего класса осуществляется по максимальному значению выхода. Если заданы нечеткие множества, соответствующие классам на выходе нечеткой сети, то имеется возможность воспользоваться известными методами дефуззификации, например, по среднему центру.

База данных микроскопических изображений имеет библиотеку стандартных окрасов мазков, взятых из практики работы различных лабораторий. В разработанной базе данных использовались шесть окрасов. База данных включает два уровня. На первом уровне хранятся выборки сегментов, предназначенные для обработки модулями 1 и модулями 2 рис. 2. После обработки каждой записи из выборки Ь, соответствующей первому уровню, этой записи ставится в соответствие запись в выборке Ь в базе данных второго уровня. Соответствие записей в выборках первого и второго уровня обеспечивает блок синхронизации записей данных.

Порядок формирования базы данных второго уровня состоит в следующем. Обучающая выборка с номером Ь подается на модуль обработки цветного изображения и модуль обработки черно-белого изображения. В результате записи Ь-й выборки базы данных первого уровня соответствует 1-я запись ¿-й выборки второго уровня. Такое соответствие записей обеспечивается посредством блока синхронизации. Обучающие выборки базы данных записей

второго уровня используются для обучения модуля 3 принятия решений (рис. 2).

В четвертой главе проведена оценка эффективности предложенных моделей, алгоритмов и специального программного обеспечения на примере интеллектуальной системы анализа гистологических изображений.

Программное обеспечение для интеллектуальной системы классификации форменных элементов крови разработано в среде Ма^аЬ 7.10 в виде модуля МеИтРгос.

Для работы программного модуля необходима база данных, в которой выделено три блока: база изображений, база моделей нейронных сетей и база обучающих выборок. База изображений содержит изображения, которые необходимо либо анализировать (определить количество лейкоцитов и эритроцитов, присутствующих на них), либо изображения, предназначенные для формирования обучающих выборок.

Входной информацией для формирования обучающей выборки служат пары файлов: файл цветного изображения мазка и бинарный файл

сегментированного изображения на классы «форменные элементы» - «плазма». Процесс формирования обучающих выборок начинается с формирования третьего файла, который относится к базе данных обучающих выборок и содержит информацию о принадлежности каждого сегмента бинарного изображения к определенному классу.

На первом этапе формирования обучающей выборки программа МеМтРгос осуществляет опрос сегментов, согласно их нумерации, хранящейся во втором файле базы данных изображений (классификация сегментов обучающей выборки осуществляется в интерактивном режиме по данным из первого файла базы изображений). Оператор видит выделенный сегмент на изображении и сообщает программе класс этого сегмента. Выделенный сегмент может не принадлежать ни к лейкоцитам, ни к эритроцитам. Поэтому классификация в интерактивном режиме должна осуществляться на три класса: третий класс «не лейкоциты и не эритроциты».

Поля записей файла базы данных обучающих выборок формируются в автоматическом режиме в результате взаимодействия файлов цветного и сегментированного изображения и маркеров сегментов по классам.

После формирования файла базы данных выводится число эритроцитов и лейкоцитов в обучающей выборке. Если это число недостаточно для качественного обучения модулей принятия решений, то к обучающей выборке присоединяют еще одно микроскопическое изображение мазка крови из того же класса изображений по окрасу.

Алгоритм заполнения полей записей файла обучающей выборки осуществляет последовательный опрос сегментов в каждой диаде файлов базы данных изображений. Если в обучающую выборку входит больше одной диады, то используется сквозная нумерация записей. Каждому сегменту в обучающей выборке соответствует две записи, относящиеся к двум уровням базы данных. Каждая запись имеет три группы полей, причем первые группы полей в записях

различных уровней, но относящихся к одному и тому же сегменту, идентичны. В эту группу входят два поля: номер сегмента и номер класса форменного элемента. Во вторую группу полей входят атрибуты цветного изображения, а в третью - атрибуты черно-белого изображения.

На следующем этапе выполнения алгоритма заполняются записи второго уровня. Для заполнения полей этих записей необходимо, чтобы на вход нейронных сетей первого уровня поступали данные, хранящиеся в соответствующих полях первой записи. Выходные значения нейронных сетей первого уровня заносятся в соответствующие поля второй записи.

После того, как такая процедура выполнена для всех записей первого уровня, обучающая выборка сформирована. Таким образом, процессы получения модели решающего модуля и формирования обучающей выборки совмещены.

На рис. 4 представлен алгоритм получения интегрированных моделей решающих модулей для классификации форменных элементов крови, позволяющий создавать блоки принятия решений на основе гибридных технологий для всех ступеней анализа микроскопических изображений биоматериала.

Алгоритм реализует непрерывный процесс получения моделей нейронных сетей, образующих блоки принятия решений по классификации форменных элементов крови, а также сам процесс классификации в результате «прогона» полученных моделей нейронных сетей на контрольных изображениях.

В блоках 1 и 2, а также 10 и 11 рис. 4 формируются обучающие (контрольные) выборки и задается архитектура формируемой нейронной сети. Для обучения нейронных сетей используются блоки 5, 6, 7, и 8, а также блоки

12, 13, 14 и 15. Обучающая выборка или входные данные для модели нейронной сети NET3 получают посредством «прогона» нейронных сетей NET1 и NET2 на соответствующих обучающих выборках (см. рис.2).

Алгоритм рис. 4 реализован в виде интерфейсных окон посредством использования стандартных операторов среды Matlab 7.10. Эти окна позволяют пользователю вмешиваться в процесс выполнения программы на шагах, предусмотренных разработчиком, формировать соответствующие базы данных обучающих выборок и базы данных моделей.

С целью формирования обучающих и контрольных выборок для проверки эффективности работы и качества классификации разработанной интеллектуальной системы классификации форменных элементов крови был проведен поиск и изучение аннотированных международных баз данных микроскопических изображений мазков крови, доступных в ресурсах Internet. Анализ таких сертифицированных баз данных показал, что наиболее полной и цитируемой в научных и практических исследованиях является банк изображений американского общества гематологов (American Society of Hematology) и электронный атлас гематологии, доступный на сайте: h ttp ://h ematol ogyatlas. com/.

Формирование обучающей выборки для NET1 и NET2 (С1 и С2)

Формирование архитектуры для NET1 и NET2

Задание массива целей (Т) для NETI н NET2

Создание NET1 и NET2 с шанной архитектурой

Sh*4(NET1)-1

Smi.4(net:)=1

{NETI SketiI—miiKNETl, Ct. T) INET2 Ssl.;T;l=train(NET2, C2. T)

[Используются информативные признаки -■jno каналу «геометрия» (NETI) и «цвет»

KNET2). соответственно

Задаем кол-во слоев, кол-во нейронов во -■ входном слое, кол-во циклов обучения,

предельное значение точности обучения (Sirea)

JT характеризует степень принадлежности объектов к [одному из 2-х классов (состоит из«<>» и «1»)

Используется функция «ncvvff», которая создает нейронную сеть с прямым распространением сигнала и обратным распространением ошибки

Ёлние начальных значении ности обучения NET1 и NET2

[Критерий правильности [обучения NET1 и NET2

Падание (новых) начальных - ^значений весов и смешений для ¡NETI и NET2

-(Обучение NET1 и NET2

K,i=siin(NETl, Cl) K,:=sim(NET2. С2)

»Прогон» обученных NETI и NET2, в результате чего і|юрмируютс* вектора выходов NETI и NET2 ;Kvi и Ку2 соответственно)

Формирование обучающей выборки для NET3 (СЗ)

-Q3=K„n Ка

Формирование архитектуры для NET3

Задаем кол-во слоев, кол-во нейронов во -- входном слое, кол-во циклов обучения,

предельное значение ТОЧНОСТИ обучения (5„рея)

ІЗадание начального значения ^точности обучения NETЗ

¡Критерий правильности [обучения NET3

Задание (новых) начальных значений весов и смешении для NET3

I Обучение NET3

Ky3*sim(NET3, СЗ)

Ёюгон» обученной NET3, в результате чего імируется вектор выхода NET3 (Куі)

с

Рис. 4. Алгоритм получения интегрированных моделей нейронных сетей для классификации форменных элементов крови

Для проведения экспериментальных исследований из указанных выше баз данных было отобрано 20 микроскопических изображений мазков крови, имеющих стандартный цветовой окрас по Романовскому-Гимза и окрас с доминированием розово-красной гаммы цветов над сине-фиолетовой.

В рамках эксперимента были проведены исследования качества классификации разработанной интеллектуальной системы классификации форменных элементов крови в сравнении с существующими программными комплексами анализа изображений. В качестве аналогов рассматривались программный комплекс «ДиаМорф» (версия 1.6), предназначенный для проведения цитологических и гистологических исследований, и программное обеспечение «Цито» (версия 2.1), предназначенное для анализа цветных и монохромных изображений в медицине, биологии, фармакологии и ветеринарии.

На рис. 5 представлены диаграммы качества классификации форменных элементов крови различными интеллектуальными системами. Показателями качества классификации являются диагностическая чувствительность (ДЧ), специфичность (ДС) и эффективность (ДЭ).

Рис. 5. Диаграммы качества классификации форменных элементов крови различными интеллектуальными системами

Экспериментальные исследования показывают, что во всех рассмотренных системах показатель ДЧ при классификации эритроцитов выше, чем показатель ДЧ при классификации лейкоцитов, это связано с пропусками лейкоцитов, принятых за скопление эритроцитов. Также следует отметить, что представленное специальное программное обеспечение характеризуется меньшим числом ложных тревог (разрушенные клетки, скопления

И Лейкоциты Ш Эритроциты

тромбоцитов, грязь, пятна краски ошибочно принятые за лейкоциты) и превосходит известные по показателям качества классификации, в среднем, на 4%. Кроме того, представленное программное обеспечение позволяет полностью исключить человека из процедуры классификации форменных элементов крови.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

В результате проведенных исследований предложены новые научнотехнические решения, предназначенные для анализа сложноструктурированных изображений, позволяющие проектировать специальное алгоритмическое и программное обеспечение для интеллектуальных систем анализа сложноструктурированных изображений.

В диссертационной работе получены следующие основные результаты.

1. Проанализированы существующие методы анализа и классификации сложноструктурированных изображений, выявлены их достоинства и недостатки. На основе проведенного анализа предложено в этих целях использовать гибридные информационные технологии.

2. Разработаны способы и модели анализа сегментов сложноструктурированных изображений на основе атрибутивных характеристик их формы, включающие:

- модель морфологического описания сегмента, основанную на теоретико-множественном представлении границы сегмента, позволяющую представить любую кривую, в том числе и незамкнутую, в виде периодической двумерной числовой последовательности;

- способ сокращения количества дескрипторов Фурье, входящих в модель границы сегмента 1, заключающийся в выборе минимизируемого критерия точности восстановления границы сегмента и последующего выбора числа дескрипторов, входящих в модели исследуемой совокупности, таким образом, чтобы выбранное число дескрипторов обеспечивало заданную точность моделирования для всех границ сегментов, входящих в данную совокупность.

- способ формирования информативных признаков для нейронной сети, классифицирующей форменные элементы крови по геометрическим признакам, основанный на определении дескрипторов Фурье геометрической фигуры, полученной в результате сегментации микроскопических изображений мазков крови, позволяющий получить адекватную классификационную модель, независимо от числа отсчетов, получаемых на фигурах, соответствующих границам сегментов форменных элементов крови.

3. Разработаны алгоритмы классификации сегментов

сложноструктурированных изображений, включающие:

- алгоритм измерения межклеточных соотношений в периферической крови, предусматривающий двухступенчатую обработку изображения, заключающуюся в том, что на первой ступени обрабатывают изображение, полученное в результате сегментации исходного черно-белого изображения, после обработки морфологическим оператором «эрозия», а на втором этапе -

изображение, полученное после обработки исходного черно-белого изображения посредством морфологического оператора «дилатация», позволяющий использовать гибридные технологии анализа сложноструктурированных изображений;

- структуру базы данных обучающих выборок, согласно которой записи распределены по двум уровням, причем для каждой L-й выборки г'-е строки (записи) в первом и втором уровнях относятся к одному и тому же сегменту, а атрибуты для ¡'-го сегмента L-й выборки на втором уровне получены из атрибутов L-й выборки г-го сегмента на первом уровне посредством их обработки модулями анализа цветного и черно-белого изображений, позволяющая формировать обучающие выборки для нейронных сетей модуля принятия решений.

4. Разработано специальное алгоритмическое и программное обеспечение, предназначенное для автоматизированного анализа сложноструктурированных изображений, реализованное в среде Matlab 7.10, позволяющее осуществлять процессы сегментации и классификации сложноструктурированных изображений на основе полного технологического цикла синтеза многоуровневых моделей нейронных сетей, включающего процессы формирования обучающих выборок, вычисления параметров нейронных сетей, формирование базы данных реляционного типа и определения эффективности полученных решающих правил.

5. Проанализирована эффективность разработанных моделей, алгоритмов и программных средств классификации сегментов в сложноструктурированных изображениях, показано, что использование гибридных технологий позволяет повысить качество классификации, в среднем, на 4% по сравнению с известными методами классификации, что позволяет рекомендовать их использование в интеллектуальных системах гистологического анализа.

СПИСОК НАУЧНЫХ РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в рецензируемых научных журналах и изданиях

1. Борисовский, С.А. Нейросетевые модели сегментации ангиограмм глазного дна на основе анализа RGB-кодов пикселей / С.А. Борисовский, А.Н. Брежнева, P.A. Томакова, С.А. Филист // Системный анализ и управление в биомедицинских системах, 2010. Т.9. № 1. С.72-76.

2. Борисовский, С.А. Нейросетевые модели с иерархическим пространством информативных признаков для сегментации плохоструктурированных изображений / С.А. Борисовский, А.Н. Брежнева, P.A. Томакова//Биомедицинская радиоэлектроника, 2010. №2. С.49-53.

3. Борисовский, С.А. Нейросетевые,! модели морфологических

операторов для сегментации изображений биомедицинских сигналов / С.А. Борисовский, А.П. Белобров, P.A. Томакова // Известия ЮФУ. Технические науки. Тематический выпуск. «Медицинские информационные системы» / Таганрог, 2010. № 8 (109). С.28-32.

Статьи и материалы конференций

4. Борисовский, С.А. Нейросетевой решающий модуль для сегментации

патологических образований на изображении глазного дна /

С.А. Борисовский// Биотехнические, медицинские и экологические системы и комплексы (БИОМЕДСИСТЕМЫ - 2009): сб. материалов Международной конференции с элементами научной школы для молодежи / Рязан. гос. радиотехн. ун-т. Рязань, 2009. С.245-249.

5. Борисовский, С.А. Программный комплекс цифровой обработки изображений в среде MATLAB / С.А. Борисовский // Медико-экологические информационные технологии - 2010: сб. материалов XIII Международной научно-технической конференции / Юго-Зап. гос. ун-т. Курск, 2010. С.190-194.

6. Борисовский, С.А. Применение преобразования Фурье в

распознавании узлов картографической сетки растровых карт /

С.А. Борисовский, A.B. Чеглов, И.И. Шуклин // Оптико-электронные приборы и устройства в системах распознавания образов. Распознавание - 2010: сб. материалов IX Международной конференции / Курск, гос. техн. ун-т. Курск,

2010. С.141-143.

7. Борисовский, С.А. Морфологический анализ

плохоструктурированных изображений биоматериалов на основе преобразования Фурье границ сегментов и нейросетевого моделирования / С.А. Борисовский, P.A. Томакова, А.Н. Брежнева, H.A. Швецова // Лазерноинформационные технологии в медицине, биологии и геоэкологии-2010: сб. трудов XVIII Международной научной конференции / Кубанский гос. технол. ун-т. Новороссийск, 2010. С.76-77.

8. Борисовский, С.А. Сегментация гистологических структур посредством адаптивных морфологических операторов и пороговой обработки / С.А. Борисовский, P.A. Томакова, А.Н. Брежнева // Физика и радиоэлектроника в медицине и экологии: сб. трудов IX Межд. научн.-технич. конф. с эл. научн. молод, школы / Владимир, гос. ун-т. Владимир, 2010. С.302-304.

9. Борисовский, С.А. Способы описания границ сегментов форменных элементов крови, инвариантные к геометрическим преобразованиям / С.А. Борисовский // Биотехнические, медицинские и экологические системы и комплексы (БИОМЕДСИСТЕМЫ-2010): сб. материалов ХХШ Всероссийской научно-технической конференции студентов, молодых ученых и специалистов / Рязан. гос. радиотехн. ун-т. Рязань, 2010. С.201-204.

10. Борисовский, С.А. Сравнительный анализ дескрипторов Фурье / С.А. Борисовский, P.A. Томакова, В.В. Руденко // Математические методы и информационные технологии в экономике, социологии и образовании: сб. статей XXVI Международной научно-технической конференции / Пенза. Приволжский Дом знаний, 2010.С.61-64.

11. Борисовский, С.А. Дескрипторы Фурье для идентификации сегментов изображений биоматериалов / С.А. Борисовский, Е.А. Соглаев // Биосовместимые материалы и покрытия: сб. материалов Всероссийского

конкурса научных работ бакалавров и магистрантов / Саратовский гос. техн. ун-т. Саратов, 2010. С. 170-171.

12. Борисовский, С.А. Исследование дескрипторов Фурье при частотной

селекции масштабных преобразований / С.А. Борисовский, P.A. Томакова, С.А. Филист // Интегративные процессы в науке - 2010: сб. материалов Международной научно-технической конференции / Курск: МУ «Издательский центр «ЮМЭКС», 2010. С.11-14. ..

13. Борисовский, С.А. Исследование дескрипторов Фурье, предназначенных для оценки формы эритроцитов / С.А. Борисовский // Молодежь и XXI век: сб. материалов Международной научной конференции / Юго-Зап. гос. ун-т. Курск, 2011. Ч. 3. С.158-162.

14. Борисовский, С.А. Алгоритм устранения ложных контуров при сегментации форменных элементов крови / С.А. Борисовский, И.А. Ключиков// Медико-экологические информационные технологии-2011: сб. материалов XIII Междунар. науч.-техн. конф. / Юго-Зап. гос. ун-т. Курск,

2011. С.193-201.

Свидетельства о регистрации программ

15. Борисовский, С.А. Свидетельство о регистрации программы для ЭВМ № 2010611061. Программный комплекс цифровой обработки изображений в среде MATLAB / С.А. Борисовский, И.А. Борисовский (РФ). М.: РосПатент; Заявитель и правообладатель КурскГТУ. № 2009616962; заявлено 07.12.2009; дата регистрации 04.02.2010.

16. Борисовский, С.А. Свидетельство о регистрации программы для ЭВМ № 2011613254. Программное обеспечение морфологического спектрального анализа изображений / С.А. Борисовский, P.A. Томакова (РФ). М.: РосПатент; Заявитель и правообладатель ЮЗГУ. № 2011611389; заявлено 02.03.2011; дата регистрации 26.04.2011.

Подписано в печать_______2012. Формат 60x84 1/16

Печатных листов 1,0. Тираж 100 экз. Заказ____

Юго-Западный государственный университет. Издательско-полиграфический центр Юго-Западного государственного университета. 305040, г. Курск, ул. 50 лет Октября, 94

Текст работы Борисовский, Сергей Александрович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

61 12-5/1779

ФГБОУ ВПО «ЮГО-ЗАПАДНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

ГИБРИДНЫЕ МОДЕЛИ И АЛГОРИТМЫ ДЛЯ АНАЛИЗА СЛОЖНОСТРУКТУРИРОВАННЫХ ИЗОБРАЖЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ МЕДИЦИНСКОГО

НАЗНАЧЕНИЯ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (технические и медицинские системы)

На правах рукописи

Борисовский Сергей Александрович

Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель:

доктор технических наук,

старшин научный сотрудник Ключиков И.А.

Курск-2012

СОДЕРЖАНИЕ

ВВЕДЕНИЕ..................................................................................................................5

ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ И СИСТЕМ АНАЛИЗА СЛОЖНОСТРУКТУРИРОВАННЫХ ИЗОБРАЖЕНИЙ В

ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ МЕДИНСКОГО НАЗНАЧЕНИЯ........ 12

1Л. Особенности анализа сложноструктурированных изображений................. 12

1.2. Методы предварительной обработки изображений....................................... 14

1.2.1. Пространственные методы............................................................................ 16

1.2.2. Частотные методы.......................................................................................... 19

1.3. Методы сегментации изображений................................................................. 20

1.3.1. Пороговая сегментация.................................................................................. 23

1.3.2. Методы сегментации с использованием гистограмм................................. 24

1.3.3. Методы выращивания областей.................................................................... 27

1.3.4. Методы, основанные на кластеризации....................................................... 28

1.3.5. Методы сегментации, основанные на операторах выделения краев........ 30

1.3.6. Сегментация изображения с помощью вейвлет-преобразования............. 31

1.3.7. Сегментация при помощи нейронных сетей............................................... 32

1.3.8. Метод водораздела......................................................................................... 33

1.4. Методы классификации изображений............................................................. 37

1.5. Автоматизированные системы гематологического анализа......................... 44

1.6. Выводы первой главы....................................................................................... 56

ГЛАВА 2. РАЗРАБОТКА СПОСОБОВ И МОДЕЛЕЙ АНАЛИЗА СЕГМЕНТОВ СЛОЖНОСТРУКТУРИРОВАННЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ АТРИБУТИВНЫХ ХАРАКТЕРИСТИК ИХ ФОРМЫ......................................... 57

2.1. Разработка модели морфологического описания сегмента на основе теоретико-множественного подхода...................................................................... 57

2.2. Разработка модели морфологического описания сегмента на основе спектральных методов анализа............................................................................... 61

2.3. Способы обеспечения инвариантности дескрипторов Фурье относительно геометрических преобразований............................................................................. 65

2.3.1. Инвариантность относительно сдвига.......................................................... 67

2.3.2. Инвариантность относительно масштаба.................................................... 67

2.3.3. Инвариантность относительно поворота..................................................... 69

2.4. Выбор и оптимизация числа используемых дескрипторов Фурье при анализе микроскопических изображений форменных элементов крови........... 72

2.5. Выводы второй главы........................................................................................ 83

ГЛАВА 3. РАЗРАБОТКА АЛГОРИТМОВ КЛАССИФИКАЦИИ СЕГМЕНТОВ НА ИЗОБРАЖЕНИЯХ МАЗКОВ ПЕРИФЕРИЧЕСКОЙ КРОВИ...................... 87

3.1. Алгоритм измерения межклеточных соотношений в периферической крови ........................................................................................................................87

3.2. Модуль анализа цветного изображения сегмента.......................................... 95

3.3. Модуль анализа черно-белого изображения сегмента................................ 113

3.4. Структура базы данных для настройки модуля принятия решений.......... 117

3.5. Выводы третьей главы.................................................................................... 119

ГЛАВА 4. ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ КЛАССИФИКАЦИИ ФОРМЕННЫХ ЭЛЕМЕНТОВ КРОВИ .... 122

4.1. Общая структура программного обеспечения.............................................. 122

4.2. Программный модуль сегментации микроскопических изображений мазков крови ......................................................................................................................126

4.2.1. Программное обеспечение блока нейросетевой классификации пикселей изображения............................................................................................................ 126

4.2.2. Программное обеспечение блока морфологической обработки изображений............................................................................................................ 129

4.3. Программный модуль для классификации форменных элементов крови..131

4.4. Схема формирования файлов обучающих выборок ....................................137

4.5. Алгоритм формирования интегрированных моделей решающих модулей для классификации форменных элементов крови.............................................. 149

4.6. Экспериментальные исследования разработанной интеллектуальной системы классификации форменных элементов крови...................................... 151

4.7. Выводы четвертой главы................................................................................ 158

ЗАКЛЮЧЕНИЕ....................................................................................................... 161

БИБЛИОГРАФИЧЕСКИЙ СПИСОК................................................................... 164

ВВЕДЕНИЕ

Актуальность работы. Системный подход к задачам распознавания и классификации состояния сложных объектов требует высокой надежности, точности и достоверности результатов исследований. При анализе медицинских изображений эти требования выполнить весьма трудно в связи с их высокой вариабельностью и неоднородностью структуры. Все эти особенности медицинских изображений проявляются в системах автоматизированного анализа гистологических изображений, которые, наряду с неоднородностью структуры, характеризуются слабой контрастностью, высокой вариабельностью цветового окраса и большим количеством объектов, подлежащих классификации на одном кадре изображения.

Для повышения качества работы автоматических анализаторов изображения используются гибридные модели обработки информации, которые позволяют применять как методы обучаемых систем распознавания образов, так и методы экспертного оценивания, что существенно повышает качество классификации за счет компенсации недостатков тех или иных методов и подчеркивания их достоинств. Такие технические возможности позволяют значительно расширить круг исследований, открывают новые пути решения задач, касающихся анализа изображений.

Однако существующие в настоящее время интеллектуальные системы обработки гистологических изображений, основанные на гибридном подходе, не предполагают взаимную адаптацию и эволюцию компонент, что не позволяет им обеспечить требуемое качество анализа гистологических структур.

Таким образом, актуальной научно-технической задачей исследования является повышение качества анализа изображений сложных объектов на основе гибридных моделей и алгоритмов в интеллектуальных системах медицинского назначения.

Работа выполнена в рамках Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы (государственный контракт № П424 от 12 мая 2010 г.) по проблеме «Гибридные информационные технологии для ранней диагностики инфекционных и онкологических заболеваний на основе многочастотной импедансометрии биоматериалов» и в соответствии с научным направлением Юго-Западного государственного университета «Разработка медико-экологических информационных технологий».

Цель работы. Разработка решающих модулей, алгоритмов и специального программного обеспечения для интеллектуальных систем анализа сложноструктурированных изображений, обеспечивающих повышение качества классификации их сегментов.

Для достижения поставленной цели необходимо решить следующие задачи:

проанализировать существующие методы анализа

сложноструктурированных изображений, выявить их достоинства и недостатки;

разработать способы и модели анализа сегментов сложноструктурированных изображений на основе атрибутивных характеристик их формы;

построить алгоритмы классификации сегментов на изображениях мазков периферической крови;

разработать специальное алгоритмическое и программное обеспечение для измерения межклеточных соотношений в периферической крови;

провести апробацию предложенных моделей, алгоритмов и специального программного обеспечения на репрезентативных контрольных выборках.

Объект_исследования. Микроскопические изображения

сложноструктурированных объектов.

Предмет исследования. Модели, алгоритмы и специальное программное обеспечение для анализа гистологических объектов на цветных изображениях препаратов оптической микроскопии.

Соответствие паспорту научной специальности. Содержание диссертации соответствует п.5 «Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации» и п. 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации» паспорта специальности 05.13.01 - Системный анализ, управление и обработка информации.

Методы исследований. В работе использовались методы системного анализа, методы цифровой обработки изображений, спектрального анализа, математической статистики, теории нейронных сетей и распознавания образов, экспертного оценивания и нечеткой логики принятия решений. При разработке модулей спектральной обработки данных, нейронных сетей и нечеткого вывода в качестве инструментария использовался Matlab 7.10 с графическим интерфейсом пользователя для Neural Network Toolbox и со встроенным пакетом Fuzzy Logic Toolbox.

Научная новизна. В диссертации получены следующие результаты, характеризующиеся научной новизной и выносимые на защиту:

модель морфологического описания сегмента, основанная на теоретико-множественном представлении границы сегмента, отличающаяся тем, что множество точек, описывающих границы сегмента, представляется в виде двух непересекающихся подмножеств, границы которых устанавливаются по нижней и верхней границам координат точек, входящих в исходное множество, позволяющая представить любую кривую, в том числе и незамкнутую, в виде периодической двумерной числовой последовательности;

способ формирования информативных признаков для нейронных сетей, классифицирующих форменные элементы крови по геометрическим

признакам, основанный на определении дескрипторов Фурье геометрической фигуры, полученной в результате сегментации микроскопических изображений мазков крови, отличающийся тем, что после вычисления отсчетов спектра Фурье геометрической фигуры, число спектральных отсчетов дополняется до наперед заданного максимального числа путем добавления нулевых отсчетов слева и справа от граничных отрицательной и положительной частот, а амплитуда спектральных составляющих, характеризующих форму границы анализируемого сегмента, увеличивается на величину, прямо пропорциональную величине расширения спектра, позволяющий получить адекватную классификационную модель, независимую от числа отсчетов границ сегментов форменных элементов крови;

алгоритм измерения межклеточных соотношений в периферической крови, включающий двухступенчатую обработку изображения, заключающуюся в том, что на первой ступени обрабатывают изображение, полученное в результате сегментации исходного черно-белого изображения, после обработки морфологическим оператором «эрозия», а на второй ступени -изображение, полученное после обработки исходного черно-белого изображения посредством морфологического оператора «дилатация», отличающийся тем, что на каждой ступени решение принимается на основе агрегации двух оценок, полученных в результате анализа цветного изображения и в результате анализа черно-белого изображения, причем на первой ступени завышают число ошибок первого рода, а на второй ступени - число ошибок второго рода, а окончательное решение принимается на основе сопоставления решений, принятых на первой и на второй ступенях обработки;

структура базы данных обучающих выборок, отличающаяся тем, что записи в обучающих выборках распределены по двум уровням, причем для каждой Ь-й выборки г-е строки (записи) в первом и втором уровнях относятся к одному и тому же сегменту изображения, а атрибуты для г-го сегмента Ь-й выборки на втором уровне получены из атрибутов Ь-й выборки г-го сегмента на

первом уровне посредством их обработки модулями анализа цветного и черно-белого изображений, позволяющая формировать обучающие выборки для нейронных сетей модуля принятия решений по классификации форменных элементов крови.

Практическая значимость и результаты внедрения. Практическое значение работы определяется возможностью применения результатов исследования для обработки и анализа сложноструктурированных изображений.

Разработанные модели, алгоритмы и специальное программное обеспечение составили основу построения интеллектуальной системы анализа микроскопических изображений мазков крови. Программные средства ориентированы на практическое здравоохранение.

Результаты работ используются в учебном процессе Юго-Западного государственного университета при обучении студентов по специальностям 200401 «Биотехнические и медицинские аппараты и системы» и 200402 «Инженерное дело в медико-биологической практике» (дисциплина «Методы обработки биомедицинских сигналов и данных») и в опытно-конструкторских работах НИЦ (г. Курск) ФГУП «18 ЦНИИ» МОРФ, что подтверждено соответствующими актами.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих научно-технических конференциях: Международных конференциях с элементами научной школы для молодежи «БИОМЕДСИСТЕМЫ - 2009, 2010» (Рязань, 2009, 2010); XIII и XIV Международных научно-технических конференциях «Медико-экологические информационные технологии» (Курск, 2010, 2011); IX Международной конференции «Распознавание - 2010» (Курск, 2010); XVIII Международной конференции «Лазерно-информационные технологии в медицине, биологии и геологии» (Новороссийск, 2010); XXVI Международной научно-технической конференции «Математические методы и

информационные технологии в экономике, социологии и образовании» (Пенза, 2010); Всероссийской научно-технической конференции «Медицинские информационные системы МИС-2010» (Таганрог, 2010); IX Международной научно-технической конференции «Физика и радиоэлектроника в медицине и экологии (Владимир-Суздаль, 2010); Всероссийском конкурсе научных работ бакалавров и магистрантов «Биосовместимые материалы и покрытия» (Саратов, 2010); Международной научно-технической конференции «Интегративные процессы в науке - 2010» (Курск, 2010); Международной научной конференции «Молодежь и XXI век» (Курск, 2011); на научно-технических семинарах кафедры биомедицинской инженерии ЮЗГУ (Курск, 2009, 2010, 2011).

Публикации. Самостоятельно и в соавторстве по теме диссертации опубликовано 16 печатных работ, в том числе 3 работы в рецензируемых научных журналах и два свидетельства на регистрацию программы для ЭВМ.

Личный вклад автора. Все научные результаты диссертационного исследования получены автором лично. В основных научных работах по теме диссертации, опубликованных в соавторстве и приведенных в конце автореферата, личный вклад соискателя состоит в следующем: в [1, 2 и 3] разработаны нейросетевые модели для гибридных технологий автоматизированного анализа сложноструктурированных изображений; в [6, 7, 10, 11 и 12] - математические модели для спектрального анализа границ сегментов на основе теории дескрипторов Фурье; в [8 и 14] - способы формирования морфологических операторов для обработки гистологических изображений; в [15 и 16] - специальное программное обеспечение для обработки и анализа сложноструктурированных изображений.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и библиографического списка, включающего 104 отечественных и 15 зарубежных наименований. Работа изложена на 179 страницах машинописного текста, содержит 63 рисунка и 7 таблиц.

В первой главе выполнен анализ состояния предметной области: дано описание гистологических объектов и особенностей их изображений, обзор существующих методов и систем обработки медицинских изображений, а также описание основных направлений развития алгоритмов сегментации и классификации сложноструктурированных объектов.

Вторая глава посвящена разработке моделей и способов анализа сложноструктурированных изображений на основе спектральных методов. Предложено описание модели границы контура форменных элементов крови на основе теоретико-множественного подхода и с помощью Фурье-дескрипторов. Исследованы способы обеспечения инвариантности Фурье-дескрипторов относительно геометрических преобразований. Проведены исследования по оптимизации числа Фурье-дескрипторов, используемых при анализе микроскопических изображений форменных элементов крови.

Третья глава посвящена вопросам разработки и м