автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Инструментальные средства обработки изображений гистологических срезов на основе эволюционных моделей

кандидата технических наук
Мартыненко, Татьяна Владимировна
город
Донецк
год
2007
специальность ВАК РФ
05.13.06
Автореферат по информатике, вычислительной технике и управлению на тему «Инструментальные средства обработки изображений гистологических срезов на основе эволюционных моделей»

Автореферат диссертации по теме "Инструментальные средства обработки изображений гистологических срезов на основе эволюционных моделей"

ДОНЕЦКИЙ НАЦИОНАЛЬНЫЙ УНИВЕРСИТЕТ

МАРТЫНЕНКО ТАТЬЯНА ВЛАДИМИРОВНА

и '

УДК 004 048+004 932

ь

ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ОБРАБОТКИ ИЗОБРАЖЕНИЙ ГИСТОЛОГИЧЕСКИХ СРЕЗОВ НА ОСНОВЕ ЭВОЛЮЦИОННЫХ

МОДЕЛЕЙ

05 13 06 - Автоматизированные системы управления и прогрессивные информационные технологии

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

□ □3 1~75 19"?

Донецк - 2007

003175197

Диссертацией является рукопись

Работа выполнена на кафедре "Автоматизированные системы управления" ГВУЗ "Донецкий национальный технический университет" Министерства науки и образования Украины

Научный руководитель доктор технических наук, профессор

Скобцов Юрий Александрович,

заведующий кафедры "Автоматизированные системы управления" ГВУЗ "Донецкий национальный технический университет", г Донецк

Официальные оппоненты: доктор технических наук, профессор

Антощук Светлана Григорьевна,

заведующий кафедры "Информационных систем" Одесского национального политехнического университета, г Одесса

кандидат технических наук Григорьев Андрей Викторович,

Доцент кафедры "Компьютерных технологий" Донецкого национального университета, г Донецк

Защита произойдет "25"октября 2007 р в 13 часов на заседании специализированного ученого совета К 11 051 08 в Донецком национальном университете по адресу 83055, г Донецк, пр Театральный, 13, корп 4, ауд 416

С диссертацией можно ознакомиться в библиотеке Донецкого национального университета по адресу 83055, г Донецк, ул Университетская, 24, гл корпус

Автореферат разослан "24" сентября 2007 г

Ученый секретарь специализированного

ученого совета К 11 051 08 Шевцов Д.В.

Общая характеристика работы

Актуальность темы. Компьютерные системы диагностики (КСД), основывающиеся на анализе визуальной информации, используются во многих областях науки и техники для решения таких задач, как обнаружение лиц, распознавание слов, в медицинской и технической диагностике, в системах безопасности и т д Учитывая количество обрабатываемой диагностической информации, применение информационных технологий в КСД приобретает большое социально-экономическое значение Актуальность задачи повышения эффективности компьютерных систем диагностики обусловлена как широким спектром применения КСД, так и отсутствием точных методов и алгоритмов обработки и распознавания изображений

Актуальность задачи выявления опухолевых клеток определяется возрастанием процента раковых заболеваний, которые являются второй по частоте причиной смертности в развитых странах Многочисленные медико-социологические исследования показывают, что примерно 33% людей либо имеют онкологические заболевания, либо с определенной вероятностью могут ими заболеть Успешность лечения рака во многом зависит от ранней диагностики и выбора метода лечения Поэтому особенно важной является задача ранней диагностики раковых опухолей, определение отличия злокачественной структуры от здоровой и степени злокачественности

Для диагностики и прогнозирования развития новообразований обязательным является гистологическое исследование атипичных клеточных структур В настоящее время анализ изображений гистологических срезов производится вручную врачами морфологами, и вывод о наличии тех или иных признаков злокачественности значительно зависит от врача, который анализирует снимок Компьютерная обработка изображения позволяет делать объективную оценку изображений, повысить точность устанавливаемого диагноза и скорость обработки информации Автоматизация анализа морфологии гистологических срезов позволяет повысить точность обнаружения изменений внутренних органов при онкологических заболеваниях и ускорить процесс обработки препаратов, и тем самым расширить возможности профилактики и предупреждения появления злокачественных новообразований Однако сложность получения качественных гистологических препаратов и высокая вариабельность большинства гистологических структур не позволили до настоящего времени разработать эффективных методов по обработке и распознаванию изображений гистологических срезов в диагностике раковых заболеваний

Следует отметить, что существующие модели, алгоритмы и разработанные на их основе инструментальные средства используют ручную подстройку значений параметров и последовательностей операторов обработки изображений, что как правило приводит к снижению качества обработки и сегментации изображений Поэтому, не смотря на проводимые до настоящего времени исследования, задача обработки и сегментацп изображений гистологических срезов остается актуальной

Связь работы с научными программами, планами, темами. Работа выполнялась на кафедре "Автоматизированные системы управления" ГВУЗ "Донецкий национальный технический университет" Разработанные инструментальные средства были использованы во время выполнения научно-исследовательских работ Н-3-07 «Разработка научных основ построения компьютерных систем технической и медицинской диагностики», Д-11-07 «Разработка и исследование эволюционных и нейросетевых моделей, методов и алгоритмов в системах диагностики и прогнозирования» (номер госрегестрации 010711001482), в которой автор принимал участие, как исполнитель

Цель работы: Повышение эффективности инструментальных средств обработки изображений гистологических срезов за счет использования эволюционного моделирования

Для достижения поставленной цели необходимо решить такие основные задачи:

— провести анализ цветных изображений гистологических срезов, выделить их типовые компоненты и определить особенности, на основе которых выполнить математическую постановку задачи обработки изображений гистологических срезов,

—разработать метод для определения рациональных значений параметров сегментации цветных изображений гистологических срезов и разработать критерии для оценки качества сегментации,

— разработать метод для построения эффективных алгоритмов обработки цветных изображений гистологических срезов, а также разработать основные критерии для оценки эффективности построенных алгоритмов,

—-разработать инструментальные средства обработки и сегментации цветных изображений гистологических срезов с помощью предложенного подхода,

— на основе анализа полученных результатов с использованием предложенных инструментальных средств разработать практические рекомендации по построению эффективных алгоритмов обработки изображений гистологических срезов

Объектом исследования являются цифровые изображения гистологических срезов для диагностики раковых заболеваний

Предметом исследований являются методы и алгоритмы обработки изображений гистологических срезов во время диагностики онкологических заболеваний

Методы исследования В работе применены эволюционные методы оптимизации (для определения рациональных значений сегментации), генетическое программирование, методы цифровой обработки изображений (для синтеза эффективных алгоритмов обработки и сегментации изображений), системный анализ (для построения структуры

инструментальных средств обработки и сегментации изображений гистологических срезов)

Научная новизна полученных результатов

1 Впервые предложен метод кодирования потенциальных решений в виде сложных хромосом, что позволило применить эволюционный подход для синтеза эффективных алгоритмов обработки изображений гистологических срезов

2 Разработан новый метод на основе модифицированного генетического алгоритма для определения рациональных значений параметров сегментации цветных изображений гистологических срезов, которая позволяет повысить эффективность обработки изображений гистологических срезов в среднем на 23% по сравнению с известными методами

3 Впервые предложен новый эволюционный метод на базе генетического программирования, отличающийся от существующих сетевой структурой хромосом, для которого разработаны проблемно-ориентированные операторы кроссинговера и мутации, позволяющие повысить скорость сходимости эволюционного процесса и точность синтезированных алгоритмов обработки изображений

4 Определены рациональные значения параметров разработанных эволюционных методов обработки цветных изображений гистологических срезов, что позволило повысить точность сегментации

Практическое значение полученных результатов

1 На базе предложенных эволюционных методов разработана структура и реализованы инструментальные средства обработки и сегментации изображений гистологических срезов, обеспечивающие высокую эффективность диагностики раковых заболеваний

2 Применение разработанных инструментальных средств привело к увеличению точности сегментации изображений гистологических срезов в среднем на 17%

3 Результаты экспериментальных исследований и основанные на них рекомендации по изменению значений параметров генетических алгоритмов обработки и сегментации изображений гистологических срезов и их программная реализация переданы в отделение патологической анатомии Донецкого областного клинического территориального медицинского объединения (ДОКТМО) Их использование позволило повысить эффективность диагностики раковых заболеваний без дополнительных затрат, усовершенствовать систему обработки и классификации изображений гистологических срезов

4 Результаты диссертационной работы использованы во время выполнения научно-исследовательских работ Н-3-07, Д-11-07 и в учебном процессе кафедры "Автоматизированные системы управления" ГВУЗ "Донецкий национальный технический университет"

Личный вклад соискателя. Все основные положения, теоретические и практические результаты диссертационной работы, выносимые на защиту, получены автором самостоятельно

Апробация результатов диссертации. Основные положения и результаты диссертационной работы были доложены и обговорены на II научно-практической конференции «ДОНБАС-2020 наука 1 техшка -виробництву» (Донецкий национальный технический университет, г Донецк, 2004 г), II международной научной конференции «1нтелектуальт системи прийняття рппень 1 прикладш аспекта шформацшних технологш (180М1Т'2006)» (г Евпатория, 2006 г), IX научно-практической международной конференции «1нформащйн1 технологи в освга та управлшш» (г Новая Каховка, 2007 г )

Публикации. Содержание диссертации отражено в 6 научных публикациях, из них 4 - в ведущих научно-технических сборниках, утвержденных ВАК Украины, а остальные - в сборниках трудов конференций

Структура и объем работы. Диссертационная работа состоит из введения, пяти разделов, выводов, списка использованной литературы (122 позиции), 4 приложений Содержит 47 рисунков, 7 таблиц Полный объем диссертации - 131 страница машинописного текста

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы диссертации, показана ее научная и практическая ценность, сформулированы цель и задачи исследования, которые необходимо решить для ее достижения Приведена краткая характеристика результатов исследований, степень их апробации и публикации, структура работы

В первом разделе диссертации проведен анализ современного состояния систем обработки изображений и методов представления и обработки визуальной информации, составлена обобщенная функциональная схема систем обработки и классификации медицинских изображений (СОКМИ) На основе анализа изображений гистологических срезов выделены их типовые компоненты размеры и форма клеток, ядер, ядерно-цитоплазматическое отношение, ядрышки и т д Выполнен обзор существующих современных автоматизированных систем, основывающихся на анализе визуальной информации, который показал, что данные системы обладают низкой точностью сегментации для изображений гистологических срезов, а так же в них отсутствует эффективный автоматический подбор значений параметров и последовательностей операторов обработки изображений

Проведенный анализ и классификация современных математических методов обработки и распознавания изображений показал необходимость дальнейшего развития алгоритмов и моделей обработки и сегментации изображений На основе анализа выполнена постановка задачи и выбраны

эволюционные методы для разработки инструментальных средств обработки изображений гистологических срезов

Второй раздел посвящен разработке модифицированного генетического алгоритма для сегментации цветных изображений гистологических срезов, в которых классификация осуществляется вне зависимости от расположения элементов

Для решения поставленной задачи предложена пошаговая процедура обработки изображения

Mn=operate(sit¡,PS'»,Nn\ (1)

где М„ - промежуточное изображение на n-ом етапе обработки, S, -операция обработки изображения (ООИ), Р1 - набор значений параметров ООИ, п - номер последовательно идущей операции обработки изображения, i порядковый номер ООИ из набора доступных, N„ - набор промежуточных изображений, полученных на предыдущих шагах на основе которых строится изображение М„

N„ = [nun2, (2)

Поскольку не известно, какая именно цветовая схема обеспечит наиболее эффективную процедуру сегментации, то предложено представить входное изображение как набор цветовых плоскостей

I = {C,R, G, Blue, Н, Light, S, L,a, b,u,v} (3)

Каждая цветовая плоскость содержит значения пикселей изображения в одной из цветовых схем (ЦС) RGB, HLS, Lab и Luv

Следовательно, первые 12 цветовых плоскостей будут фиксированы М0=С, Мх = R, M2=G, Мъ = Blue, М4=Н, М5= Light, M6=S, M-j = L, (4)

M%=a, M9 = b, Мю-и, Mu=v Таким образом, для решения поставленной задачи достаточно применить к одной из цветовых плоскостей последовательно две операции М12 = operate(ChpLo,(CL), (field)), (5)

Mn=operate{ChpHi,(CH)X12)), (6)

где ChpLo - операция порогового ограничения, при которой все значения пикселей ЦС с номером field {field е {О, I, 2, , 11}) ниже значения параметра CL (CL е [0 255]), устанавливаются в 0, остальные сохраняют свои значения, ChpHi - все значения пикселей, которые превышают значение параметра СН (СН е [0 255]), устанавливаются в 0, остальные в 1

В результате выполнения приведенных операций получаем бинарное изображение Мц

Задача синтеза эффективного алгоритма обработки и сегментации изображения заключается в том, чтобы для изображений заданного вида гистологического исследования определить такую последовательность операторов обработки изображений с соответствующими значениями

параметров, при которых критерий оценки качества сегментации Р(?) стремился к экстремуму

р{2,)=ех1гр{2) (7)

Точность обработки изображения определяется с помощью оценки целевой функции (ЦФ) Р. которую в зависимости от специфики вида гистологического исследования предложено вычислять двумя способами

1 Если анализ гистологического исследования не зависит от взаиморасположения элементов на изображении, то в качестве ЦФ предложено использовать минимизацию отклонения полученного количества элементов от количества элементов, определенного по обучающей выборке (с известными результатами классификации)

с

Fl=Y\NJ-KJ\>(P'^^l (8)

У=1

где И] - количество элементов изображения гистологического среза, полученное с помощью многомерной пороговой сегментации, К] -количество элементов, полученное из обучающей выборки, С - количество классов элементов

2 Функция Р2 определяется путем сравнения сегментированного изображения Мк с изображением из обучающей выборки в/

Р2 - В(<Мк,С1), (9)

где О - мера различия между эталоном в) и изображением М^

Я = [м^рлус^рл)}2 (10)

р ч

Сходство с эталоном существует, если

0<ЬВ, (11)

где Ьц - выбранное пороговое значение

Для решения поставленной задачи предложено использовать целевую функцию

^ - а)))2 + (1 - Xа))2 {П)

С л/8

где а е [ОД] позволяет осуществить подстройку систематической ошибки поиска в зависимости от наивысшей чувствительности 5К (высокое значение а, близкое к 1) и от наивысшей специфичности 8Р (низкое значение а, близкое к 0)

ТР

БУ=———, (13)

ТР + Ш

ТЫ

5Р = —^—, (14)

ТЫ + РР

где ТР - количество правильно найденных значений позитива, РР -количество неправильно найденных значений позитива, 'ГМ - количество правильно найденных значений негатива, РК' - количество неправильно найденных значений негатива

Структуру хромосомы - потенциального решения при поиске рациональных значений параметров сегментации цветных изображений гистологических срезов можно представить следующим образом

СИг} = \field, СЬ, СН], (15)

где ] - номер особи в популяции

Информационная схема эффективной обработки изображений с использованием генетических алгоритмов (ГА) представлена на рис 1 Эволюционный процесс выполняется для всех изображений обучающей выборки с различными наборами значений параметров Набор параметров, обеспечивающий получение наилучшего результата Оггк сохраняется в «конечном репозитории генотипа», если получено удовлетворительное значение целевой функции (ЦФ) После определения значения ЦФ запись, содержащая данные о генотипе, значении ЦФ и идентификатор фенотипа [СИгк] к,}, К) записывается в базу данных - «репозиторий оценки» Далее из репозитория оценки удаляются все особи, значения ЦФ которых превышает р}, В свою очередь рь определяется по ЦФ и возрасту особи (соответствующее значение И)

Рис 1 Информационная схема эффективной обработки изображений с использованием генетических алгоритмов В третьем разделе осуществляется разработка эволюционного алгоритма для построения эффективных алгоритмов обработки и сегментации изображений (ОСИ) гистологических срезов

В отличие от предыдущей задачи при сегментации изображений гистологических срезов, таких как лимфатические узлы и железы необходимо учитывать расположение структурных элементов В связи с этим решение данной задачи может быть проведено в два этапа на первом осуществляется обработка изображения с целью выделения областей интереса, на втором - сегментация и анализ изображения Оба данных этапа могут быть представлены в виде последовательности операторов обработки изображений Предложено реализовать подбор их эффективной последовательности с помощью эволюционного программирования

Реализация эволюционного процесса предполагает решение следующих основных задач кодирование особей, выбор целевой функции и оператора репродукции, разработка проблемно-ориентированных операторов кроссинговера и мутации

Предложено кодировать потенциальное решение поставленной задачи хромосомой, представленной в виде

Chr¡=[ml,m2, ,m¡\, (16)

где - ген, кодирующий операцию обработки изображения с

соответствующими значениями параметров сегментации, / - длина хромосомы, i - номер особи ч популяции

Для решения задачи cet ментзчии изображений гистологических срезов предложено каждый ген представить в виде

m J = [propj, rp}, wpj, paraifij], ( 17)

где propj - стандартная операция обработки изображения, щ - вектор входных плоскостей, wp¡ - вектор выходных плоскостей, рагат} - вектор параметров операции обработки изображения

Параметры могут быть целочисленными, вещественными или определяющими категорию Входные плоскости Mo M¡¡ получаются представлением исходного изображения в системах координат цвета RGB, HLS, Lab, Luv и значение контрастности Выходные плоскости М}2 Md получаются в результате обработки и могут служить входными плоскостями для других ген

При формировании множества возможных решений используется набор стандартных операторов обработки изображений (генофонд СОКМИ), который может меняться в зависимости от области применения В таблице 1 приведен набор стандартных пространственных, логических и пороювых операторов

Таблица 1

№ ПП Обозначение гена Операция обработки изображения Количество

входов выходов параметров

1 AddP Добавляет плоскость 2 1 0

2 AddS Добавляет скаляр 1 1 1

3 SubP Вычитает плоскость 2 1 0

4 Di ff Абсолютная разница 2 1 0

Продолжение таблицы 1_

№ 1J11 Обозначение Операция обработки изображения Количество

гена входов выходов параметров

5 NDI Индекс нормализированной разности 2 1 0

6 MultS Умножение на скаляр 1 1 1

7 Neg Инвертирование плоскости 1 1 0

8 MultP Умножение плоскостей 1 0

9 SqrtP Корень квадратный 1 1 0

10 SqrP Квадрат 1 1 0

11 MmP Минимум 1 0

12 MaxP Максимум 1 0

13 IfEl Если меньше, то иначе 1 1 1

14 ClipHi Пороговое ограничение высоких значений яркостей 1 1 1

15 ClipLo Пороговое ограничение низких значений яркостей 1 1 1

16 Thresh Порог 1 1 1

17 Laplac3 Оператор Лапласа 3x3 1 1 0

18 Laplac5 Оператор Лапласа 5x5 1 1 0

19 Morph Laplac Морфологический оператор Лапласа 1 1 1

20 IsoGrad Изотропический градиент 1 1 0

21 Range Ранжирование 1 1 1

22 Erod Эрозия 1 1 2

23 Dil Наращивание 1 1 2

24 Open Открытие 1 1 2

25 Clos Закрытие 1 1 2

26 OpCl Открытие-закрытие 1 1 2

27 ClOp Закрытие-открытие 1 1 2

28 TopHat Цилиндр 1 1 2

29 AreaP Площадь 1 1 0

30 Ext Эксцентриситет 1 1 0

31 Penmeter Периметр 1 1 0

32 Distance Расстояние 2 1 0

Основные математические операции AddS добавляет к входу скалярную величину (которая в общем случае может быть отрицательной) Diff аналогичен оператору SubP, но выходная плоскость содержит модуль разности входных плоскостей NDI аналогичен оператору SubP, но делит результат на сумму двух входов Операции МшР и МахР соответствуют попиксельному нахождению максимума и минимума, что эквивалентно AND и OR для бинарных входов

Операторы соседства обрабатывают единственную входную плоскость и получают выходную Выход каждого пикселя определяется проверкой соседей пикселя Остальные операторы представляют хорошо известные функции обработки изображений или морфологические операторы Большинство из них имеют один параметр, который определяет радиус кругового структурного элемента для определения соседей к которым оператор применяется

Ограничение на формирование хромосомы каждый ген rrij в качестве входных данных может использовать только плоскости данных Мо Ми, либо промежуточные плоскости Мп Мл, определенные в одном из предшествующих генов

Алгоритм обработки изображения, представленный отдельной хромосомой может быть изображен в виде направленного ациклического графа (рис 2), где нетерминальные узлы являются стандартными операторами обработки изображений, конечные узлы - выходными, а вершины - входными плоскостями изображения В общем случае возможна не древовидная, а сетевая структура

[AddS rMO wMl 2 53] [NDI гМЗ rM12 wM12] [Sqrt rM12 wM12] [ClipHi rM12 wM13 70] [OpCl rM13 wM13]

Рис 2 Сетевое представление хромосомы

Обход графа осуществляется сверху вниз и слева направо Результат обработки выбранных цветовых плоскостей с помощью первой операции помещается во временную плоскость Мп Входными плоскостями для следующей операции обработки могут быть плоскости из набора М,, М12 Результат обработки может быть записан во временную плоскость М12 После выполнения алгоритма получается набор плоскостей М12 Мл, являющихся промежуточными изображениями, которые формируются на соответствующих шагах обработки Полученный набор оценивается с точки зрения значений ЦФ и в качестве выходного принимается программный блок, приводящий к лучшему решению

Для получения наиболее эффективных алгоритмов обработки изображения с помощью ГП и для определения наилучшей идентификации отдельного класса задач анализа изображений основываясь на понятиях чувствительности (13) и специфичности (14) разработана целевая функция

(18)

где р - штраф глубины программного графа, который определяется по формуле

^></-0,5 й - 0,5) ^ тй-1

где й - количество узлов текущей особи, тй - параметр ГП соответствующий максимальной глубине графа

Чтобы избежать случайного выбора точек кроссинговера и сохранить правильные решения в процессе эволюции, предложено ставить в соответствие каждому ребру программного графа весовой коэффициент несовместимости Кнс, определяющий насколько два узла связаны друг с другом Применение адаптивного оператора кроссинговера на основе коэффициента несовместимости приведено на рис 3

Предотвращение зацикливания эволюционного процесса осуществляется за счет ограничения количества итераций Если после выполнения определенного количества итераций эффективная программа не была обнаружена, то необходимо остановить процесс поиска и поместить копию программы в следующее поколение

В четвертом разделе проведена проверка работоспособности и эффективности разработанных эволюционных алгоритмов, определены рациональные значения их параметров

Для проведения экспериментальных исследований был применен отобраный набор изображений срезов, полученный на базе отделения патологической анатомии Донецкого областного клинического территориального медицинского объединения

Спланирована и проведена серия экспериментов для определения рациональных значений параметров эволюционного процесса Анализ данных, представленных графиком зависимости целевой функции /с от количества поколений и мощности популяции для ГА по подбору рациональных значений параметров сегментации (рис 4, где кривые 1- для 25 хромосом, 2 - для 50 хромосом, 3 - для 75 хромосом, 4 - для 100 хромосом, 5 - решение,

полученное с помощью метода Лг-средних) показал, что рациональными значениями параметров ГА целесообразно выбирать мощность популяции равную 100 при количестве поколений 8, поскольку при этих значениях параметров наблюдается увеличение значения функции^

значение Кис

Рис 3 Применение адаптивного оператора кроссинговера на основе значения коэффициента несовместимости Анализ результатов экспериментальных исследований зависимости целевой функции/Ь от количества поколений С в (рис 5, где кривые 1 - для 25 хромосом, 2 - для 50 хромосом, 3 - для 75 хромосом, 4 - для 100 хромосом, 5 - решение, полученное с помощью метода ¿-средних) показал, что максимальное значение достигнуто при мощности популяции равной 50 и количестве поколений равного 8 Полученные значения предложено принять как рациональные

Полученная на основании экспериментальных исследований зависимость (рис 6, где кривые соответствуют разным вероятностям мутации (Рм) 1 - 0,01,2 - 0,05,3 - 0,1,4 - 0,15) позволила установить, что при изменении вероятности адаптивного кроссинговера {Рас) на интервале (0,25,1) функция /с достигает своего максимального значения при рассмотренных значениях вероятностей мутации

3 .....: 2 .. 5 ......

; /

:

Со

О 5 15 25 35 45

Рис. 4. Зависимость целевой функции /с от количества поколений (Со) и мощности популяции для ГА по подбору рациональных значений параметров сегментации

---

... -5 . ... ............... 4

1

0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1

-I-*-»-1 Рас

0 0,25 0,5 0,75 1

Рис. 6. Зависимость целевой функции /Ь от вероятности адаптивного кроссинговера на основе коэффициента несовместимости (Рас) для ГА по построению эффективных алгоритмов обработки и распознавания цветных изображений гистологических срезов

0,9 0,8 0,7 0,6 0,3 0,4 0,3 0,2 0,1

о 4-1-;-;-}-\Со

О 5 15 25 35 45

Рис. 5. Зависимость целевой функции _/Ь от количества поколений (Се) и мощности популяции для ГА по построению эффективных алгоритмов обработки и распознавания цветных изображений . гистологических срезов

6

С0

О 5 15 25 35 45

Рис. 7. Зависимость целевой функцииот количества

поколений (Со): 1-е использованием классического оператора кроссинговера для деревьев; 2 -адаптивный оператор кроссинговера на основе коэффициента несовместимости

Анализ экспериментальных исследований (рис 6) показал, что использование адаптивного оператора кроссинговера на основе значения коэффициента несовместимости не зависит от значений вероятностей мутации и кроссинговера

Анализ данных, представленных в виде графика (рис 7) позволил установить, что использование адаптивного оператора кроссинговера на основе значения коэффициента несовместимости улучшает скорость сходимости эволюционного процесса в среднем на 28%

Обобщенные данные о полученных результатах ГА по определёнию рациональных значений параметров сегментации приведены в таблице 2

Таблица 2

Основные результаты экспериментальных исследований для ГА по подбору рациональных значений параметров сегментации_

Параметр Целевая функция

Наименование Обозначение îa /в /г

Мощность популяции Spop 100 25 25

Количество поколений CG 8 6 7

Вероятность мутации Рм 0,07 0,09 0,06

Основные результаты экспериментальных исследований для ГА по построению эффективных алгоритмов обработки и сегментации изображений гистологических срезов сведены в таблицу 3

Таблица 3

Основные результаты экспериментальных исследований_

Параметр Целевая функция

Наименование Обозначени е /а Гв /г /о

Глубина программного графа md 17 15 7 25

Мощность популяции Spop 75 75 100 50

Количество поколений Со 7 7 7 8

Вероятность мутации Рм 0,07 0,07 0,07 0,09

Вероятность кроссинговера Pc 0,25 0,5 1 0,75

Вероятность для адаптивного кроссинговера Рас 0,5

Поскольку параметр а осуществляет подстройку систематической ошибки поиска в зависимости от значений чувствительности и специфичности, то его значение будет различно для разных видов гистологических

исследований Поэтому перед проведением нового вида гистологического исследования необходимо определить значение параметра а

Пятый раздел посвящен разработке структуры инструментальных средств обработки изображений гистологических срезов на основе разработанных эволюционных моделей

Инструментальные средства имеют модульную структуру и состоят из следующих основных подсистем (рис В)

— подсистема обработки изображений,

— подсистема подбора рациональных значений параметров сегментации,

— подсистема построения эффективных алгоритмов обработки и сегментации изображений гистологических срезов

Рис 8 Структура инструментальных средств обработки изображений гистологических срезов на основе эволюционных моделей

Инструментальные средства реализованы с использованием интегрированной среды разработки Delphi 7 0 Разработана база данных (БД) в формате СУБД Paradox 7 0, в которой предусмотрено хранение полученных значений параметров сегментации и эффективных алгоритмов обработки изображений гистологических срезов

Подсистема обработки изображений включает в себя набор операторов обработки изображений и морфологические операторы Также подсистема

включает в себя процедуры вычисления значений целевых функций В случае, если в системе уже существует построенный алгоритм для данного вида гистологического исследования, то подсистема обработки изображений организовывает ввод соответствующей информации из БД Далее происходит последовательное применение операторов обработки изображений с рассчитанными значениями параметров

Подсистема подбора рациональных значений параметров сегментации позволяет получить значения коэффициентов для отсечения по низким и высоким значениям яркости выбранной плоскости данных Результаты представляются в виде числовых значений параметров выходной плоскости изображения По желанию лица, принимающего решение (ЛПР) значения коэффициентов могут быть занесены в БД, а выходная плоскость сохранена на жестком диске В подсистему подбора рациональных значений параметров сегментации входит модуль стандартного генетического алгоритма, позволяющий осуществлять механизмы селекции, мутации и репродукции, а так же стратегию элитарного отбора

Подсистема построения эффективных алгоритмов обработки и сегментации изображений гистологических срезов позволяет определить эффективную последовательность операций обработки изображений с соответствующими рациональными значениями параметров Результатом работы подсистемы являются номера операторов обработки изображений из заранее определенного набора, значения их параметров, а так же результирующая плоскость В случае, если достоверность результатов, представленных на выходной плоскости изображения, обработанной с помощью построенного алгоритма, утверждена ЛПР, то полученные значения записываются в БД

Модифицированная эволюционная программа осуществляет операторы мутации узлов программного графа и кроссинговера на основе значения коэффициента несовместимости

Разработан модуль, в котором имеется возможность задавать значения следующих параметров эволюционного процесса для повышения эффективности алгоритмов обработки и сегментации изображений гистологических срезов

— выбор типа операторов мутации и кроссинговера, а также значения вероятности их выполнения,

— критерий останова алгоритма,

— выбор целевой функции ifcjo),

— начальные параметры генетического алгоритма (мощность популяции, количество поколений, стратегия отбора, длина хромосомы)

База данных предназначена для хранения информации о последовательности операторов обработки изображений с соответствующими значениями параметров для каждого вида гистологического исследования и состоит из 4 таблиц формата СУБД Paradox 7 0 База данных включает следующие таблицы

— справочник видов гистологических исследований (Н^Кшс!),

— данные по операциям обработки и сегментации изображений для вида гистологического исследования (ЕРО_А^),

— набор входных плоскостей для каждого алгоритма (ДР^пев),

— набор значений параметров операции обработки изображений (1РО_Рагат),

— виды параметров операций обработки изображений (Рагат)

Предложенный способ реализации имеет модульную структуру,

состоящую из подсистемы подбора рациональных значений параметров сегментации и подсистемы построения эффективных алгоритмов обработки и сегментации изображений гистологических срезов, которые могут использоваться независимо друг от друга, а так же могут применяться независимо от объекта и быть применены к различным изображениям без перестройки внутренней структуры

ВЫВОДЫ

В диссертационной работе дано новое решение актуальной научной задачи создания инструментальных средств обработки изображений гистологических срезов, построенных на основе эволюционных моделей Созданные средства позволяют повысить достоверность обнаружения изменений внутренних органов при онкологических заболеваниях и ускорить процесс обработки препаратов, а также расширяют возможности профилактики и предупреждения возникновения злокачественных новообразований

При проведении исследований получены следующие основные результаты

1 На основе анализа цветных изображений гистологических срезов выделены их типовые компоненты, сформулирована математическая постановка задачи

2 Разработан метод на основе модифицированного генетического алгоритма, который позволяет определять рациональные значения параметров сегментации цветных изображений гистологических срезов, повышающий эффективность алгоритма обработки и сегментации изображений гистологических срезов по сравнению с известными методами в среднем на 23%

3 Предложен метод на основе генетического программирования, для которого с учетом особенностей объекта исследования разработана сетевая структура представления хромосом, что позволяет расширить возможности и повысить точность обработки и сегментации изображений гистологических срезов в среднем на 17%

4 Разработан проблемно-ориентированный оператор кроссинговера на основе значения коэффициента несовместимости, обеспечивающий увеличение скорости сходимости эволюционного процесса и повышение точности сегментации в среднем на 28% и 7% соответственно

5 Для модифицированного генетического алгоритма и разработанной эволюционной программы определены рациональные значения параметров мощность популяций, количество поколений, вероятности кроссинговера и мутации, обеспечивающих определение эффективных значений выбранных критериев

6 Разработаны инструментальные средства, построенные на основе эволюционных моделей, которые приводят к улучшению эффективности обработки изображений гистологических срезов

7 Разработанные инструментальные средства обработки изображений гистологических срезов и практические рекомендации переданы в отделение патологической анатомии Донецкого областного клинического территориального медицинского объединения и используются при диагностике раковых заболеваний Полученные в работе результаты могут применяться так же для обработки различных изображений без перестройки внутренней структуры

8 Результаты, полученные в диссертационной работе, использованы в научно-исследовательских работах ГВУЗ "Донецкий национальный технический университет" Н-3-07, Д-11-07, а так же в учебном процессе кафедры "Автоматизированные системы управления" ГВУЗ "Донецкий национальный технический университет"

Список работ по теме диссертации

1 Скобцов Ю А, Мартыненко Т В, Белявцев А А Обработка изображений гистологических срезов и распознавание опухолевых клеток // 36 наук пр ДонНТУ Серш Обчислювальна технша та автоматизащя, випуск74 -Донецьк ДонНТУ -2004 -С 160-165

2 Мартыненко Т В Сегментация и классификация цветных изображений гистологических срезов // 36 наук пр ДонНТУ Сер]я Обчислювальна технша та автоматизащя, випуск 107 - Донецьк ДонНТУ -2006 -С 104-110

3 Скобцов Ю А , Мартыненко Т В Адаптивная сегментация цветных изображений гистологических срезов на основе эволюционных моделей // Моделювання та керування станом еколого-економгчних систем репону, випуск3 -НацюнальнаАкадемшНаукУкраши -2006 -С 258-266

4 Скобцов Ю А, Мартыненко Т В Построение эффективных алгоритмов обработки и распознавания изображений гистологических срезов на основе эволюционных моделей // Вестник Херсонского национального технического университета, №4(27) -2007 -С 43-48

5 Скобцов Ю А, Мартыненко Т В , Гульков Ю К , Белявцев А А Обработка изображений гистологических срезов и распознавание опухолевых клеток // Матершли II науково-практично1 конференцц "ДОНБАС-2020 наука 1 техшка-виробництву", - Донецьк ДонНТУ - 2004 -С 566-569

6 Скобцов Ю А, Мартыненко Т В Адаптивная сегментация цветных изображений гистологических срезов на основе генетических алгоритмов //

1нтелектуалып системи прийняття рннень та приклада« аспекта шформащйних технологш Матергали мшнародшл науковог конференцц Том 1 - Херсон Видавництво Херсонського морського шституту, 2005 - С 192-195

В работах, выполненных в соавторстве, личный вклад соискателя заключается в следующем [1, 5] - разработка методов и алгоритмов обработки изображений гистологических срезов, определение геометрических характеристик гистологических элементов на изображениях, [3, 6] - разработка метода определения рациональных значений параметров сегментации изображений гистологических срезов, определение структуры хромосомы и выбор способа кодирования, [4] - разработка эволюционной модели, функционального и терминального множеств, целевой функции, проблемно-ориентированных операторов кроссинговера и мутации

Анотацш

Мартиненко Т В «1нструментальш засоби обробки зображень пстолопчних зргав на основ1 еволюцшних моделей» - Рукопис

Дисертац1я на здобуття наукового ступени кандидата технмних наук за спещальшспо 05 13 06 - "Автоматизоваш системи управлшня та прогресивш шформащйш технологи"' - Донецький нацюнальний унтерситет, Донецьк, 2007

Дисертацш присвячена виршенню проблеми тдвищення ефекгивност1 шструментальних засобге обробки зображень пстолопчних зргав з використанням методга 1 алгоритмт обробки та сегмеитацп зображень Запропоновано метод на основг модифшованого генетичного алгоритму, який дозволяе визначати ращональш значения параметрт сегментаци кольорових зображень пстолопчних зргав Також розроблено еволюцшний метод, який мае мережеву структуру хромосом 1 використовуе розроблеш проблемно-ор1ентоваш оператори кросинговеру 1 мутацп Проведено дослщження, що дозволяють визначити ращональш значения параметра еволюцшних алгоритмхв, таи як потужнють популяцп, млыасть поколшь, стратегш в1дбору, довжина хромосоми, значения ймовфностей операцш кросинговеру 1 мутацп та ш Розроблено нову структуру шструментальних засоб1в для обробки зображень пстолопчних зргав, що забезпечуе високу ефекгившсть диагностики ракових захворювань

Ключов1 слова: шформащйш технологи, обробка зображень, еволюцшний алгоритм, генетичний алгоритм, генетичне програмування, сегментаци, кросинговер, мутащя, кольоров1 зображення

Аннотация

Мартыненко Т В «Инструментальные средства обработки изображений гистологических срезов на основе эволюционных моделей» -Рукопись

Диссертация на соискание ученой степени кандидата технических наук по специальности 05 13 06 - "Автоматизированные системы управления и

прогрессивные информационные технологии" - Донецкий национальный университет, Донецк, 2007

Диссертация посвящена решению проблемы повышения эффективности инструментальных средств обработки изображений гистологических срезов за счет использования методов и алгоритмов обработки изображений

В работе проведен анализ изображений гистологических срезов, на основе которого выделены их типовые компоненты и определены особенности Выявлены основные недостатки существующих методов обработки и распознавания изображений низкая точность сегментации для изображений гистологических срезов, а так же отсутствие эффективного автоматического подбора параметров и последовательностей операторов обработки изображений Для преодоления вышеуказанных недостатков предложено использовать методы эволюционного моделирования

Разработан метод на основе модифицированного генетического алгоритма для определения рациональных значений параметров сегментации изображений гистологических срезов, который в отличие от известных методов позволяет повысить эффективность алгоритма обработки и сегментации изображений гистологических срезов

Предложен эволюционный метод на основе генетического программирования, для которого с учетом особенностей объекта исследования разработана сетевая структура представления хромосом При формировании множества возможных решений используется набор стандартных операторов обработки изображений Для обеспечения большей эффективности оператора кроссинговера эволюционной программы предложено ввести весовой коэффициент несовместимости, позволяющий управлять выбором точек пересечения и объединять вершины графа в эффективные блоки Для сохранения правильных решений в процессе эволюции, в соответствие каждому ребру программного графа ставится весовой коэффициент несовместимости, зависящий от значения целевой функции программного блока и определяющий насколько два узла связаны друг с другом Точка кроссинговера выбирается в ребре с наибольшим значением коэффициента несовместимости

С целью определения рациональных значений параметров эволюционных алгоритмов, таких как мощность популяции, количество поколений, стратегия отбора, длина хромосомы, значения вероятностей кроссинговера и мутации и т д на базе паталого-анатомического отделения ДОКТМО была проведена серия экспериментов Полученные рациональные значения позволяют повысить точность сегментации изображений гистологических срезов в среднем на 17% по сравнению с результатами, полученными по методу ¿-средних Проведенные вычислительные эксперименты позволили установить, что использование адаптивного оператора кроссинговера на основе значения коэффициента несовместимости повышает скорость сходимости эволюционного процесса и точность сегментации изображений гистологических срезов в среднем на 28% и 7% соответственно

На базе предлагаемого подхода разработаны инструментальные средства обработки изображений, использование которых приводит к улучшению точности сегментации изображений гистологических срезов Выполнено обобщение полученных результатов, которые свидетельствуют о том, что построенные на основе эволюционных моделей алгоритмы обработки и сегментации изображений гистологических срезов обеспечивают более высокую эффективность диагностики раковых заболеваний

Ключевые слова: информационные технологии, обработка изображений, эволюционный алгоритм, генетический алгоритм, генетическое программирование, сегментация, кроссинговер, мутация, цветные изображения

Abstract

Martynenko Т V «Tools of images processing of histological cuts based on evolutionary models» - Manuscript

The thesis on scientific degree candidacy m technical science for the spatiality 05 13 06 - "Automated control systems and progressive informational technologies" - Donetsk National University, Donetsk, 2007

The thesis is devoted to the decision mcreasmg of efficiency problem of histological cuts images processing tools due to use of methods and algorithms of images processing and segmentation The method based on modified genetic algorithm which allows defining parameters rational values of histological cut colour images segmentation is offered Also the evolutionary method with network structure of a chromosome is proposed and it uses the developed problem-oriented crossover and mutations operators Camed out researches allow to determine rational parameters of evolutionary algorithms, such as power of a population, count of generations, strategy of selection, length of a chromosome, value of crossover and mutations probabilities, etc The new tools for images processing of histological cuts which provides high efficiency of cancer diseases diagnostics is developed

Keywords: information technologies, images processing, evolutionary algorithm, genetic algorithm, genetic programming, segmentation, crossover, mutation, color images

(

Отпечатано на ризографе ООО фирма "ДРУК-ИНФО" Подп к печати 24 09 2007 г

У слов печат л 0,9 Тираж 100 экз Заказ №1640 83000, г Донецк, ул Артема, 58, к 113