автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Методы согласованного отбора признаков для классификации полутоновых диагностических изображений
Автореферат диссертации по теме "Методы согласованного отбора признаков для классификации полутоновых диагностических изображений"
На правах рукописи
Гайдель Андрей Викторович
МЕТОДЫ СОГЛАСОВАННОГО ОТБОРА ПРИЗНАКОВ ДЛЯ КЛАССИФИКАЦИИ ПОЛУТОНОВЫХ ДИАГНОСТИЧЕСКИХ ИЗОБРАЖЕНИЙ
05.13.17 - Теоретические основы информатики
Автореферат
диссертации на соискание учёной степени кандидата технических наук
- 2ПГН 2015
Самара — 2015
005561918
005561918
Работа выполнена в федеральном государственном автономном образовательном учреждении высшего образования «Самарский государственный аэрокосмический университет имени академика С.П. Королева (национальный исследовательский университет)» (СГАУ) на кафедре технической кибернетики и в федеральном государственном бюджетном учреждении науки Институте систем обработки изображений Российской академии наук.
Научный руководитель:
доктор технических наук, доцент Храмов Александр Григорьевич
Официальные оппоненты:
Крашенинников Виктор Ростиславович, доктор технических наук, профессор, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Ульяновский государственный технический университет», заведующий кафедрой прикладной математики и информатики;
Кузнецов Павел Константинович, доктор технических наук, профессор, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Самарский государственный технический университет», заведующий кафедрой «Электропривод и промышленная автоматика».
Ведущая организация:
федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Рязанский государственный радиотехнический университет».
Защита состоится 30 октября 2015 г. в 10:00 на заседании диссертационного совета Д 212.215.07, созданного при федеральном государственном автономном образовательном учреждении высшего образования «Самарский государственный аэрокосмический университет имени академика С.П. Королева (национальный исследовательский университет)», по адресу 443086, г. Самара, Московское шоссе, 34.
С диссертацией можно ознакомиться в научно-технической библиотеке СГАУ и на сайте СГАУ по URL http://www.ssau.ru/resources/dis_protection/gaidel/.
Автореферат разослан 18 августа 2015 г.
Ученый секретарь
диссертационного совета, д.т.н„ профессор
Белоконов И. В.
Общая характеристика работы
Диссертация посвящена согласованному отбору информационных признаков для повышения эффективности распознавания полутоновых диагностических изображений.
Актуальность темы. В настоящее время в отечественной медицинской практике для радиологической диагностики системных заболеваний не везде распространено дорогостоящее оборудование, а для анализа распространённых радиологических изображений привлекаются высококвалифицированные медицинские работники. Это приводит к запоздалой постановке диагноза некоторых заболеваний, что осложняет дальнейшее лечение, в то время как существуют методы предупреждения развития этих заболеваний в случае постановки диагноза на ранних стадиях. Средства автоматизации диагностики могли бы ускорить, удешевить и объективизировать процедуру обследования пациентов.
Множество общих способов обработки и анализа биомедицинских изображений, включая текстурный анализ и способы автоматической диагностики, можно найти в [Rangayyan, 2005]. Используемые диагностические признаки включают мо-ментные статистические характеристики, матрицы вхождений Харалика. впервые описанные [Haralick, 1973], а также спектрально-корреляционные характеристики, фрактальные признаки и т. д. Обширный спектр самых разных методов анализа биомедицинских изображений с подробным описанием подходов к решению конкретных практических задач также можно найти в [Ильясова. 2012]. Там же приводится интересная модель описания изображения, называемая «полем направлений», которая учитывает локальные направления изменения яркости на изображении.
Существует ряд работ, посвященных отбору признаков для эффективного распознавания биомедицинских изображений. Гибридный алгоритм отбора признаков, сочетающий несколько разнородных этапов, рассматривается в [Peng, 2010]. В работе [Tsai, 2013] для отбора признаков с одновременной классификацией используется генетический алгоритм с целевой функцией, основанной на байесовской сети. Тестирование полученного алгоритма на стандартных наборах эталонных данных показало вероятность правильной классификации вплоть до 0,99, что, тем не менее, превосходит классификацию на полном наборе признаков лишь в вычислительной сложности, но не в достоверности распознавания.
Во всех описанных работах новые признаки строятся на основе уже имеющихся примитивных признаков путём применения различных операторов, как правило, случайным образом. Однако в случае обработки сложных объектов распознавания, таких как крупные изображения, примитивные признаки могут отсутствовать, так как затруднительно считать отдельными примитивными признаками миллионы отсчётов изображения. Поэтому необходимо разработать специфические для изображений методы построения признаков по обучающей выборке, не опирающиеся на уже имеющиеся признаки.
Таких работ не слишком много, но имеется цикл статей по построению эффективных линейных локальных признаков изображений под авторством В. В. Мясникова. В [Мясников, 2007] разработанные алгоритмы вычисления свёртки используются для построения линейных локальных признаков изображений и других сигналов. Устойчивость предложенных алгоритмов исследуется двумя способами в работе [Мясников, 2009]. В [Мясников, 2010] авторы сравнивают эффективность численных методов оптимизации для решения задачи построения линейных локальных признаков эффективных не только с точки зрения вычислительной сложности, но так же и с точки зрения критерия качества прикладной задачи. Рассматриваются три чис-
ленных метода оптимизации: псевдоградиентный алгоритм, генетический алгоритм и алгоритм имитации отжига.
Тем не менее, существует ряд недостаточно проработанных задач. Во-первых, чаще всего отбор признаков осуществляется из большого конечного числа операторов, в то время как отбор признаков из бесконечных параметрических семейств исследован недостаточно. Во-вторых, имеется мало исследований способов согласования квадратичных и других нелинейных признаков с текстурными свойствами изображений из обучающей выборки. В-третьих, не описаны общие адаптивные подходы к выделению области интереса на полутоновых диагностических изображениях, учитывающих одновременно как текстурные, так и геометрические характеристики.
Из приведенного обзора научных работ и сформулированных нерешенных задач следуют цель и задачи диссертации.
Цель диссертационной работы. Разработка и исследование математических методов автоматического отбора информационных признаков, согласованных с текстурными свойствами полутоновых диагностических изображений.
Задачи диссертационной работы.
1. Разработать математический метод согласования направленных текстурных признаков с текстурными свойствами изображений по критерию качества признакового пространства и исследовать его эффективность для прикладных задач распознавания полутоновых диагностических изображений..
2. Разработать полиномиальные информационные признаки и методы их согласования с текстурными свойствами полутоновых диагностических изображений. Исследовать эффективность распознавания с помощью таких признаков.
3. Исследовать вычислительную устойчивость оператора вычисления квадратичных признаков. Исследовать влияние шума на изображениях на вероятность их верного распознавания при использовании направленных текстурных признаков и при использовании квадратичных признаков.
4. Исследовать эффективность различных критериев качества признакового пространства для различных прикладных задач согласованной классификации полутоновых диагностических изображений. Определить наиболее эффективные алгоритмы оптимизации параметров информационных признаков.
5. Разработать метод автоматического выделения области интереса на полутоновых диагностических изображениях, использующий сведения о текстурных характеристиках областей интереса изображений из обучающей выборки.
Научная новизна. В диссертационной работе впервые получены следующие результаты.
1. Предложен математический метод согласования направленных текстурных признаков с текстурными свойствами полутоновых изображений, заключающийся в оптимизации угла поворота изображения по критерию качества признакового пространства.
2. Разработан математический метод согласования квадратичных полиномиальных признаков, основанный на автоматической настройке коэффициентов при одночленах, обеспечивающих оптимум критерия качества признакового пространства.
3. Исследована устойчивость оператора вычисления квадратичных признаков для ограниченных сигналов. Показано, что оптимальные квадратичные признаки являются более устойчивыми к шумам на изображениях, чем оптимальные направленные признаки.
4. Для каждой прикладной задачи медицинской диагностики определены алгоритмы оптимизации и критерии качества признакового пространства, наилучшие по критерию достоверности распознавания.
5. Предложен метод автоматического выделения области интереса на диагностических изображениях, основанный на последовательном наращивании области и отличающийся способностью одновременно учитывать её текстурные, топологические и геометрические характеристики.
Практическая значимость. Разработанные математические методы и программные средства возможно использовать в клинической практике для автоматизации диагностики остеопороза и остеопении по рентгеновским изображениям костной ткани, различных нефрологических заболеваний по ультразвуковым изображениям почек, а также хронической обструктивной болезни лёгких по изображениям компьютерной томографии.
Достоверность полученных результатов. Достоверность полученных результатов подтверждается корректностью математических выкладок и использованием квалифицированных экспертных оценок для проведения вычислительных экспериментов. Для всех оценок вероятностей ошибочного распознавания приведены соответствующие доверительные интервалы с уровнем значимости 0,05.
Основные положения, выноспмые на защиту.
1. Математический метод согласования направления вычисления направленных признаков с текстурными свойствами полутоновых изображений, основанный на оптимизации угла поворота по критерию качества признакового пространства, обеспечивает снижение вероятности ошибочного распознавания.
2. Квадратичные полиномиальные признаки, согласующиеся с текстурными свойствами полутоновых изображений, обеспечивают дополнительное снижение вероятности ошибочного распознавания по сравнению с использованием согласованных направленных признаков.
3. Оператор вычисления квадратичных признаков является вычислительно устойчивым для ограниченных сигналов. Достоверность распознавания диагностических изображений менее подвержена воздействию шумов при использовании квадратичных признаков, чем при использовании направленных признаков.
4. Алгоритм имитации отжига является наиболее эффективным алгоритмом оптимизации для согласования направленных признаков, а метод случайного поиска является наиболее эффективным для согласования квадратичных признаков. Наиболее эффективные критерии качества признакового пространства в среднем по всем задачам основаны на разделимости признакового пространства.
5. Метод автоматического выделения области интереса, согласующийся с текстурными, геометрическими и топологическими характеристиками областей интереса для заданной обучающей выборки полутоновых диагностических изображений, позволяет кроме дополнительной автоматизации процесса диагностики дополнительно снизить оценку вероятности неверного распознавания.
Публикации. Основные результаты диссертации опубликованы в б статьях в изданиях, рекомендованных ВАК РФ, а также в материалах 2 международных научных конфереьпшй.
Апробация работы. Результаты работы докладывались на 2 международных конференциях:
l.The 11th International Conference on Pattern Recognition and Image Analysis: New Information Technologies. Samara, Russia. September 23-28, 2013.
2. XII Королёвские чтения: Международная молодёжная научная конференция. Самара. 1-3 октября 2013 года.
Объем и структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка сокращений и условных обозначений, списка цитируемой литературы (101 наименование) и двух приложений. Работа изложена на 156 страницах, содержит 15 рисунков и 18 таблиц.
Содержание работы
Во введении обоснована актуальность темы диссертационной работы, сформулированы цель и задачи работы, дан краткий обзор научных работ по теме исследования, показана научная новизна полученных результатов, приведены положения, выносимые на защиту.
В первой главе диссертации ставится задача автоматического построения признаков в виде задачи оптимизации параметров оператора вычисления признаков с использованием критерия качества признакового пространства в качестве целевой функции. После этого приводится простейшая реализация предложенной модели и результаты экспериментальных исследований её эффективности.
Пусть имеется множество объектов распознавания Я , разбитое на Ь классов Д = {й,}( (, и обучающая выборка (/ей, для объектов которой заранее известен их класс. Обозначим за Ф(ш): Я -» А идеальный оператор распознавания, который отображает объект и б Я, в его класс Я,. Решить задачу распознавания, значит построить оператор Ф(ю):Я->Л, который использует ограниченную информацию
об объектах распознавания.
Поскольку пространство Я чаще всего не является метрическим (например, в случае, если £1 - это множество цифровых изображений), оператор распознавания ф(а) строят как суперпозицию двух операторов: Ф(ю) = С(4'(ю)), где оператор
Ч'(со): Я —> Е вычисляет информационные признаки объекта и переводит объект распознавания шеЯ в его вектор признаков *еЕ,а С(.т):3-»Л называется классификатором и переводит вектор признаков в класс его прообраза. Пространство Е называется признаковым пространством.
Задача согласованного отбора признаков заключается в выборе оператора вычисления признаков Ч'(ш): Я Е, который обеспечивает оптимум некоторого критерия качества признакового пространства . Для оценивания значения критерия
можно использовать обучающую выборку и .
Пусть пространство *Р содержит конечное множество параметрических семейств операторов, элементы каждого из которых отличаются значением некоторых параметров. Поскольку семейства операторов всё равно придётся перебирать, можно без потери общности считать, что Т вообще содержит только одно семейство операторов вычисления признаков Ч^со.О): Ях 0 ->Н , где 0 - множество допустимых значений параметров, каждое из которых задаёт некоторый оператор вычисления признаков. Теперь задача построения признаков состоит в выборе параметра 9ев.
обеспечивающего максимум некоторого критерия качества признакового пространства , который рассчитывается по оператору и обучающей выборке:
ca. arg шах У(ч'(<а.в),«7) . (1)
В указанной постановке задача построения признаков превращается в обычную оптимизационную задачу, которая решается с использованием методов оптимизации.
Одним из простейших параметров текстурных признаков является направление. Такие характеристики изображения, как корреляционные признаки, признаки Харалика и признаки, основанные на длинах серий, изменяются в зависимости от направления. Все эти признаки зависят от некоторого координатного сдвига (т,п),
который означает сдвиг на расстояние V"»2 + "2 в направлении arctg(_y/л). В угоду
универсальности метода, чтобы не менять способ вычисления признаков, будем изменять не направление для признака, а угол поворота изображения, в то время как признаки всегда будем вычислять в горизонтальном направлении. Так для всех изображений будем выполнять одно и то же преобразование поворота
еьс:
где Aä — это матрица Гивенса, поворачивающая систему координат на угол 9.
Поскольку для перечисленных признаков противоположные направления не различаются, то множество возможных направлений, из которого следует выбрать оптимальное. 6=[0:гс]. Требуется из всех углов 9е[0:л] выбрать тот угол 9. который обеспечивает максимум некоторого критерия качества признакового пространства У (0) . Для этого необходимо воспользоваться некоторой процедурой оптимизации.
Обозначим Vi = ^(о))! о et/nii/} - векторы признаков из обучающей выборки, относящиеся к классу il/, U0 =|Ч'(ю)| ю е {/} — все векторы признаков из
обучающей выборки. В работе исследовались и сравнивались следующие критерии качества признакового пространства.
1. Доля правильно распознанных объектов
J(0) =^|{со е С/1 Ф(о) = Ф(ш)}|. (2)
Здесь и далее в работе для конечных множеств оператор |»| возвращает количество элементов в множестве. Чтобы эффективно использовать сравнительно небольшую обучающую выборку для вычисления этого критерия, предлагается использовать метод исключения одного объекта. Для классификации, как и везде в работе, использовался алгоритм ближайшего соседа.
2. Расстояние Бхатачария
Г N
1, st(R.+R,\\ ч 1.
1
где а/ - оценка внутриклассового математического ожидания, Л, (т. и) -
оценка внутриклассовой корреляционной матрицы. 3. Критерии дискриминантного анализа:
где - матрица среднего внутриклассового рассеяния, а Д, - матрица рассеяния смеси распределений;
Сравнивались три алгоритма глобальной оптимизации: метод случайного поиска, генетический алгоритм и алгоритм имитации отжига.
Исследование качества описанной процедуры оптимизации направления поворота изображения для повышения качества его текстурного признакового описания проводилось экспериментально на трёх наборах данных.
1. Рентгеновские изображения шейки бедра, полученные в клиниках Самарского государственного медицинского университета в ходе исследования пациентов с подозрением на остеопороз. Общее количество изображений - 95. Средний размер изображений — 1040x860.
2. Ультразвуковые изображения почек, полученные в клиниках Самарского государственного медицинского университета в ходе нефрологических исследований. Общее количество изображений - 84. Средний размер изображений - 640x480.
3. Двумерные срезы рентгеновских изображений компьютерной томографии лёгких, полученные в клиниках Самарского государственного медицинского университета. Общее количество изображений - 160. Средний размер изображений -140x200.
Все наборы изображений были случайным образом разделены на две выборки одинакового объёма: обучающую и контрольную (из 95 изображений костной ткани 47 были помещены в обучающую выборку и 48 в контрольную). После этого для различных сочетаний критериев качества и алгоритмов оптимизации производилась настройка угла поворота изображений, в результате для полученного оптимального угла также оказывались посчитанными значения признаков. Затем значения признаков также рассчитывались для контрольной выборки, и производилась проверка качества классификации полученных векторов признаков по критерию (2). При этом для отбора эффективной группы признаков использовалась процедура, основанная на критерии дискриминантного анализа (4).
В качестве направленных информационных признаков использовались следующие.
1. Значения ковариационной функции через 1 и через 5 отсчётов, поскольку они были признаны наиболее эффективными для распознавания рентгеновских изображений шейки бедра.
2. Признаки Харалика, основанные на матрицах вхождений, поскольку они были признаны наиболее эффективными для распознавания изображений УЗИ почек.
3. Признаки на основе длин серий, поскольку они были признаны наиболее эффективными для распознавания изображений компьютерной томографии лёгких.
у2 = 1п|д-Ч|;
(3)
(4)
1г(Д,) + 1г(*2)'
Так как для вычисления признаков использовалось только горизонтальное направление, общее количество уникальных признаков составило 40 штук. В качестве алгоритма классификации использовался метод ближайшего соседа, но расстояние между векторами признаков вычислялось по стандартизованным признакам, нормированным на дисперсию.
Таблица 1 - Результаты исследования согласования поворота изображения
Набор данных Лучший алгоритм оптимизации Лучший критерий Вероятность ошибки
Рентген костей Имитация отжига Ji 0,13±0,08
УЗИ почек Имитация отжига 0,18±0,11
КТ лёгких Имитация отжига ¿г 0,08±0,06
В таблице 1 для каждого набора изображений приведены наилучшие по критерию достоверности классификации связки алгоритма оптимизации и критерия качества признакового пространства. В последнем столбце приведён доверительный интервал Агрести-Коула для оценки вероятности ошибочного распознавания при использовании угла поворота, найденного с помощью указанной связки алгоритма оптмиизации и критерия качества. Все доверительные интервалы приведены с уровнем значимости 0,05. Для рентгеновских изображений костной ткани удалось добиться наибольшего снижения вероятности ошибочного распознавания на контрольной выборке с 0,20 до 0,10 по сравнению с использованием обычной процедуры отбора из большого числа гетерогенных признаков.
Во второй главе диссертации разрабатываются и исследуются квадратичные информационные признаки полутоновых изображений. Кроме экспериментального исследования эффективности таких признаков также приводится исследование вычислительной устойчивости оператора их вычисления, а также сравнение устойчивости вероятности ошибочного распознавания к шумам на изображениях с использованием различных признаков.
Пусть признаками являются многочлены на П . Определим мультииндекс порядка деКо, как вектор У = (?(1) ^(2) ••• у(|Д,|)) > такой что
1Я.1 ¡•=1
Обозначим 1,( множество всех мультииндексов порядка д , а также занумеруем
все отсчёты изображения о{т,п) некоторым образом . Тогда многочлен
порядка <7 определяется как
Здесь 0(у): ->К - это коэффициенты перед соответствующими членами с муль-тииндексом у .
Использовать признаки (5) в общем виде невозможно в первую очередь в виду большой размерности пространства параметров в(у) ■ Выделим 6 основных ограничений, связанных с физической реализуемостью и характером описания изображения.
1. Ограничение размерности. На практике возможно оценить лишь конечное количество неизвестных параметров информационного признака, не превышающее объём обучающей выборки.
2. Инвариантность к сдвигу. Признаки не должны меняться от сдвига координатного пространства, поскольку положение отсчёта в глобальной системе координат не несёт никакой информации о классе изображения.
3. Инвариантность к сдвигу яркости. Увеличение или уменьшение яркости всех отсчётов изображения на одну и ту же величину не должно влиять на признаки.
4. Инвариантность к размеру области интереса. Это не означает инвариантность к масштабу, но расширение области интереса на однородном текстурном изображении не должно приводить к существенным изменениям значений признаков.
5. Локальность. Признаки должны агрегировать локальные свойства текстуры на изображении, а не глобальные её изменения, поскольку далеко стоящие отсчёты никак не связаны друг с другом.
6. Ограниченность. Пространство параметров должно быть ограничено, в случае если процедура оптимизации не работает без ограничений.
Можно показать, что данным ограничениям удовлетворяют лишь локальные квадратичные признаки, представляющие собой линейные комбинации отсчётов корреляционной функции
Ч'т(со,в)= £ <?(Д/я,Дл)Л„(Дл1,Дл), (6)
где ^ п2! - окно радиуса с1, ДДДт.Ля) - отсчёты ковариационной
функции изображения о (от, и). В качестве целевых функций для оптимизации коэффициентов при одночленах использовались те же самые критерии качества, что и в первой главе для оптимизации угла поворота, и два новых критерия:
1. Критерий дискриминантного анализа J^ = - Дг) .
£ 1 / \2
2. Критерий = —Г X (^(лО0^)-®') ' основанный на МНК, где
и, = {& ее и\т е Я,} - изображения /-го класса из обучающей выборки; а, =-1 и аг = +1 — требуемые значения признаков для первого и второго класса.
Для критериев достоверности распознавания 1, расстояния Бхатачария /<(1/2) , а также для критериев дисперсионного анализа Ji, ^¡¡^ и использовались те же три алгоритма оптимизации, что и в прошлой главе: метод случайного поиска, генетический алгоритм и алгоритм имитации отжига. Для критериев У, и У2 использовался метод главных компонент (МГК), поскольку задача оптимизации параметров с использованием этих критериев представляет собой известную задачу дискриминантного анализа. При использовании критерия в качестве целевой
функции оптимизация осуществляется путём решения СЛАУ вида Ав =Ь, где
4<-/> =£ы 2Я('('))*.('(/»• *(0 = £¡777 I А.('(0).
/-1 |С//| ««С, I 1^/1 »«С,
* ' 2с^ + 1 _ У '. 2</ + 1 . )
Набор данных Лучший алгоритм оптимизации Лучший критерий Вероятность ошибки
Рентген костей Имитация отжига А(1/2) 0,09±0,08
УЗИ почек МГК 0,17±0,11
КТ лёгких Случайный поиск //(1/2) 0.08±0.06
В таблице 1 представлены наилучшие для оптимизации коэффициентов при одночленах в квадратичных признаках связки алгоритмов оптимизации и критериев качества признакового пространства. Также для каждой связки представлен доверительный интеграл Агрести-Коула для оценки вероятности ошибочного распознавания с использованием оптимальных коэффициентов. Видно, что для задачи распознавания рентгеновских изображений шейки бедра вероятность ошибки снизилась ещё больше
по сравнению с использованием оптимальных направленных признаков.
---
- И»о6элжгмин рис?
- Иэображе хич хостсй
- Июбоаженкя оочс*
■ Изображен*« легких
а).
0,001 0,01 0,1 1 10 100 1000 10000 10000С
Оглашение ахшп-шуи
- изо бозжения риса
- Иэобргженкя костей
- Изображении гкже*
• «»брзжеиин л*гхи*
0,001 0.01 0,1 1 10 100 1030 1СЮ0С 100000
б)-
Рисунок 1 - Зависимость вероятности ошибочного распознавания от соотношения сигнал-шум Оператор вычисления квадратичных признаков (6) не является вычислительно устойчивым для произвольного сигнала, но является вычислительно устойчивым для ограниченных сигналов, какими и являются цифровые изображения.
Рассмотрим зависимость вероятности ошибочного распознавания
.„ (7)
: = ™|{ше!/|Ф(®)*Ф(ю)}|.
вычисленную по контрольной выборке (7 , от отношения сигнал-шум = / сг , представляющего собой отношение дисперсии сигнала к дисперсии аддитивного белого гауссовского шума. На рисунке 1 представлены такие зависимости для различных наборов данных как для распознавания с использованием оптимальных направленных признаков из первой главы (рис. 2а), так и для распознавания с использованием оптимальных квадратичных признаков (рис. 26). Видно, что квадратичные признаки являются значительно более устойчивыми к шуму, чем направленные.
В третьей главе диссертации приводятся модификации и приложения разработанных методов и алгоритмов. Для признаков, основанных на длинах серий, приведён алгоритм их быстрого вычисления, вычислительная сложность которого является теоретически минимальной. Исследованы два алгоритма глобальной оптимизации: модифицированный метод случайного поиска и гибридный ачгоритм, сочетающий в себе свойства всех остальных. Кроме того, в этой же главе приведены метод автоматического выделения области интереса на изображении и сведения о разработанных программных средствах.
Пусть имеется цифровое изображение со е £2, определённое на области Д, =([0;М-1]х[0;А'-1])пг2, при этом нас интересует лишь часть этого изображения,
изображённая на области интереса Д с Д. Требуется определить процедуру, выбирающую, исходя из яркостей отсчётов изображения, некоторую область Д с Д , как можно более совпадающую с Д , при условии, что сама область Д не известна. На вход этой процедуре также подаётся конечная обучающая выборка Усй, в которой для изображений известны области интереса Д.
Определим для каждого отсчёта (от.и)е Д его окрестность г}(т,п). с яркостями отсчётов которой, предположительно, может быть связана яркость отсчёта (т.п). Если вычислить для каждого отсчёта (т.п) признаки, описанные в предыдущих разделах, используя в качестве области интереса лишь его небольшую окрестность г/{т.п), то можно получить новую функцию и(т,гс):Д ->5, описывающую текстурные характеристики У для каждого отсчёта в отдельности: и (т,п) = х¥(е>„,1), где сот „ - это изображение со, определённое на области
г/(т,п)г\Ь„.
Входные данные алгоритма: уровень доверия 0 < а < 1, обучающая выборка [/с!!, для изображений которой известны области интереса Д, оператор вычисления признаков У(«): £1 -> Н , а также собственно изображение т е £1, для которого
требуется построить область интереса. Алгоритм состоит в следующем.
1. В порядке предварительного подсчёта по изображениям из обучающей выборки и вычислить оценки для математического ожидания х и корреляционной матрицы /1 текстурных признаков, оценки математического ожидания М и средне-квадратического отклонения а], размера областей, а также аналогичным образом
оценки математического ожидания Т5 и среднеквадратического отклонения <г$ формы областей.
2. Для каждого отсчёта изображения вычислить и(т,п) = уУ(сош
3. Для каждого отсчёта изображения вычислить расстояние Махаланобиса р(т,п) = (м(т,п)- х)Т /Г' (и(/и,п)-х).
4. Выбрать первый отсчёт, который попадёт в область интереса , как отсчёт с минимальным расстоянием Махаланобиса р(т,п) .
5. Циклически наращивать текущую область £)„ для к = 1,2,..., каждый раз добавляя в неё отсчёт с минимальным расстоянием Махаланобиса р(т,п), граничный по четырёхсвязной области с одним из уже имеющихся в ней отсчётов. Условие останова наращивания области связано с выполнением условий
\/(т,п)е Д, . (¿г(т,я))>1-ог, где ^ (.т) - функция распределения х1 с К
степенями свободы, и (1 — ог)||/)в| — М) < .
6. Обеспечить соответствие формы с помощью операций математической морфологии. Для выравнивания границ выбранной области 3Г1 попеременно применять операции открытия и закрытия бинарного изображения. Продолжать до тех пор.
пока не выполнится условие --г-— <-.
<т5 1-«
7. Обеспечить выполнение условия односвязности путём заполнения дыр в области ЗР. Для этого пометить все отсчёты текущего фона 2. = Ь\ 3'^, последовательно запуская поиск в ширину или поиск в глубину из ещё непомеченных отсчётов края изображения, не лежащих в области , и помечая ещё не помеченные отсчёты, не лежащие в области . После этого положить 3„ = Зт\ 2 .
Рисунок 2 - Пример автоматического выделения области интереса на изображении компьютерной томографии лёгкого На рисунке 2 показан пример работы предложенного алгоритма автоматического выделения области интереса на изображении компьютерной томографии лёгкого. Пунктиром показана область, выделенная вручную, а заштрихована область, выде-
ленная автоматически. Заметно, что хотя область и является односвязной, её края довольно неровные и обходят отдельные участки изображения, которые, вероятно, отличаются по текстурным характеристикам от типичных для данной задачи.
Сами по себе описанные критерии в меньшей степени говорят о качестве построенной области, чем непосредственная экспериментальная проверка работы алгоритма на контрольной выборке 0 с Й . Определим расстояние между двумя конечными множествами, как
„/,») И\д|+|дЧ
р(*в)- н+и •
а критерий качества алгоритма построения области интереса определим, как среднюю меру различия, рассчитанную по изображениям из контрольной выборки О :
У »!Г?
(8)
Таблица 3 - Результаты исследования метода
Набор данных Л е Доверительный интервал
Рентгенограммы костей 0,08 0,07 (0,01; 0,19)
УЗИ почек 0.23 0,21 (0,11:0,35)
КТ лёгких 0,17 (0,00:0.10)
В таблице 3 приведены результаты исследования предложенного подхода к выделению области интереса. Для каждого набора данных приведены значения критерия (8). оценки вероятности ошибочного распознавания (7) и доверительный интервал Агрести-Коула с уровнем доверия 0,05. Видно, что для изображений компьютерной томографии лёгких вероятность ошибочного распознавания снижена по сравнению с использованием выделенной вручную области.
Заключение
В диссертационной работе получены следующие основные новые результаты.
1. Предложен метод согласования направленных текстурных признаков с текстурными свойствами полутоновых диагностических изображений. Экспериментально показана эффективность такого подхода при решении прикладных задач медицинской диагностики, проявляющаяся в снижении вероятности ошибочного распознавания с 0,20 до 0,10 для задачи диагностики остеопороза по рентгеновским изображениям шейки бедра.
2. Разработаны полиномиальные признаки, допускающие согласование с текстурными свойствами полутоновых диагностических изображений. При введении естественных ограничений на физическую реализуемость получены практически значимые квадратичные признаки, использование которых позволяет дополнительно снизить оценку вероятности неверного распознавания для задачи диагностики рентгеновских изображений костной ткани с 0.10 до 0,06 по сравнению с автоматической настройкой направления вычисления направленных признаков.
3. Теоретически показана вычислительная устойчивость оператора вычисления квадратичных признаков. Также в ходе вычислительных экспериментов продемонстрировано, что ошибка распознавания менее подвержена воздействию шу-
ма при использовании оптимальных квадратичных признаков, чем при использовании оптимальных направленных признаков.
4. В ходе экспериментальных исследований было установлено, что для согласования направленных признаков в среднем по всем задачам наиболее эффективным алгоритмом оптимизации является алгоритм имитации отжига, а для согласования квадратичных признаков - метод случайного поиска. Наиболее эффективные критерии качества признакового пространства в среднем по всем задачам основаны на разделимости признакового пространства.
5. Предложен метод автоматического выделения области интереса на диагностических изображениях, основанный на алгоритме сегментации с наращиванием области. Его использование позволяет кроме дополнительной автоматизации процесса диагностики снизить вероятность неверного распознавания для задачи диагностики изображений компьютерной томографии лёгких с 0,06 до 0,03 за счёт рассмотрения только диагностически значимых участков изображения.
Основные публикации по теме диссертации в изданиях, рекомендованных ВАК Минобрнауки России
1. Гайдель, А. В. Исследование текстурных признаков для диагностики заболеваний костной ткани по рентгеновским изображениям [Текст] / А. В. Гайдель, С. С. Первушкин// Компьютерная оптика. -2013. — Т. 37, № 1. — С. 122-128.
2. Первушкин, С. С. Клинические и прогностические возможности CAD-снстемы на основе текстурного анализа остеопоротических изменений проксимального отдела бедренной кости [Текст] / С. С. Первушкин, А. В. Гайдель, А. Г. Храмов, Э. Н. Алехин // Врач-аспирант. - 2014. - Т. 66, № 5. - С. 61-69.
3. Гайдель, А. В. Исследование текстурных признаков для диагностики нефрологи-ческих заболеваний по ультразвуковым изображениям [Текст] / А. В. Гайдель. С. Н. Ларионова, А. Г. Храмов // Вестник Самарского государственного аэрокосмического университета им. академика С.П. Королёва (национального исследовательского университета). - 2014. -№ 1 (43). - С. 229-237.
4. Гайдель, А. В. Возможности текстурного анализа компьютерных томограмм в диагностике хронической обструктивной болезни [Текст] / А. В. Гайдель, П. М. Зельтер, А. В. Капишников, А.Г.Храмов// Компьютерная оптика.- 2014.— Т. 38, №4.— С. 843-850.
5. Gaidel, A. Application of Texture Analysis for Automated Osteoporosis Diagnostics by Plain Hip Radiography [Текст] /' A. Gaidel, A. Khramov //' Pattern Recognition and Image Analysis. -2015.-Vol. 25, № 2.-P. 301-305.
6. Гайдель, А. В. Метод согласования направленных текстурных признаков в задачах анализа биомедицинских изображений [Текст] / А. В. Гайдель // Компьютерная оптика.-2015.-Т. 39,№2.-С. 287-293.
Подписано в печать 12 августа 2015 г. Формат 60x84/16. Объем 1 п.л. Тираж 100 экз. Отпечатано в типографии ООО «Инсома Пресс» . Самара, ул. Санфировой, 110А, оф. 22А, тел. 222-92-40
-
Похожие работы
- Исследование и разработка методов формирования решающих правил при классификации фрагментов на полутоновых изображениях
- Распознавание полутоновых текстур на основе стохастической геометрии и функционального анализа
- Совершенствование методов предварительной обработки изображений в системах визуализации
- Разработка и исследование методов анализа и обработки графической информации в условиях неопределенности
- Сегментация слабоконтрастных изображений гистологических объектов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность