автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Метод формирования признаков текстурных изображений на основе марковских моделей

кандидата технических наук
Пластинин, Анатолий Игоревич
город
Самара
год
2011
специальность ВАК РФ
05.13.17
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Метод формирования признаков текстурных изображений на основе марковских моделей»

Автореферат диссертации по теме "Метод формирования признаков текстурных изображений на основе марковских моделей"

На правах рукописи

Пластинин Анатолий Игоревич

Метод формирования признаков текстурных изображений на основе марковских моделей

Специальность: 05.13.17 - Теоретические основы информатики

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

2 2 (:!ДР 2012

Самара - 2012

005013484

005013484

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Самарский государственный аэрокосмический университет имени академика С. П. Королева (национальный исследовательский университет)»

Научный руководитель: доктор технических наук, профессор, член-корреспондент. РАН Сойфер Виктор Александрович.

Официальные оппоненты:

доктор физико-математических наук, доцент Мясников Владислав Валерьевич, профессор кафедры геоинформатики и информационной безопасности федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Самарский государственный аэрокосмический университет имени академика С. П. Королева (национальный исследовательский университет)»;

доктор физико-математических наук, профессор Шатских Сергей Яковлевич, профессор, заведующий кафедрой теории вероятностей и математической статистики федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Самарский государственный университет».

Ведущая организация: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Ульяновский государственный технический университет».

Защита состоится «10» апреля 2012 г.в 10.00 часов на заседании диссертационного совета Д 212.215.07 при федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Самарский государственный аэрокосмический университет имени академика С. П. Королева (национальный исследовательский университет)» (СГАУ), расположенном по адресу: 443086, Самара, Московское шоссе, 34.

С диссертацией можно ознакомиться в библиотеке СГАУ.

Автореферат разослан «07» марта 2012 г.

Ученый секретарь диссертационного совета,

д. т. н., профессор

И. В. Белоконов

Общая характеристика работы

Диссертация посвящена разработке и исследованию методов и алгоритмов формирования признаков на основе марковских моделей для решения задач классификации и выделения неоднородностей текстурных изображений.

Актуальность работы

Во многих практических задачах, таких как дефектоскопия материалов, дистанционное зондировании Земли, анализ биологических препаратов, возникает необходимость в обработке текстурных изображений, с целью их классификации, сегментации и выделения текстурных неоднородностей.

Для классификации текстурных изображений широко применяется модель изображения как реализации случайного поля, в частности, марковского случайного поля. Большой вклад в развитие этого направления внесли: Р. Харалик, который ввел статстический и структорный подходы к определ-нию текстуры, а также предложил использовать признаки на основе матрицы взаимного распределения вероятности; Дж. Бесаг, Д. Геман, С. Геман, работы которых посвещены разработке методов оценки параметров модели марковских случайных полей; а также М. Хаиндл, А. Джейн, Г. Винклер, С. Ли и Г. Л. Гимельфарб.

Однако следует отметить недостатки существующих методов. Ряд методов основан на вычислении параметров вероятностного распределения, например, коэффициентов параметрической модели плотности распределения, но задача восстановления плотности является вычислительно сложной и для классификации изображений является избыточной. Автокорреляционные методы хорошо работают только на регулярных текстурах, и показывают плохие результаты для нерегулярных текстур. Для метода Харалика необходимо указывать вектор смещения соседнего пикселя, но не существует однозначного подхода к выбору этого параметра.

В задаче классификации распознаванию подлежат несколько типов текстурных изображений, различия которых обусловлены природой их происхождения. Однако большинство предложенных ранее другими авторами текстурных признаков являются неизменными для различных типов текстурных изображений, т. е. не используют априорную информацию о типах изображений на этапе формирования признаков. Отметим, что в распознавании образов существуют методы, которые позволяют вовлечь априорные данные в построение признаков, например, преобразование Карунена—Лоэва, где собственные функции автокорреляционной функции вычисляются по обучающему множеству изображений. Этот подход требует дальнейшего развития.

Таким образом, задача формирования признаков текстурных изображений, которые вовлекают априорную информацию о предметной области в

процесс обучения, используя обучающую выборку изображений, является актуальной.

Цель диссертационной работы состоит в разработке методов и алгоритмов формирования признаков, использующих априорную информацию о природе изображений по обучающей выборке, для решения задач классификации, а также выделения текстурных неоднородностей на изображениях.

Для достижения поставленной цели в диссертации решаются следующие задачи:

1. Разработка метода формирования признаков текстурных изображений на основе марковской модели с использованием параметрической функции регрессии для вовлечения априорных данных о типах изображений.

2. Исследование информативности коэффициентов регрессии, как признаков текстурных изображений.

3. Оценка мер схожести текстурных изображений и применение этих мер для классификации текстурных изображений.

4. Разработка информационной технологии выделения текстурных неоднородностей на изображениях.

5. Экспериментальные исследования разработанных методов и алгоритмов на натурных и модельных текстурных изображениях.

Методы исследований

В диссертационной работе используются методы математического анализа, алгебры, теории вероятностей, статистического анализа, теории распознавания образов, теории цифровой обработки сигналов и изображений.

Научной новизной обладают следующие результаты:

1. Метод формирования признаков на основе вычисления коэффициентов регрессии, который использует априорные данные о типах изображений из обучающего множества. Предложены алгоритмы вычисления признаков на основе простой и гребневой регрессии. Разработана методика выбора параметров и исследования предложенных методов вычисления признаков. Полученные признаки показали улучшение вероятности верной классификации на 12% для тестов коллекции изображений МеавТех.

2. Информационная технология обнаружения текстурных неоднородностей на основе «обнаружения новизны» по методу опорных векторов. Разработана методика выбора параметров и исследования метода выделения текстурных неоднородностей.

3. Оценка меры схожести текстурных изображений на основе дивергенции Кульбака—Лейблера и интегральных вероятностных метрик.

4. Вид функций ядер скалярного произведения текстурных изображений, основанные на мерах сходства текстурных изображений. Предложенные функции ядер применены в различных задачах: дискриминантный анализ и классификация с использованием тестовых и натурных наборов изображений, что показало линейную разделимость тестовых наборов текстурных изображений.

Практическая значимость заключается в разработке методов и алгоритмов классификации текстурных изображений, позволяющих повысить качество классификации до 12% по сравнению с известными методами за счет вычисления признаков, использующих априорные данные. Предложенные методы и алгоритмы обработки текстурных изображений могут быть использованы в автоматизированных системах дефектоскопии материалов и анализа включений, в системах анализа биомедицинских изображений, а также в других информационных системах обработки текстурных изображений.

Апробация работы

Основные результаты диссертации докладывались на 8-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ, Россия, Йошкар-Ола, 2007); Всероссийской молодежной научной конференции с международным участием «IX Королевские чтения» (Самара, СГАУ, 2007); 9-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ, Россия, Нижний Новгород, 2008); Всероссийской молодежной научной конференции с международным участием «X Королевские чтения» (Самара, СГАУ, 2009); Научно-технической конференции с международным участием «Перспективные информационные технологии в научных исследованиях, проектировании и обучении» («ПИТ-2010», Самара, 2010); 4-ой Международной конференции по распознаванию образов и искусственному интеллекту (Pattern Recognition and Machine Intelligence, PReMI-2011, Москва, 2011).

На защиту выносятся:

1. Метод формирования признаков текстурных изображений, использующий априорные данные о предметной области, основанный на использовании параметров регрессии яркости пикселя на вектор значений яркости в его окрестности.

2. Информационная технология обнаружения локальных текстурных неод-нородностей на основе метода опорных векторов, а также методика вы-

бора параметров алгоритма и результаты исследования метода выделения текстурных неоднородностей.

3. Оценка мер схожести текстурных изображений на основе дивергенции Кульбака—Лейблера и интегральных вероятностных метрик.

4. Вид функции ядра скалярного произведения текстурных изображений на основе мер схожести текстурных изображений.

5. Результаты экспериментальных исследований эффективности разработанных методов и алгоритмов.

Публикации

По теме диссертации опубликовано 12 работ из них 6 в ведущих рецензируемых научных изданиях, рекомендованных Высшей аттестационной комиссией министерства образования и науки Российской Федерации.

Ряд представленных работ написан в соавторстве. В диссертацию включены только результаты, полученные лично автором.

Структура и объем диссертации

Диссертация состоит из введения, четырех глав, заключения, списка литературы и четырех приложений. Она изложена на 134 страницах машинописного текста (без приложений), содержит 40 рисунков, 43 таблицы, список использованных источников из 95 наименований.

Содержание работы

Во введении обоснована актуальность диссертационной работы, сформулирована цель и аргументирована научная новизна исследований.

В первой главе рассмотрена модель изображения как реализации марковского случайного поля, вводятся основные понятия и обозначения, а также ставится задача построения признаков, использующих априорные данных о типах изображений.

Пусть S — конечное множество узлов (в случае изображений это решетка Lx х Ly), a Z = {Zi,..., Zm} — семейство случайных переменных определенных на множестве S, в котором каждая случайная переменная Z{ принимает значение Zi е G, где G — множество цветов (например, в случае полутонового изображения G = [0;1], или для цветного RGB изображения G = [0; I]3), Семейство Z будем называть случайным полем. Введем обозначение Zi = Zi для события, что Zi принимает значение z{, а для совместного события (Zi = zx,..., Zm = Zm) — обозначение Z — z. P(Zi = z{) — вероятность того, что случайная переменная Zi принимает значение z;.

Связь узлов друг с другом определяется системой окрестностей, которая определяется как M = {A/^s 6 S}, где Ns — множество узлов соседей узла s. Окрестности обладают следующим свойством: s ф. Ns-

Случайное поле Z называется Марковским случайным полем, по отношению к системе окрестностей Ai, если выполнено:

P(2i|zsv) = Р (фк).

Каждое изображение I, являющееся реализацией марковского случайного поля с распределением Р, можно рассматривать как реализацию многомерной случайной величины, обладающей таким же распределением: (za, zi,..., zn), где zq — Ip, (zu..., zn) = z = 7дгр, Àfp — окрестность пикселя

p, J\fp — fc-ый элемент окрестности, = {¡щ,..., Iu^j ~ вектор значений отсчетов изображения в окрестности пикселя.

Рассмотрен ряд существующих методов вычисления признаков текстурных изображений. Общим недостатком рассмотренных методов вычисления текстурных признаков является то, что они являются общими для различных типов текстурных изображений, то есть при формировании признака не учитывается, какие типы изображений необходимо распознавать в конкретной задаче.

Рассмотрим традиционную постановку задачу классификации и вычисления признаков. Обозначим 3 как множество всех возможных изображений,

к

которое разделено на К классов Ci,... ,Сц, т.е. (J С к = 3 и Ci Р| Cj = 0,

к=0

г ф j. Здесь Со — множество объектов, не относящихся ни к одному из классов. Разделение на классы изначально не известно. Пусть задано множество изображений X = {Ii,...,IN} с для каждого изображения указан класс, к которому оно относится, т. е. определено отображение и : I —» £, где £ = {1,..., К} — множество меток объектов. Обучающая выборка определяется как множество пар изображение-класс: Т = {(/;,u(Ii))} € X х £.

Традиционный подход заключается в формировании вектора признаков а £ 5, где Ç = К™ — пространство признаков, т. е. должно быть определено отображение

Пусть Т — множество всех возможных отображений из 3 в 3", т.е. / G Т. Существует неизвестная зависимость û: 3" —>■ значения которой известны только на объектах конечной обучающей выборки Т = {(/¿, ¿¡)}i=1. Требуется построить алгоритм й: Зг £, который приближал бы неизвестную целевую зависимость, как на элементах выборки, так и на всем множестве

В такой постановке задачи отображение / должно быть известно заранее, и оно не зависит от предметной области. Большинство существующих методов вычисления признаков реализуют именно такой подход. В данной

работе предлагается метод, который по обучающей выборке строит алгоритм вычисления признаков, т.е. находится отображение у: 1 —> Т, где X — множество всех возможных обучающих выборок.

Для того, чтобы учесть информацию будем строить параметрический алгоритм вычисления признаков /¡,, где Ь — набор параметров алгоритма. Таким образом, на этапе обучения по множеству примеров X вычисляются параметры алгоритма вычисления признаков /¡, = у(Х), а признаки для конкретного изображения оцениваются алгоритмом с использованием вычисленного вектора параметров а = /¿{/). В случае преобразования Карунсна—Лоэва параметром Ь являются собственные функции автокорреляционной функции, а вычисление признаков }ь является разложением по собственным функциям Ь.

Так как согласно модели марковского случайного поля существует стохастическая зависимость между значением центрального пикселя ¿о и значениями пикселей в окрестности г, предлагается перейти от описания поля с использованием марковского поля к описанию с помощью функции регрессии значения центрального отсчета на вектор значений в окрестности этого отсчета.

Рассмотрим функцию регрессии:

¿о = /(z) = M[z0|z] =

zq dP(zo|z). (1)

В качестве примера приведем оценки регрессий изображений из наборов «161» и «linen» (примеры изображений представлены на рисунке 1). На рисунке 2, а и 2, б представлены функции регрессий изображений из наборов «161» и «linen», соответственно (наборы изображений сгенерированы по изображениям из коллекции DeBonet). Каждая функция построена для окрестности, состоящей из двух пикселов {(0, —5), (—5,0)}.

(б)

Рис. 1. Пример изображений из набора тестовых изображений «161» и «linen»: (а) — «161»; (б) — «linen»

Из рисунка 2 видно, что функции регрессии различны для различных типов изображений, это позволяет использовать функцию регрессии как характеристику распределения соответствующего изображению.

Вторая глава посвящена методу формирования признаков текстурных изображений и его исследованию.

(а)

(б)

Рис. 2. Функции регрессии изображений: (а) — «161»; (б) — «1шеп»

Будем искать регрессию в семействе функций вида f(z) = Для этого рассмотрим задачу минимизации риска, полагая, что истинное распределение вероятности известно. Из (1) следует:

где Р — распределение вероятности, соответствующее изображению.

Из (2) следует, что коэффициенты функции регрессии {о^ являются характеристиками распределения, а следовательно, могут быть использованы в качестве признаков текстурных изображений.

В работе рассматриваются два метода вычисления признаков: с использованием простой и гребневой регрессии. Под простой регрессией понимается линейная, относительно базисных функций, регрессия, гребневая регрессия — это модификация линейной регрессии, где в функционал риска добавлено, слагаемое отвечающее за сложность функции.

Для каждого метода предложен способ выбора базисных функций д¿. Проведены эксперименты по исследованию эффективности предложенных текстурных признаков для классификации с использованием моделей аддитивного и импульсного шумов. На рисунке 3 представлены результаты классификации набора тестовых изображений.

Также проведены сравнения с известными в литературе тестами на основе изображений из базы изображений МеазТех. Результаты исследований представлены в таблице 1.

Из таблицы 1 видно, что предложенные признаки обеспечивают 100% верной классификации на всех тестах, что является лучшим показателем среди известных методов. Это связано с тем, что признаки были построены с использованием априорной информации из обучающего множества.

Проведенные исследования влияния параметров алгоритма вычисления признаков на качество классификации показали, что необходимо совместно

Рис. 3. Зависимость качества классификации набора тестовых изображений от шума при фиксированных параметрах алгоритма вычисления признаков, метод опорных векторов с линейной разделяющей границей: (а) — от среднеквадратичного отклонения (СКО) аддитивного шума; (б) — от интенсивности импульсного шума

Таблица 1. Результаты исследований с использованием набора изображений МеавТех

тестовый набор признаки Габора признаки Харалик признаки ГМСП простая регрессия гребневая регрессия

all 16 0.93 0.81 0.97 1.00 1.00

fractal 0.94 0.58 1.00 1.00 1.00

leather 0.83 0.74 0.88 1.00 1.00

mrf 0.99 0.99 0.99 1.00 1.00

paint 0.96 0.93 0.99 1.00 1.00

подбирать параметры алгоритма, для улучшения классификации. Для оптимального выбора параметров алгоритма целесообразно использовать метод на основе перекрестной проверки.

Так же были проведены исследования качества классификации на тестовых и натурных изображениях с использованием классификации на основе метода опорных векторов с использованием линейной и нелинейной разделяющей границы. При отсутствии шумов метод простой регрессии и метод гребневой регрессии дают 100% результат. Эксперименты показали, что использование линейной разделяющей границы при наличии шумов в методе опорных векторов дает лучшие результаты, чем использование нелинейной границы. Это свидетельствует о том, что полученные признаки позволяют получать линейно разделимые образы.

В третьей главе диссертационной работы рассматриваются численные оценки мер схожести текстурных изображений. Для сравнения текстурных изображений используются меры схожести вероятностных распределений. Пусть Р и О распределения соответствующие двум изображениям, которые необходимо сравнить. Меру схожсести на основе дивергенция Кульбака—Лей-

блера, можно определить как:

МЫ р, Q) = \ (D*b(P, Q) + oKL(Q, Р)), (3)

2

D*l(P,Q)

logg)^. (4)

Также для построения мер схожести предлагается использовать интегральные вероятностные метрики:

7?(P, Q) — sup /е?

Ч'

/dP- /dQ

(5)

где У — класс действительных ограниченных измеримых функций на М.

Рассматриваются 3 вероятностные метрики:

• метрика Дадли: У = {/ : ||/||Br < 1}, где ||/||вь = Ц/IU + ||/||£;

• расстояние Васерштейна: если использовать "5 — {/: ||/||£ < 1}, то будет получена метрика Канторовича, которая двойственна расстоянию Васерштейна;

• метрика максимального среднего расхождения (maximum mean discrepancy - MMD): J = {/: ||/||и < 1}, где Ji является гильбертовым пространством с воспроизводящим ядром.

Проведены исследования разделимости классов с использованием следующих критериев: коэффициент линейной разделимости и средний коэффициент линейной разделимости:

h,(r ru - sw(Ci,C2) — . sw{Cu C2)

fci(Gl'G2) - - max{hifr)MC*)Y

ГДС Syj — диаметр класса (максимальное расстояние между двумя элементами класса), sw — рассеяние внутри класса (среднее расстояние между парами элементов класса), sb — расстояние между двумя классами (минимальное расстояние между элементами разных классов), Ц — рассеяние между двумя классами (среднее расстояние между элементами разных классов).

2 N

sw(C) = max/j.(Ii, /,), §W(C) = £ E J')>

' i=l ji=i+l

3b{Cu C2) = mm /'), Зь{Си C2) = ^ £ /').

i'ec2 /eCi

i'eC2

В таблице 2 представлены результаты исследований меры Кульбака— Лейблера на наборах тестовых изображений гауссовского и белого шума (среднеквадратичное отклонение шума 0.25).

Таблица 2. Результаты исследований метрики Кульбака—Лейблера на наборах тестовых изображений гауссовского и белого шума

Радиус Размер Коэффициент Коэффициент

окрестности выборки к, к

1 50 1.88 3.28

1 100 2.54 3.80

1 200 3.02 4.44

2 50 1.54 3.08

2 100 2.32 3.56

2 200 2.81 4.22

3 50 1.75 2.80

3 100 2.25 3.27

3 200 2.91 3.72

Из таблицы 2 видно, что кц > 1 и к\ > 1, это свидетельствует, что классы изображений гауссовского и белого шумов линейно разделимы относительно меры Кульбака—Лейблера.

В таблице 3 представлены результаты исследований метрики Васерштей-на на наборах тестовых изображений гауссовского и белого шума (среднеквадратичное отклонение шума 0.25).

Таблица 3. Результаты исследований метрики Васерштейна на наборах тестовых изображений гауссовского и белого шума

Радиус Размер Коэффициент Коэффициент

окрестности выборки Ь

1 50 1.35 3.06

1 100 1.52 3.41

1 200 1.63 3.84

2 50 1.31 3.00

2 100 1.82 3.49

2 200 1.85 4.18

3 50 1.54 3.10

3 100 2.08 3.50

3 200 2.17 4.01

Из таблицы 3 видно, что Ь > 1 и й; > 1, это свидетельствует, что классы изображений гауссовского и белого шумов линейно разделимы относительно метрики Васерштейна.

Аналогичные результаты получены и для других наборов изображений и для других типов метрик.

На основе рассмотренных мер схожести строятся ядра скалярного произведения:

fc(I, I') = ехр(-7/ф (/,/')), (6)

где 7 > О,

к(1,1') = (а + Ь^(11Г))~\ (7)

где а > b > 0, к — константа, которая определяется по обучающему множеству, как

°° maxj jnfalj)'

Таким образом, пространство текстурных изображений может быть вложено в гильбертово пространство, это позволяет использовать ряд методов, которые основаны на представлении объектов как элементов гильбертового пространства с вооспроизводящим ядром, таких как метод опорных векторов непосредственно на пространстве изображений.

Показана возможность вычисления признаков с использованием метода дискриминантного анализа на основе ядер. Для каждого набора изображений строится отображение в пространство 1R2. Из исходного множества изображений выбирается небольшое подмножество, по которому вычисляются проекторы, используемые для вычисления образов всего исходного множества.

На рисунке 4 представлены результаты эксперимента с классами «161» и «linen» с использованием гауссовского ядра на основе метрики Васерштейна и MMD метрики.

[ЛЕЗ

(а) (б)

Рис. 4. Дискримижштный анализ изображений «161» и «linen» (а) — метрика Васерштейна, «гауссовское» ядро; (б) — MMD метрика, «гауссовское» ядро

Исследования на тестовых наборах изображений показали, что вычисление признаков на основе дискриминантного анализа с использованием ядер на основе мер схожести, позволяет получить линейно разделимые классы при широком диапазоне значений параметров.

Проведены исследования по классификации изображений с использованием метода опорных векторов, на основе предложенных функций ядра. Вероятность верной классификации составила 100% при отсутствии шумов на изображении.

В четвертой главе рассматривается метод выделения текстурных неод-нородностей. Неоднородностью на изображении I будем называть связную область, описанную некоторым, отличным от Р, распределением вероятности Р. Иллюстрация данного алгоритма представлена на рисунке 5. Алгоритм основан на использовании метода опорных векторов для одного класса.

I I

Рис. 5. Пример работы алгоритма обнаружения текстурных яеоднородностей На рисунке 6 показан пример работы предложенного метода.

(«) (б) (в) (3)

Рис. 6. Экспериментальное исследование алгоритма: (а) — обучающее изображение случайное поле с математическим ожиданием М1 = 0.5, дисперсией Б] = 0.003, коэффициентом корреляции а = 0.01; (б) — анализируемое изображение, М/ = 0.5, О; — 0.003, а = 0.01; (в) — изображение искажения, М/ = 0.5, О; = 0.003, а = 0.5; (г) - изображение результата работы алгоритма

В таблице 4 представлены значения относительного числа правильно классифицированных отсчетов при различных значениях параметров алгоритма V — параметр отвечающий за сложность решающей функции, 7 — параметр гауссовской функции ядра.

Исследования метода выделения локальных текстурных неоднородно-стей на тестовых изображениях показали, что метод достигает вероятности ошибки 3% при оптимальных значениях параметров алгоритма.

Таблица 4. Зависимость относительного числа правильно классифицированных отсчетов от параметров алгоритма

7 и

0.001 0.002 0.004 0.008 0.015 0.03 0.06 0.125 0.25 0.5

200 0.85 0.86 0.86 0.86 0.86 0.86 0.86 0.85 0.86 0.81

400 0.91 0.91 0.92 0.93 0.93 0.93 0.93 0.93 0.92 0.88

600 0.94 0.95 0.96 0.96 0.96 0.96 0.96 0.97 0.96 0.91

800 0.9 0.93 0.95 0.96 0.96 0.95 0.93 0.95 0.96 0.91

К достоинствам предложенного метода следует отнести, что наличие дефектов на обучающем изображении не является обязательным для обучения, но для снижения вероятности ошибки следует проводить обучение на изображениях с дефектами.

Заключение

В диссертационной работе решена задача формирования признаков на основе марковской модели текстурных изображений с использованием функции регрессии изображения для решения задач классификации и выделения текстурных неоднородностей.

Основные результаты диссертационной работы:

■гь

• Предложен метод формирования текстурных признаков изображений, использующих априорные данные о предметной области из обучающей выборки на основе вычисления коэффициентов функции регрессии значений вектора окрестности на значение центрального отсчета. Предложены алгоритмы вычисления признаков на основе простой регрессии и на основе гребневой регрессии Разработана методика выбора параметров и исследования предложенных методов вычисления признаков. Исследования на тестовых и натурных изображениях показали, что получаемые признаки позволяют эффективно решать задачи классификации, в том числе при наличии шумов.

• Разработана информационная технология выделения текстурных неоднородностей на основе метода опорных векторов для одного класса. Разработана методика выбора параметров и исследования метода выделения текстурных неоднородностей. Результаты показывают, что метод может эффективно применятся в случае, если на изображении образца присутствуют искажения текстуры.

• Вычислены оценки меры схожести текстурных изображений на основе дивергенции Кульбака—Лейблера и интегральных вероятностных метрик. Представлены результаты вычисления мер схожести для различных классов изображений без шумов, а также при наличии шумов.

• Предложены функции ядра на основе мер схожести текстурных изображений. Получены результаты применения предложенных функций ядра в различных задачах: дискриминантный анализ, классификация и регрессия с использованием тестовых и натурных наборов изображений.

Список опубликованных работ в ведущих рецензируемых научных изданиях, рекомендованных Высшей аттестационной комиссией

1. Plastinin, A. Color textural analysis of the blood preparation images [Text] / A. Plastinin, A. Kupriyanov, N. Ilyasova // Optical Memory & Neural Networks. - 2008. - Vol. 17. - P. 201-207.

2. The technology of leukocytes determination on blood preparation images [Text] / E. Zhulkova, N. Ilyasova, A. Kupriyanov, A. Plastinin // Optical Memory & Neural Networks. - 2008. - Vol. 17. - P. 152-156.

3. Пластинин, А. И. Разработка методов формирования цвето-текстурных признаков для анализа биомедицинских изображений [Текст] / А. И. Пластинин, А. В. Куприянов, Н. Ю. Ильясова // Компьютерная оптика.— 2007.-Т. 31, №2.-С. 82-85.

4. Пластинин, А. И. Модель марковского случайного поля в задачах синтеза и анализа текстурных изображений [Текст] / А. И. Пластинин, А. В. Куприянов // Вестник Самарского государственного аэрокосмического университета имени академика С.П.Королева.— 2008.— Т. 15, №2.-С. 252-258.

5. Пластинин, А. И. Применение интегральных вероятностных метрик для анализа текстурных изображений [Текст] / А. И. Пластинин // Вестник Самарского государственного аэрокосмического университета имени академика С. П. Королева. - 2011. - Т. 26, № 2. - С. 242-250.

6. Пластинин, А. И. Обнаружение текстурных неоднородностей на микромасштабных изображениях материалов [Текст] / А. И. Пластинин, А. Г. Храмов, В. А. Сойфер // Компьютерная оптика.— 2011,— Т. 35, № 2.— С. 158-165.

Подписано в печать 06.03.2012 Формат 60 х 84/16. Тираж 100 экз.

Отпечатано с готового оригинал-макета «Инсома-пресс» 443011, Самара, ул. Сапфировой, 110А

Текст работы Пластинин, Анатолий Игоревич, диссертация по теме Теоретические основы информатики

61 12-5/3012

Министерство образования и науки РФ

федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АЭРОКОСМИЧЕСКИЙ УНИВЕРСИТЕТ имени академика С. П. КОРОЛЕВА (национальный исследовательский университет)»

Метод формирования признаков текстурных изображений на основе марковских моделей

Специальность: 05.13.17 - Теоретические основы информатики

На правах рукописи

Пластинин Анатолий Игоревич

ДИССЕРТАЦИЯ на соискание ученой степени

кандидата технических наук

Научный руководитель

д.т.н., профессор, чл.-корр. РАН

Сойфер Виктор Александрович

Самара - 2011

Содержание

Введение ......................................................................7

Раздел 1. Формирование признаков текстурных изображений на основе модели марковских случайных полей с использованием процедуры обучения............................................15

1.1. Определение текстурных изображений............................15

1.2. Модель марковского случайного поля..............................17

1.2.1. Модель изображения........................................17

1.2.2. Модель марковского случайного поля ....................17

1.2.3. Анализ векторов окрестностей ............................19

1.3. Обзор существующих методов анализа текстур .........20

1.3.1. Признаки Габора............................................21

1.3.2. Метод цветовых гистограмм................22

1.3.3. Автокорреляционный метод................22

1.3.4. Метод матрицы взаимного вероятностного распределения 23

1.3.5. Признаки Тамура......................23

1.4. Постановка задачи распознавания текстурных изображений . . 24

1.5. Регрессионные признаки изображений ..............25

1.6. Объект и задачи исследований...................29

1.6.1. Диагностические изображения клеток крови ......29

1.6.2. Диагностические изображения в металлографии .... 31

1.7. Выводы................................36

Раздел 2. Вычисление признаков текстурных изображений . . 37

2.1. Метод построения признаков....................37

2.1.1. Восстановление регрессии.................37

2.1.2. Метод простой регрессии..................39

2.1.3. Метод гребневой регрессии ................40

2.2. Экспериментальные исследования текстурных признаков .... 42

2.3. Модели искажений .........................44

2.3.1. Модель аддитивного стационарного гауссова шума ... 44

2.3.2. Модель импульсного шума.................45

2.4. Исследования метода формирования признаков, основанного

на простой регрессии........................50

2.4.1. Влияние аддитивного шума яркости на качество классификации набора тестовых изображений........50

2.4.2. Влияние аддитивного шума яркости на качество классификации набора натурных изображений........54

2.4.3. Влияние импульсного шума на качество классификации набора тестовых изображений...............59

2.4.4. Влияние импульсного шума на качество классификации набора натурных изображений ............................61

2.5. Исследования метода формирования признаков, основанного

на гребневой регрессии.......................67

2.6. Исследования методов формирования признаков на тесте МеаэТех 69

2.7. Выводы................................69

Раздел 3. Оценка мер сходства текстурных изображений ... 71

3.1. Сравнение текстурных изображений ..............................71

3.1.1. /-дивергенция................................................71

3.1.2. Дивергенция Кульбака— Лейблера ............72

3.1.3. Интегральные вероятностные метрики..........73

3.2. Ядра на пространстве текстурных изображений.........76

3.3. Формирование признаков с использованием дискриминантного анализа................................ 77

3.4. Экспериментальные исследования методов основанных на мерах схожести текстур ..........................79

3.4.1. Характеристики разделимости классов..........79

3.4.2. Исследование метрики на основе дивергенции Кульба-ка—Лейблера........................80

3.4.3. Исследование расстояния Васерштейна..........80

3.4.4. Исследование метрики Дадли...............80

3.4.5. Исследование ММБ метрики ...............82

3.5. Исследование признаков построенных на основе дискриминантного анализа.............................85

3.6. Исследование метрик в задаче классификации..........89

3.6.1. Исследование метрики на основе дивергенции Кульба-ка—Лейблера........................89

3.6.2. Исследование расстояния Васерштейна..........92

3.6.3. Исследование метрики Дадли...............95

3.6.4. Исследование ММБ метрики ...............99

3.7. Выводы................................102

Раздел 4. Обнаружение локальных текстурных неоднородно-стей.....................................103

4.1. Постановка задачи выделения неоднородностей.........103

4.2. Выделение текстурных неоднородностей.............103

4.2.1. Квантиль-функция и множество минимального объема 105

4.2.2. Метод обнаружения новизны...............106

4.3. Экспериментальные исследования метода обнаружения локальных текстурных неоднородностей.................110

4.3.1. Экспериментальные исследования метода обнаружения текстурных неоднородностей ...............112

4.3.2. Исследование качества обнаружения локальных неоднородностей натурных изображений при различных значениях параметров алгоритма...............116

4.4. Выводы............. ...................116

Заключение..................................120

Литература..................................122

Приложение А. Математический аппарат. Методы........135

А.1. Гильбертовы пространства с воспроизводящим ядром .....135

А.2. Методы классификации.......................140

А.2.1. Обзор методов классификации изображений.......140

А.З. Метод опорных векторов для классификации..........142

А.3.1. Оптимальная гиперплоскость для линейно-разделимых

образов............................142

А.3.2. Оптимальная гиперплоскость для неразделимых образов144

А.3.3. Нелинейная разделяющая граница............146

А.3.4. Выбор параметров и обучение ЯУМ............146

А.4. Метод опорных векторов для регрессии..............148

Приложение Б. Имитационное моделирование текстурных изображений ..................................151

Б.1. Имитационное моделирование...................151

Б. 1.1. Метод имитационного моделирования..........152

Б. 1.2. Модифицированный метод имитационного моделирования 154

Б. 1.3. Имитационное моделирование изображений микроструктуры поверхности материалов с дефектами.......157

Б.2. Экспериментальные исследования имитационного моделирования текстур..............................158

Б.2.1. Экспериментальные исследования базового метода . . .158 Б.2.2. Экспериментальные исследования модифицированного

метода............................163

Приложение В. Результаты исследования ММБ метрики в задаче классификации текстурных изображений.........167

Введение

Диссертация посвящена разработке и исследованию методов и алгоритмов формирования признаков текстурных изображений на основе марковских моделей для решения задач классификации и выделения неоднородностей.

Актуальность темы

Во многих практических задачах, таких как дефектоскопия материалов, дистанционное зондирование Земли, анализ биологических препаратов, возникает необходимость в обработке текстурных изображений, с целью их классификации, сегментации и выделения текстурных неоднородностей.

Для классификации текстурных изображений широко применяется модель изображения как реализации случайного поля, в частности, марковского случайного поля. Большой вклад в развитие этого направления внесли: Р. Харалик, который ввел статистический и структурный подходы к определению текстуры, а также предложил использовать признаки на основе матрицы взаимного распределения вероятности; Дж. Бесаг, Д. Геман, С. Геман, работы которых посвящены разработке методов оценки параметров модели марковских случайных полей; а также М.Хаиндл, А. Джейн, Г. Винклер, С. Ли и Г. Л. Гимельфарб.

Однако следует отметить недостатки существующих методов. Ряд методов основан на вычислении параметров вероятностного распределения, например, коэффициентов параметрической модели плотности распределения, но задача восстановления плотности является вычислительно сложной, и для задачи классификации изображений, является избыточной. Автокорреляционные методы хорошо работают только на регулярных текстурах, и показывают плохие результаты для нерегулярных текстур. Для метода Харалика необходимо указывать вектор смещения соседнего пикселя, но не существует

однозначного подхода к выбору этого параметра.

В задаче классификации распознаванию подлежат несколько типов текстурных изображений, различия которых обусловлены природой их происхождения. Однако все предложенные ранее другими авторами текстурные признаки являются одинаковыми для различных типов текстурных изображений, что не позволяет использовать информацию о типах изображений на этапе формирования признаков.

Таким образом, задача формирования признаков текстурных изображений, которые вовлекают априорную информацию о предметной области, используя обучающую выборку изображений, является актуальной.

Цель и задачи исследований

Целью диссертации является разработка методов и алгоритмов формирования признаков, использующих априорную информацию о природе изображений по обучающей выборке, для решения задач классификации, а также выделения текстурных неоднородностей на изображениях.

Для достижения этой цели в диссертации решаются следующие задачи:

1. Разработка метода формирования признаков текстурных изображений на основе марковской модели с использованием параметрической функции регрессии для вовлечения априорных данных о типах изображений.

2. исследование информативности коэффициентов регрессии, как признаков текстурных изображений.

3. Оценка мер схожести текстурных изображений и применение этих мер для классификации текстурных изображений.

4. Разработка информационной технологии выделения текстурных неоднородностей на изображениях.

5. Экспериментальные исследования разработанных методов и алгоритмов на натурных и модельных текстурных изображениях.

Методы исследований

В диссертационной работе используются методы математического анализа, алгебры, теории вероятностей, статистического анализа, теории распознавания образов, теории цифровой обработки сигналов и изображений.

Научная новизна работы

Научной новизной обладают следующие результаты:

1. Метод формирования признаков на основе вычисления коэффициентов регрессии, который использует априорные данные о типах изображений из обучающего множества. Предложены алгоритмы вычисления признаков на основе простой и гребневой регрессии. Разработана методика выбора параметров и исследования предложенных методов вычисления признаков. Полученные признаки показали улучшение вероятности верной классификации до 12% на тестах коллекции изображений МеаэТех.

2. Информационная технология обнаружения текстурных неоднородностей на основе «обнаружения новизны» по методу опорных векторов. Разработана методика выбора параметров и исследования метода выделения текстурных неоднородностей.

3. Оценка меры схожести текстурных изображений на основе дивергенции Кульбака—Лейблера и интегральных вероятностных метрик.

4. Вид функций ядер скалярного произведения текстурных изображений, основанные на мерах сходства текстурных изображений. Предложенные

функции ядер применены в различных задачах: дискриминантный анализ и классификация с использованием тестовых и натурных наборов изображений, что показало линейную разделимость тестовых наборов текстурных изображений.

Практическая ценность работы

заключается в разработке методов и алгоритм классификации текстурных изображений, позволяющих повысить качество классификации на 1 — 12% по сравнению с известными методами за счет вычисления признаков, использующих априорные данные. Предложенные методы и алгоритмы обработки текстурных изображений могут быть использованы в автоматизированных системах дефектоскопии материалов и анализа включений, в системах анализа био-медицинских изображений, а также в других информационных системах обработки текстурных изображений.

Реализация результатов работы

Результаты диссертации использованы при выполнении ряда госбюджетных и хоздоговорных НИР в лаборатории лазерных измерений института систем обработки изображений РАН.

Апробация работы

Основные результаты диссертации докладывались на:

• 8-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ), Россия, Йошкар-Ола, 2007;

• Всероссийской молодежной научной конференции с международным участием «IX Королевские чтения» (Самара, СГАУ, октябрь, 2007)

• 9-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ), Россия, Нижний Новгород, 2008;

• Всероссийской молодежной научной конференции с международным участием «X Королевские чтения», Самара, 2009;

• Научно-технической конференции с международным участием «Перспективные информационные технологии в научных исследованиях, проектировании и обучении», «ПИТ-2010», Самара, 2010;

• 4-ой Международной конференции по распознаванию образов и искусственному интеллекту (Pattern Recognition and Machine Intelligence, PReMI-2011).

Публикации

По теме диссертации опубликовано 12 работ, из них 6 из перечня ведущих рецензируемых научных журналов и изданий ВАК РФ.

В работах [1-4] автору принадлежит идея и численные методы оценивания признаков цветных текстурных изображений с использованием модифицированного метода Харалика. В работе [5] автору принадлежит разработка алгоритмов выделения изображений клеток крови на цифровых изображениях пробы крови. В работе [б] — предложен метод и алгоритм выделения текстурных изображений с использованием метода опорных векторов. Работы [7-12] выполнены автором единолично. В работах [7-10] предложены методы и алгоритмы формирования признаков и имитационного моделирования текстурных изображений на основе модели марковского случайного поля. В работах [11, 12] представлен ряд мер схожести текстурных изображений, а также предложено, как использовать эти меры для построения ядер на пространстве текстурных изображений.

Ниже в тексте диссертации ссылки на работы автора помечены (*).

Структура диссертации

Диссертация состоит из введения, четырех глав, заключения, списка литературы и четырех приложений. Она изложена на 164 страницах машинописного текста (без приложений), содержит 43 рисунков, 46 таблиц, список использованных источников из 122 наименований.

Краткое содержание диссертации

В первой главе диссертационной работы излагается модель текстурных диагностических изображений. Вводится понятие марковского случайного поля. Рассматриваются практические задачи анализа текстурных изображений. Проводится обзор существующих методов анализа текстурных изображений. Предлагается метод построения текстурных признаков вовлекающих информацию из обучающего множества.

Во второй главе диссертации обосновывается возможность использования коэффициентов функции регрессии значения яркости центрального пикселя на вектор значений яркостей пикселей в окрестности, в качестве текстурных признаков. Рассматриваются две реализации предложенного подхода: с использованием простой регрессии и с использованием гребневой регрессии.

Приводятся результаты экспериментальных исследований на тестовых и натурных изображениях.

В третьей главе диссертации рассматриваются методы оценки мер схожести текстурных изображений, а так же их приложение для распознавания текстурных изображений.

Предлагается использовать в качестве меры схожести текстурных изображений меру схожести между вероятностными распределениями яркости пикселей, соответствующими каждому изображению.

Также предлагаются две функции ядра на основе введенных мер схожести, которые позволяют применить метод опорных векторов непосредственно к изображениям, без необходимости вычисления числовых признаков.

Показано, как меры схожести могут быть использованы для построения текстурных признаков с использования дискриминантного анализа.

Приводятся результаты экспериментальных исследований на тестовых изображениях.

В четвертой главе диссертационной работы описывается методика обнаружения текстурных неоднородностей. Предлагается модель текстурного изображения с неоднородностями, где под неоднородностью понимаются области, вероятность появления которых мала, в соответствии с распределением самого изображения.

Исходя из этой модели, для обнаружения дефектов на текстурном изображении используется метод обнаружения нетипичных значений в выборке.

На защиту выносятся

1. Метод формирования признаков текстурных изображений, использующий априорные данные о предметной области, основанный на использовании параметров регрессии яркости пикселя на вектор значений яркости в его окрестности.

2. Информационная технология обнаружения локальных текстурных неоднородностей на основе метода опорных векторов, а также методика выбора параметров алгоритма и результаты исследования метода выделения текстурных неоднородностей.

3. Оценка мер схожести текстурных изображений на основе дивергенции Кульбака—Лейблера и интегральных вероятностных метрик.

4. Вид функции ядра скалярного произведения текстурных изображений на основе мер сх�