автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка методологии сравнительного исследования компьютерных методов обработки изображений

доктора технических наук
Кольцов, Пётр Петрович
город
Москва
год
2012
специальность ВАК РФ
05.13.17
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка методологии сравнительного исследования компьютерных методов обработки изображений»

Автореферат диссертации по теме "Разработка методологии сравнительного исследования компьютерных методов обработки изображений"

005018260

На правах рукописи

У

КОЛЬЦОВ ПЁТР ПЕТРОВИЧ

РАЗРАБОТКА МЕТОДОЛОГИИ СРАВНИТЕЛЬНОГО ИССЛЕДОВАНИЯ КОМПЬЮТЕРНЫХ МЕТОДОВ ОБРАБОТКИ ИЗОБРАЖЕНИЙ

Специальность 05.13.17-теоретические основы информатики

Автореферат диссертации на соискание ученой степени доктора технических наук

1 9 ДПР 2012

Москва 2012

005018260

Работа выполнена в Федеральном государственном бюджетном учреждении науки Научно-исследовательском институте системных исследований Российской академии наук Официальные

оппоненты: Константин Владимирович Рудаков,

доктор физико-математических наук, член-корреспондент РАН,

Федеральное государственное бюджетное учреждение науки Вычислительный центр им. A.A. Дородницына Российской академии наук (ВЦ РАН), зав. отделом

Михаил Николаевич Устинин,

доктор физико-математических наук, Федеральное государственное бюджетное учреждение науки Институт математических проблем биологии Российской академии наук (ИМПБ РАН), зам. директора

Юрий Саввич Вишняков,

доктор технических наук,

Отделение математических наук Российской

академии наук (ОМН РАН), нач. отдела.

Ведущая

организация: Федеральное государственное бюджетное учреждение науки Институт систем обработки изображений Российской академии наук (ИСОИ РАН)

Защита диссертации состоится «17» мая 2012 г. в 14-00 на заседании диссертационного совета Д 002.017.02 при ВЦ РАН по адресу: 119333, г. Москва, ул. Вавилова, д. 40.

С диссертацией можно ознакомиться в библиотеке ВЦ РАН

Автореферат разослан «10» апреля 2012 г.

Учёный секретарь диссертационного совета Д 002.017.02

д.ф-м.н., профессор / В.В.Рязанов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

История создания методов цифровой обработки и понимания изображений составляет уже более полувека. За это время было создано необозримое количество алгоритмов самого разного назначения. Многие из них весьма эффективно применяются для решения различных, как правило, узкоспециализированных задач цифровой обработки изображений. Наибольшую трудность представляет собой разработка методов решения интеллектуальных задач, таких, как распознавание, понимание изображений. Но и для содержательно более простых задач реставрации изображения, выделения контура, сегментации и т.п., нельзя говорить о том, что используемые для их решения подходы позволяют получать решения, адекватные более или менее широкому спектру внешних условий. Сам факт непрерывного появления все новых и новых методов и алгоритмов решения таких задач говорит об отсутствии в среде исследователей удовлетворенности качеством уже существующих разработок, . При этом, как правило, надёжность решения задач существенно падает при снижении контрастности и резкости изображении, наличии искажений, как шумовых, так и геометрических.

В такой ситуации целенаправленное сравнение по единой методике качества работ алгоритмов, широко используемых в практических разработках, позволило бы выявить их сильные и слабые стороны. В свою очередь, это послужило бы основой для отбора тех средств цифровой обработки изображений, которые наиболее адекватны как решаемой задаче, так и характерным особенностям обрабатываемого изображения. Это обстоятельство и определяет актуальность создания соответствующей методики для решения задач, возникающих при построении реальных технических систем цифровой обработки изображений. Цель исследования

Целью исследования является построение универсальной оценки качества результатов работы алгоритмов, реализующих различные модели цифровой обработки изображений.

Задачи исследования

• Разработка методологии сравнительного исследование качества работы алгоритмов цифровой обработки визуальной информации.

• Исследование качества работы ряда известных и хорошо зарекомендовавших себя алгоритмов цифровой обработки изображений в соответствии с разработанной методологией сравнительного исследования.

• Выработка на основе полученных результатов выводов и рекомендаций по применимости исследованных методов.

Объект исследования

Объектом исследования являются методы цифровой обработки изображений, используемые для решения задач реставрации, выделения и уточнения границ, анализа текстур и сегментации. Предмет исследования

Предметом исследования являются программные реализации методов цифровой обработки изображений. Методы исследования

В работе были использованы методы цифровой обработки изображений, математического моделирования, анализа данных, кластер-анализа, информационного поиска, использование инструментальных компьютерных систем. Научная новизна

• Разработана универсальная методология сравнительного исследования качества работы для алгоритмов цифровой обработки изображений.

• Сконструирован набор специальных изображений, моделирующих элементы реальных изображений, особо трудных для цифровой обработки.

• Выполнено ранжирование по качеству работы широкого класса алгоритмов цифровой обработки изображений.

• Выявлены особенности реализаций и применимости алгоритмов реставрации изображений, выделения и уточнения границ объектов, анализа текстур и сегментации.

• Получена оценка параметров искажения, вносимого при размытии изображения.

Практическая значимость

Использование разработанной методологии позволяет:

• выполнить объективное сравнение алгоритмов цифровой обработки изображений;

• отбирать среди совокупности алгоритмов те, которые обладают наилучшими показателями качества решения соответствующих задач;

• формировать для алгоритмов цифровой обработки изображений области эффективного применения;

• выявлять наличие или отсутствие стабильности в работе алгоритмов;

• использовать алгоритмы для достижения требуемого качества адаптивно, учитывая как локальные особенности изображения, так и свойства используемых алгоритмов.

Достоверность и обоснованность

Достоверность и обоснованность полученных результатов обеспечиваются корректным применением разработанной методологии сравнительного исследования алгоритмов цифровой обработки изображений. Результаты выполненных в соответствии с разработанной методологией экспериментальных исследований не противоречат результатам, приводимым в литературных источниках. Личный вклад автора

Все результаты работы получены автором лично. На защиту выносится:

• Методология сравнительного исследования качества работы алгоритмов цифровой обработки информации на основе тестовых изображений.

• Состав и представительность набора тестовых изображений, используемых для проведения сравнительного тестирования алгоритмов цифровой обработки информации.

• Результаты применения метода сравнительного тестирования на основе тестовых изображений конкретных алгоритмов цифровой обработки.

Апробация работы

Основные положения диссертационной работы докладывались и обсуждались на следующих международных конференциях:

• 6th World Multiconference on Systemics, Cybernetics and Informatics (SCI'2002), Orlando, Florida, USA, July 14-18, 2002r.

• 8th World Multiconference on Systemics, Cybernetics and Informatics (SCP2004), Orlando, Florida, USA, July 18-21, 2004r.

• 5th WSEAS International Conference on Signal Processing, Computational Geometry and Artificial Vision, Malta, September 15-17, 2005r.

• 6th WSEAS International Conference on Signal, Speech and Image Processing, Lisbon, Portugal, September 22-24, 2006 r.

• 8th WSEAS International Conference on Signal, Speech and Image Processing, Santander, Cantabria, Spain, September 23-25, 2008r.

• 9-ая Международная конференция «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-9-2008), Нижний Новгород, 14-20 сентября 2008г.

• 13th World Multi-Conference on Systemics, Cybernetics and Informatics (WMSCI 2009), Florida, USA, July 14-13, 2009r.

• 10-ая Международная конференция «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-10-2010), Санкт-Петербург, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», 512 декабря 2010г.

Структура и объём диссертации

Работа состоит из введения, девяти глав, заключения, списка литературы из 130 наименований и Приложения. Работа изложена на 284 страницах, содержит 124 рисунка и 7 таблиц. Публикации

Основные работы, опубликованные по теме диссертации, содержатся в 18 журналах, трудах и тезисах международных конференций, в том числе 9 из них - в изданиях из списка ВАК.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении описаны модели цифровой обработки изображений, обоснована актуальность выбранной тематики, сформулированы цели работы и пути их достижения.

В первой главе описываются методы цифровой обработки изображений. В начале главы приведён обзор шумов, использование которых предполагает разработанный метод сравнительного исследования различных методов цифровой обработки изображений, описаны фильтры, используемые для шумоподавления. Далее в главе рассматриваются ряд широко используемых методов цифровой обработки изображений, сгруппированный по типам решаемых задачам.

Первая группа методов предназначена для решения задачи реставрации изображений на основе т.н. энергетических методов. В главе приведено описание методов Мамфорда-Шаха1, Гемана-Рейнольдса2 и метода с кусочно-линейной функцией в функционале энергии3.

Пусть 1(х,у) - исходное изображение, заданное в некоторой области Q.(x,y). Это изображение требуется улучшить. Пусть и(х,у) -новое изображение, заданное в той же области и являющееся решением минимизационной задачи относительно энергии Е.

В качестве . функционала энергии метода Мамфорда-Шаха рассмотрен функционал вида

£(«) = JjT-, г = (\-Л)(и-I/с)2 + Я-Il Vu ||2, о

где II Vu II обозначает норму градиента и, множитель Л, 0< Л, 0< Л <1, определяет вклад членов, зависящих от / и от ||V«|| в г, с -дополнительный нормировочный множитель.

Mumford D., Shah J. Optimal Approximations by Piecewise Ssmooth Functions and Associated Variational Problems // Commun. Pure Appl. Math - 1989-Vol. 52,- Pp. 577-685.

Geman D., Reynolds G. Constrained Restoration and the Recovery of Discontinuities// IEEETPAMI- 1992 - Vol. 14 -Pp. 376-383.

3VeksIer O. Efficient Graph-Based Energy Minimization Methods in Computer Vision // PhD Thesis, Cornell University -1999.

В качестве функционала энергии метода Гемана-Рейнольдса рассмотрен функционал вида

В качестве функционала энергии для метода с кусочно-линейной функцией рассмотрен функционал вида

Во вторую группу методов цифровой обработки изображений включены методы выделения границ, называемых по имени авторов методами Canny4, Heitger5, Rotwell6, Black7, Iverson8 и Smith9.

Метод Canny базируется на использовании т.н. фильтров Canny, имеющих следующий вид для одномерного случая: ахеш sin(ftEt) + а2е'" cos(arc) + а,е~'" sin(aHr) + cos (ах) + с, где все множители и частота являются параметрами фильтра. В основе метода Heitger лежит моделирование нейрофизиологических процессов обработки зрительной информации в мозге живых организмов.

Метод Rothwell использует топологическую структуру изображения для приближения к границам.

Метод Black является методом, основанном на использовании уравнения анизотропной диффузии

4Canny J. A. Computational Approach to Edge Detection // IEEE Pattern Anal.Machin. Intell- 1986,- Vol. 8, no 16,- Pp. 679-698.

5Heitger E., Rosenthaler L., von der Heydt R., Peterhans E., Kubler O. Simulation of Neural Contour Mechanisms: From Simple to End-Stopped Cells // Vision Research.- 1992,- no. 32,- Pp. 963-981.

6Rothwell C.A., Mundy J.L., Hoffman W., et al. Driving Vision by Topology // Int. Symp. Computer Vision - 1995 - Pp. 395-400.

7Black M., Sapiro G., Marimont D. et al. Robust Anisotropic Diffusion // IEEE Trans. Image Process.- 1998,- Vol. 7.- no. 3,- Pp. 421-432.

8Iverson L.A., Zucker, S.W. Logical/Linear Operators for Image Curves // IEEE Trans. Pattern Anal. Mach. Intell.- 1999 - Vol. 17, no. 10.- Pp. 982-996.

'Smith S.M. Flexible Filter Neighborhood Designation // Proc. 13th Int. Conf. on Pattern Recognition - 1996 - Vol. 1- Pp. 206-212.

E(u) = (1 -Л) -If + Xc1 Jp(|| Vu || !с)г ,

n

где <p(r) определяется следующим образом:

ut=dh{gaVu\\)Vu),

где функция g обладает следующими свойствами: g(x)->0 при х->а>.

Метод Iverson основан на использовании различных линейных фильтров, которые называются линейными операторами и последующей обработке результатов выдачи этих операторов по правилам Булевой логики.

Метод Smith использует нелинейную фильтрацию для определения связных частей изображения.

В эту группу также включены соответствующие модификации энергетических методов из первой группы.

К этой группе методов отнесены и т.н. методы активного контура GSNAKE и GVF10, называемых также методами уточнения границ. В основе методов активного контура лежит поиск минимума т.н. функционала энергии для параметризованной подвижной кривой на плоскости изображения п:

Модель, реализованная в методе активного контура GSNAKE, использует аналогию с тяжелой эластичной нитью, которая скатывается вниз по рельефу функции : (х, у) = VI (х, у)\2, где VI (х, у) - градиент яркости изображения.

Метод активного контура GVF позволяет решить проблему, связанную с быстрым падением влияния контура на значение энергии при удалении от контура, а также проблемы, возникающие в случае границ сложной формы.

Третья группа методов цифровой обработки изображений включает в себя следующие методы текстурного анализа: метод плотности локальных экстремумов12, фильтры Габора13, метод 10Xu Ch. Prince J. L. Snakes, Shapes and Gradient Vector Flow // IEEE Transactions on Image Processing .- 1998 - Vol. 7, no 3- Pp. 359-369.

uKass M., Witkin A., Terzopoulos D. Snakes: Active Contour Models // Intl J. Computer Vision.- 1988-Vol. 1, no 4,- Pp. 321-331.

12Karu K., Jain A.K. et al. Is There Any Texture in the Image? //Pattern Recognition -1996- Vol. 29, no. 9 - Pp. 1437-1446.

13Jain A.K., Farrokhnia F. Unsupervised Texture Segmentation Using Gabor Filters // Pattern Recognition - 1991- Vol. 24, no. 12 - Pp. 1167-1186.

0

MAXDIF, анализ плотности граничных точек14, маски Лоса15, фильтры кольцо/клин16, матрицы смежности17 и авторегрессионная модель изображения18.

В четвёртую группу методов объединены методы, предназначенные для решения задач сегментации изображений. В неё входят следующие методы сегментации, ради краткости называемых сегментаторами: EDISON19, JSEG20, EDGEFLOW21, MULTISCALE22.

Сегментатор EDISON на признаковом пространстве выполняет процедуру кластеризации точек, отвечающих исходному изображению. Сегентатор JSEG на преобразованном изображении для каждой его точки вычисляет характеристику однородности. Сегментатор EDGEFLOW формируется векторное поле потока граничных точек. Интегральные кривые этого поля образуют границы регионов. Сегментатор MULTISCALE для сегментации изображения и выделения его границ используется метод потока граничных точек, как и у сегментатора EDGEFLOW. Но векторное поле генерируется при различных масштабах, вводимых извне.

Во второй главе описаны принципы сравнительного исследования качества работы различных реализаций методов цифровой обработки изображений, инструментальные средства, разработанные для получения сравнительных оценок качества работы алгоритмов, приведены наборы тестовых изображений, используемых для получения этих оценок, перечислены метрики, применяемые при получении этих оценок.

Сравнительное исследование качества работы алгоритмов

"Dinstein I., Fong А.С. et al. Fast Discrimination Between Homogeneous and Textured Regions // Proc. of the Seventh International Conference on Pattern Recognition.- 1984,- Vol. l.-Pp. 361-363.

15Laws K.I. Rapid Texture Identification // Proc. SPIE Conf. Image Processing for Missile Guidance. - 1980 - Pp. 376-380.

16Coggins J.M., Jain A.K. A Spatial Filtering Approach to Texture Analysis // Pattern Recognition Letters - 1985 - Vol 3, no. 3 - Pp. 195-203.

17Haralick R., Shanmugam K. et al. Textural Features for Image Classification // IEEE Trans. Systems, Man, Cybernetics - 1973- Vol 3, no. 11.- Pp. 610-621.

18Mao J., Jain A.K. Texture Classification and Segmentation Using

Multiresolution Simultaneous Autoregressive Models // Pattern Recognition.- 1992,-

Vol. 25, no. 2,- Pp. 173-188.

цифровой обработки изображений опирается на следующие принципы:

• отбор для проведения исследования реализаций щироко используемых методов цифровой обработки изображений;

• разработка множества тестовых/эталонных изображений, содержащих максимально полный набор «сложных» для работы исследуемых методов цифровой обработки изображений элементов;

• выбор видов деградации тестовых изображений относительно исходных изображений для проведения сравнительного исследования;

• определение критерия качества работы исследуемых методов;

• сравнение результативности исследуемых реализаций методов цифровой обработки изображений.

Для проведения сравнительного исследование качества работы различных алгоритмов цифровой обработки изображений в соответствии с этими принципами, в качестве инструментальных средств были использованы две компьютерные системы PICASSO (Picture Algorithms Study Software) и PETRA (Performance Evaluation of Texture Recognition Algorithms), депонированные в архиве отдела научно-технической информации НИИСИ РАН. Эти средства позволяют получать оценки качества работы алгоритмов цифровой обработки изображений на тестовых изображениях, подвергаемых контролируемым искажениям, в том числе для различных критериев с использованием различных метрики.

В исследованиях, связанных с реализацией методов, "Christoudias С. М., Georgescu В. et al. Synergism in Low Level Vision // 16th International Conference on Pattern Recognition - 2002 - Vol. 4 - Pp. 150-155.

20Deng Y., Manjunath B.S. Unsupervised Segmentation of Color-Texture Regions in Images and Video // IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI'01) - 2001- Vol. 23, no. 8 - Pp. 800-810.

21Ma W.-Y., Manjunath B.S. EdgeFlow: A Technique for Boundary Detection and Image Segmentation // IEEE Transactions on Image Processing - 2002 - Vol. 9-Pp. 1375-88.

22Sumengen В., Manjunath B. S. Multi-scale Edge Detection and Image Segmentation // Proc. European Signal Processing Conference (EUSIPCO).- 2005.-Vol. CD. http://vision.ece.ucsb.edu/publications/ 05eusipcoBarisMultiscale.pdf.

связанных с обработкой граничных точек на изображении, принято различать следующие типы таких точек:

• Уступ — точка, по разные стороны от которой интенсивности существенно различаются.

• Излом - точка, в которой производная интенсивности имеет уступ.

• Горб - короткий отрезок, такой, что интенсивность внутри него существенно отличается от интенсивности вне его (два примыкающих уступа).

Каждый из этих типов граничных точек характеризуется соответствующим скалярным или векторным параметром: высота уступа, угол излома, и т.п. В работе предлагается рассматривать не отдельные граничные точки, а их совокупность в качестве некоторой кривой на плоскости. На базе вышеприведённой классификации, для точек границ на плоскости рассматривается следующая классификация, проиллюстрированная на Рис. 1-3 в виде набора искусственных изображений.

(а) (Ь)

Рис. 1. Исчезающий уступ (а) и Изменяющийся горб I (Ь)

(а) (Ь)

Рис. 2. Изменяющийся горб II (а) и Исчезающий излом (Ь)

(а) (Ь)

Рис. 3. Улитка (а) и Узел (Ь)

Приведённый выше набор изображений состоит из трех частей:

1. Исчезающий уступ, Исчезающий излом, Изменяющийся горб I и Изменяющийся горб II. Границы этих изображений являются прямыми, высота уступа изменяется по линейному закону.

2. Улитка. Граница этого изображения имеют переменную кривизну. Другие параметры изображения могут меняться так же, как и в предыдущем случае.

3. Узел. Это изображение имеет особую точку, возникающую из-за пересечения границ.

Изображения таковы, что на одном изображении представлен широкий спектр параметров, относящихся к данному типу изображения. Такой подход позволяет использовать небольшой набор тестовых изображений и представлять результаты тестирования в компактной форме, так что особенности исследуемых алгоритмов, а также пределы их применимости становятся очевидны.

Все вышеперечисленные изображения использовались в качестве тестовых для сравнительного исследования алгоритмов реставрации изображений. Это определяется тем, что при реставрации изображений должна проверяться способность алгоритмов хорошо сохраняться резкие перепады яркости. При этом также на изображении должен хорошо подавляться шум. Помимо оценки качества работы алгоритмов реставрации изображений, вышеприведённые тестовые изображения использовались при исследовании детекторов границ.

Поскольку эффективность методов уточнения границ в высокой степени зависит от степени зашумленности изображения и от сложности фона, набор тестовых изображений для исследуемых

методов активного контура включает в себя не только образцы кривых, но и образцы фона. Тестовые изображение в этом случае состоят из фона и наложенных на него границ объектов. Примеры использованных в работе фонов показаны на Рис. 4а-4с.

(а) (Ь) (с)

Рис. 4. Примеры закраски фона

Для методов активного контура «трудными» являются ситуации, когда граничная кривая (контур объекта) имеет большую кривизну. Поэтому в набор тестовых контуров включены контуры в широким диапазоне изменений кривизны. На Рис. 5 приведен пример набора объектов на основе окружности.

00<Х>

Рис. 5. Объекты с изменением оазмеюа выступов и впадин

Также в набор тестовых объектов входят контуры, построенные из прямолинейных отрезков и дуг окружностей. На Рис. 6 показаны два типа контуров, построенных с использованием квадрата и окружности.

(а) (Ь)

Рис. 6. Контуры на основе квадрата (а) и окружности (Ь)

Для проведения сравнительного исследования методов выделения текстурных областей на изображении был использован набор тестовых изображений, содержащих как естественные изображения, так и искусственные. На Рис. 7 приведены примеры используемых тестовых изображений. На Рис. 7а-7Ь -аэрофотоснимки, а на Рис.7с- искусственное изображение.

(а) (Ь) (с)

Рис. 7. Примеры тестовых изображений

Сравнительное исследование качества работы методов анализа текстурных областей выполнялось на изображениях из альбома текстур, открытой базы данных изображений и аэрокосмических снимков23.

Для проведения сравнительного исследования качества работы сегментаторов помимо тестовых изображений, приведённых на Рис.13, были использованы изображения, приведённые ниже на Рис. 8-10, моделирующие иные «трудные» для методов сегментации ситуации: соответственно сохранение углов, контраст объект/фон, ложные границы. Количественная оценка качества работы алгоритмов цифровой обработки изображений рассматривалась для случаев, когда в качестве меры различия между априорно заданным истинным т.н. ground truth изображением и результатом работы алгоритма были рассмотрены метрики Евклида, Хаусдорфа, Пратта, чувствительность и специфичность.

"^Brodatz P. Textures: A Photographic Album for Artists and Designers - NY.: Dover Publications, 1966 - 128 p

Smith G., Bums I. Measuring Texture Classification Algorithms // Pattern Recognition Letters- 1997- Vol. 18, no. 14- Pp. 1495-1501. http://www.cssip.uq.edu.au/meastex/meastex.html.

Рис. 8. Примеры тестовых изображений (углы)

Рис. 9. Примеры тестовых изображений (фон/объект)

Рис. 10. Примеры тестовых изображений (ложные границы)

Использование разных мер различия, имеющих различную содержательную интерпретацию, позволило получить всестороннее представление о качестве работы исследуемых алгоритмов.

В третьей главе приведены результаты сравнительной оценки качества работы алгоритмов, реализующих описанные в первой главе широко распространённые методы реставрации изображений.

Отметим, что метрика расстояния с? между изображениями /у и 12 на основе Евклидовой нормы изображения ¿/(//, 12) = || // - Ь\\ достаточно груба для оценки качества реставрации изображений. В частности, реставрированное изображение может находиться далеко в смысле данной метрики от истинного либо потому, что плохо

ослаблен шум, либо потому, что плохо сохранены (размыты) резкие перепады яркости вблизи граничных линий. В этой связи будем рассматривать следующие две модификации Евклидовой метрики.

Пользуясь тем, что известны исходные недеградированные ground truth изображения, для каждого изображения будем рассматривать область содержащую окрестность граничных линий. Пусть Q - вся область изображения, указанная окрестность границ -В. Тогда оставшаяся часть изображения есть Q\B. Определим метрики с/1 и (iIH , различающиеся областями определения. Метрика cf!B вычисляется на основе Евклидовой нормы в области, где нет граничных линий, поэтому величина сРв характеризует, в основном, величину шума на реставрированном изображении. Метрика cf вычисляется на основе Евклидовой нормы в области, в которой находятся граничные линии. Значение сР велико, если на реставрированном изображении границы размыты, и мало, если резкие перепады яркости вблизи границ, сохранены. При сравнительном исследовании качества работы алгоритмов реставрации изображений будем использовать именно эти две метрики: а и

На Рис. 11 показан пример графика расстояния между реставрированным после искажения (метод Гемана-Рейнольдса) и исходным изображением Изменяющийся горб II для области Q\B.

Рис. 11. График (//й, метод Гемана-Рейнольдса

На Рис. 12 приведён пример графика расстояния между реставрированным после искажения (алгоритм с кусочно-линейной функцией) и исходным изображением Изменяющийся горб II для области В.

Рис. 12. График Алгоритм с кусочно-линейной функцией

На Рис. 13 приведены примеры графиков расстояния между реставрированным после искажения (метод Мамфорда-Шаха) и исходным изображением Изменяющийся горб II для областей 0\В и В. Верхний график - для области £2\В, нижний - для окрестности границы В. Анализ графиков, отражающих результаты работы алгоритмов с помощью метрики йгш во внеграничных областях, показывает, что при больших значениях шума метод Мамфорда-Шаха подавляет его хуже других методов. Вместе с тем, анализ графиков для метрики Л' позволяет сделать вывод, что метод Мамфорда-Шаха очень хорошо сохраняет резкие перепады границ, в случае, когда уровень шума невелик.

В четвёртой главе описаны результаты тестирования реализаций шести методов выделения границ, обычно называемых детекторами границ, а также адаптированных к этой задаче энергетических методов, описание которых было приведено ранее. В качестве меры сходства использовались следующие статистические метрики - чувствительность и специфичность. Обозначим через X

Рис. 13. Графики сРш (вверху) и cf (внизу), метод Мамфорда-Шаха

множество пикселов, составляющих тестовое изображение. Пусть А - пикселы, составляющие границу ground truth изображения, а В -пикселы границ, полученную при работе тестируемого детектора границ. Тогда чувствительность Se и специфичность Sp определяется следующим образом:

$£=п{ВпЛ) s = п(ВпА)

где n(S) - число пикселов в S.

Пример результатов тестирования для случае размытия в качестве контролируемого искажения для изображения Исчезающий уступ для шести детекторов границ приведены на Рис. 14. Ось абсцисс ширина окна осреднения, ось ординат -чувствительность/специфичность в процентах.

НеИдег —О—Саппу Иоти/еИ Ж В1аск 1уег50п —□—БтКЬ

Рис. 14. Чувствительность и специфичность для тестового изображения Исчезающий уступ (размытие)

Результаты тестирования при зашумлении изображения Исчезающий уступ белым шумом тех же детекторов границ приведены на Рис. 15. Ось абсцисс - дисперсия белого шума, ось ординат - чувствительность/специфичность в процентах.

Для сравнения качества работы различных алгоритмов выделения границ на тестовых изображениях, для каждого изображения по всем значениям параметров искажений (ширина

Рис. 15. Чувствительность (слева) и специфичность (справа) для тестового изображения Исчезающий уступ (зашумление)

окна размытия, дисперсия шума) для чувствительности и специфичности находились их средние значения и дисперсия. На Рис. 16 и Рис. 17 приведены соответствующие результаты тестирования. Средние значения показаны на как столбцы. Столбцы, отвечающие

1 2 3 4 6 6

Рис. 16. Чувствительность и специфичность (размывание)

Чувствительность

□ Heitger ШCanny : . • ... [j||jjjili

□ Roth well И Black

□ Iverson 0 Smith

Специфичность 120 --------------------------- .....—----------------------------------------------------------------------—.......................

10080 -60 • 40 - JM м рш—I и ПШПЩШШПППШ Ali 3 J 4 lJL 5 : 6

Рис. 17. Чувствительность и специфичность (зашумление)

одному и тому же алгоритму, закрашены одним и тем же паттерном. Значения дисперсии показаны как черные вертикальные отрезки над соответствующими столбцами. Данные, полученные на тестовых изображениях Исчезающий уступ, Изменяющийся горб I, Изменяющийся горб II, Исчезающий излом, Улитка и Узел, сгруппированы под цифрами 1, 2, 3, 4, 5 и 6 соответственно. Не трудно видеть, что алгоритмы Canny и Rothwell имеют хорошую специфичность и чувствительность и при размытии, и при зашумлении.

В пятой главе приведены результаты сравнительной оценки качества работы различных реализаций широко используемых методов уточнения границ, описанных в первой главе. Для оценки качества работы различных реализаций метода активного контура, проводится вычисление расстояния от истинного контура тестового объекта до контура, полученного в результате применения тестируемого метода. В качестве метрики для измерения ошибки решения используются Евклидово и Хаусдорфово расстояния (в пикселах).

Для метода GSNAKE была исследована точность решения при трёх различных способах вычисления внешней энергии. Полученные результаты представлены на Рис. 18.

Рис. 18. Среднее значение ошибки ДЕтеап в зависимости от относительного размера выступов и впадин. Слева - для шаблона 2x2, справа - для шаблона 3x3

Для вычисления внешней энергии Еа1 = сот1 [1 п)] в

качестве функции F(v/,и) использовались модуль градиента интенсивности (У/,п)=|У/|, квадрат модуля градиента

^2(У/,п)=|У/|2и модуль проекции градиента на нормаль ^3(У/,п)=|/,-лх+ 1у пу\. Точность полученного контура в результате применения метода ведет себя сходным образом для любого определения энергии: она падает с увеличением размера выступов и впадин. Для разностной аппроксимации градиента интенсивности 1(х, у) использовались шаблоны 2x2 или 3x3.

Примеры сравнительной оценки качества работы методов СБЫАКЕ и СУТ показаны на Рис. 19 и Рис. 20. Здесь в качестве меры ошибки решения ДЕн бралось Хаусдорфово расстояние в пикселах между результирующим и истинным контурами. На Рис. 19 показана зависимость ошибки ДЕн от нормализованного контраста фона и объектов С. Видно, что с ростом С оба метода выбирают ложные границы.

12 10 8 6 4 2 0

Рис. 19. Ошибка АЕН в зависимости от контраста

о -1-1-1-1-1—|—

О 0,1 0,2 0,3

Рис. 20. Ошибка ДЕн в зависимости от величины углубления

На Рис. 20 показана зависимость ошибки ДЕн от относительной величины углубления а/Н на тестовом изображении при

фиксированном контрасте С. Видно, что метод вУР дает лучшие результаты при любой величине каверн на изображении.

В шестой главе рассмотрены результаты сравнительного изучения качества работы реализаций описанных в первой главе методов предобработки изображений, предназначенных для выделения текстурных областей на изображении, а также методов текстурного анализа, решающих задачу получения конкретных значений характеристик текстур, формирующих соответствующее признаковое пространство.

Для численной оценки качества работы тестируемых алгоритмов был использован модифицированный показатель качества Пратта (ТОЛ/):

где N - число пикселов изображения, с/, - Евклидово расстояние между ;-м пикселом изображения после работы алгоритма и его истинной областью (текстурной или бестекстурной), у - постоянный шкалирующий множитель, который может использоваться для изменения вклада ошибок в FOM.

Значения оценки качества FOM, полученное в результате исследования алгоритмов плотности граничных точек (ED), плотности локальных экстремумов (LED) и MAXDIF (MD) отражены на Рис. 21. Эти оценки по дочитывались отдельно на естественных и искусственных тестовых изображениях.

1 "

FOM = — Y

AI

NttX + yd^

■ 2 '

Есте ст.

Искусств.

В ED, И LED, Ш MD

Рис. 21. Диаграмма качества работы методов ED, LED и MD

На Рис. 22 приведены результаты тестирования алгоритмов, реализующих фильтр Габора (Gabor), маски Лоса (Laws), кольцо/клин (RWF), матрицы смежности (GLSM), авторегрессионную модель (MR-SAR). Для тестирования этих алгоритмов были использованы

■ GABOR Ш GLCM Ш LAWS Ш MR-SAR SRWF

Рис. 22. Диаграмма результатов тестов на различных наборах изображений. По оси ординат - процент правильно классифицированных образцов

три набора изображений: текстуры из альбома Бродаца (Brodatz), базы данных MeasTex23 и текстуры на наборе аэрофотоснимков.

Полученные результаты показывают, что алгоритм ED обладает наилучшим качеством на задачах выделения текстур, а на задачах текстурного анализа ни одна из реализаций исследуемых методов не показала абсолютного превосходства над другими.

В седьмой главе приведены результаты исследования качества работы детекторов границ Rothwell, Black, Smith, Heitger, Iverson и Canny при аффинных преобразованиях исходных изображений. В качестве аффинных преобразований рассматривались поворот, сдвиг и сжатие/растяжение. В качестве мер различия между ground truth изображением и изображением, полученным в результате работы того, или иного детектора, были рассмотрены чувствительность, специфичность, метрика Прагга, Хаусдорфова метрика В качестве исходных тестовых изображений были взяты Исчезающий уступ, Исчезающий излом и Узел, содержащие несколько характерных типов границ. После применения набора аффинных преобразований для всех изображений был получен набор соответствующих тестовых

изображений для выполнения сравнительной оценки качества работы детекторов границ при аффинных преобразованиях.

Таблица 1 представляет пример полученных результатов для детектора КоИі\ує11, примененного к изображению Исчезающий излом.

Изображения Чувстви- Специ- Пратг Хаусдорф

тельность фичность

Исходное 0.367 0.98 0.32 79.0

Поворот 5° 0.746 1.00 0.26 63.5

Поворот 90° 0.35 1.00 0.17 57.0

Поворот 180° 0.39 0.99 0.33 69.6

Сдвиг 0.38 0.94 0.37 71.0

Сжатие (0.9) 0.687 1.00 0.67 54.1

Таблица 1. Оценка качества работы детектора Rothwell, примененного к изображению Исчезающий излом

В Таблице 2 представлены результаты применение детектора Smith к изображению Узел.

Изображения Чувствительность Специфичность Пратт Хаусдорф

Исходное 0.869 1.00 0.76 26.1

Поворот на 45° 0.5969 0.86 0.43 126

Таблица 2. Оценка качества работы детектора Smith, примененного к изображению Узел.

Выполненные исследования показали, что среди рассмотренных детекторов границ отсутствует стабильный лидер по качеству работы на всех объектах, подвергаемых аффинным преобразованиям.

В восьмой главе приведены результаты сравнительного исследования качества работы реализаций четырёх описанных ранее методов сегментации изображений EDISON, JSEG, EDGEFLOW,

МиСПБСЛЬЕ, выполненного, в том числе, и для различных значений управляющих параметров.

При построении оценки качества работы сегментаторов, в качестве меры близости между истинным и деградированным изображением были рассмотрены Евклидова метрика, метрика Хаусдорфа и её модификация.

Пусть X и У - два множества точек. Если Хаусдорфово расстояние х(Х, У) между множествами X и У определяется как

где р(х, у) обычное Евклидово расстояние между точками .г и у, а р(х,У) = тт р(х, у), то модифицированная метрика Хаусдорфа с1(.X, У)

уеГ

определяется следующим образом.

Пусть множества X и У содержат Ад- и Му точек. Тогда

Отметим, что если величина х(Х У) дает скорее максимальное расстояние между точками множеств, то с1(Х, У), то с1(Х, У) дает в некотором роде среднее расстояние. Очевидно, с1(Х, У) > О, <1(Х, X) =0 и с1(Х, У) = с!(У, X).

Полученные результаты тестирования сегментаторов собраны в три группы. В первую группу отнесены результаты, полученные при работе сегментаторов на изображениях с углами, при обработке слабоконтрастных областей и при сегментации монохромных регионов с медленно изменяющейся яркостью. Тестовые изображения деградации не подвергались.

При сегментации изображений с углом обычно в основном искажается вершина угла, и чем острее угол, тем больше могут быть искажения. За оценку качества сегментации углов было выбрано Евклидово расстояние между истинной вершиной угла и ближайшей к ней точкой отсегментированного угла. Это расстояние как функция величины угла показано на графиках, приведенных ниже

%(Х, У) = шах хр(х,У), тах р(у,Х)

^ 'V V Х^х "г у^у

1

На Рис. 23 приведены результаты работы сегментаторов EDISON и MULTISCALE на изображениях с углами. Можно видеть, что сегментаторы сохраняют углы практически идеально.

I I I' I 1

Угол, град. 180 -EDISON .......MULTISCALE

Рис. 23. Сохранение углов сегментаторами EDISON и MULTISCALE

При обработке результатов сравнительного исследования сегментаторов обнаружилась нестабильность, выраженная в существенной негладкости получаемых графиков. В этой связи, для большей наглядности, точки графиков были приближены полиномиальными линиями трендов.

При сегментации слабоконтрастных областей практически все сегментаторы точно выделяли на тестовых изображениях круг как отдельный сегмент, если его яркость превышает яркость фона на 1-2 единицы, независимо от яркости самого фона.

При исследовании поведения сегментаторов на монохромных регионах с медленно изменяющейся яркостью определялось количество ложных границ, которые получились после сегментации этих изображений. Их число рассматривалось как функция от максимальной яркости тестового изображения на левой границе тестового изображения. На Рис. 24 приведены графики трендов для различных сегментаторов. Можно видеть, что при росте максимальной яркости тестового изображения, в среднем количество ложных границ перестает возрастать. Результаты показывают, что обработка изображений с высоким контрастом и плавным

изменением яркости оказалась трудной для тестируемых сегментаторов.

—Ф—EDISON 100 -»-EDISON 1000 EDGEFLOW 10

—К— EDGEFLOW 26 —3te— MULTISCALE -e-JSEG

10000 -

0 Максимальная яркость 255

Рис. 24. Линии тренда для различных сегментаторов при сегментации регионов с медленно изменяющейся яркостью

Вторая группа результатов получена при исследовании поведения сегментаторов на тестовых изображениях первой группы, подвергаемых зашумлению и размытию. На Рис. 25 и Рис. 26 приведены графики поведения сегментаторов при тестировании для зашумленных и размытых изображений соответственно.

—JSEG —к- EDGEFLOW 10 —Х- EDGEFLOW 26

—♦—EDISON 100 -»-EDISON 1000 —Ж— MULTISCALE

Рис. 25. Зашумление изображений, Хаусдорфово расстояние (пике.)

Из анализа этих графиков становится очевидным преимущество сегментатора JSEG относительно остальных сегментаторов при зашумлении и сегментатора EDISON при размытии.

—Ж— MULTI SCALE —•—JSEG EDISON 1000

—А—EDGEFLOW 10 -К—EDGEFLOW 26

Рис. 26. Размытие изображений, среднее расстояние (пике.)

Третья группа результатов характеризует поведение сегментаторов на изображениях Исчезающий уступ, Узел, Улитка, Излом после зашумления и размытия. На Рис. 27 и Рис. 28 приведены графики поведения сегментаторов при зашумлении и размытии тестовых изображений соответственно.

—Ж— MULTISCALE —Ф—EDISON 100 -«-EDISON 1000 —*— EDGEFLOW 10 -К-EDGEFLOW 26 -«—JSEG

Рис. 27. Зашумление изображений, Хаусдорфово расстояние (пике.)

—*-MULTISCALE —»—EDISON 100 —«—EDISON 1000 —▲— EDGEFLOW 10 -X- EDGEFLOW 26 —•—JSEG

Рис. 28. Размытие изображений, среднее расстояние (пике.)

Из анализа графиков трендов видно преимущество результатов работы сегментаторов EDISON и JSEG при зашумлении и сегментатора JSEG при размытии.

В девятой главе описан подход к получению оценки характеристик искажений изображения. Как было показано выше, качество работы алгоритмов предобработки изображений существенно зависит от параметров искажений (шума и размытия), которым подвергались изображения. Таким образом, для выбора алгоритма предобработки, наиболее адекватного для применения к конкретному изображению, необходимо априорное знание характеристик искажений. Оценка параметров шума для использования в последующей фильтрации кратко описывается в первой главе работы. В настоящее время существует обширная библиография, включая программные продукты, посвященных этой тематике24. В данной главе рассмотрен

24Rank К., Lendl М., Unbehauen R. Estimation of Imagenoise Variance // IEEE Proc. Vis. Image Signal Process.- 1999,- Vol. 146, no. 2,- Pp. 80-84.

Luxen M., Forstner W. Characterizing Image Quality: Blind Estimation of the Point Spread Function from a Single Image // ISPRS Commission III: Theory and Algorithms.- 2002,- Vol. 34, part ЗА,- Pp. 205-210.

Portilla J. J., Strela V. et al. Image Denoising Using Scale Mixtures of Gaussians in the Wavelet Domain // IEEE Transactions on Image Processing - 2003-Vol. 12, no. 11,- Pp. 1338-1351.

Stefano A., White P. et al. Training Methods for Image Noise Level Estimation on Wavelet Components // EURASIP Journal on Applied Signal Processing- 2004-no. 16 - Pp. 2400- 2407.

вопрос об оценке параметров размытия изображения. Использован подход, предложенный в работе25: степень размытия оценивается по каждой строке и столбцу изображения. Численная оценка размытия двумерного изображения дается как минимум численных оценок размытия по всем одномерным столбцам и строкам. В качестве собственно оценки размытия одномерного графика яркости вдоль строки/столбца рассмотрено расстояние 2d между ближайшими соседними максимумом и минимумом второй производной яркости.

Для случаев Гауссова и равномерного размытия исходного изображения, при помощи дополнительного Гауссова размытия с заданным окном сг, получены формулы, позволяющие найти размеры окон размытия соответственно <тх и а:

X

где * = —, g(x) - функция, обратная к функции /(у) = у . о th(y)

На Рис. 29 приведены графики функций fix), g(x) и -g(r2).

Рис. 29. Функции для определения окна размытия а

Очевидно, функция /(*) трансцендентна и не допускает обращения в элементарных функциях. Исходя из вида f(x),

можно вычислить таблицы для g(x) и —g(x2), а также построить

х

-25-------

Zucker S., Elder J. Scale Space Localization, Blur, and Contour-Based Image

Coding // CVPR Proc.- 1996.- Pp. 27-34.

всех требуемых функций. Как можно видеть, функция — ^(х2)

X

практически не отличается от функции у=х уже при значениях аргументам <Уо , больших 1.5. Таким образом, при этих значенияхх

имеем — » —, то есть, а сг

Для изображения Исчезающий уступ был выполнен эксперимент по определению истинного окна Гауссова размытия заданное- Вычисленный параметр размытия ах „ычисЖннпе был получен по одномерному графику яркости. Результаты измерений приведены в таблице 3

Ох заданное (Ух вычисленное

0.0 0.12

0.5 0.61

1.0 1.13

1.5 1.62

2.0 2.12

2.5 2.56

3.0 3.11

Таблица 3. Значения истинного и вычисленного параметров размытия

Как можно видеть, величины ах >„„„,,е и ах вычЖленное близки. Это говорит о достаточной точности определения размытия в двумерном случае.

В заключении сформулированы основные результаты и выводы, а также рекомендации по применимости алгоритмов. В соответствии с поставленной целью, основными результатами работы является:

• разработка методологии сравнительного исследования качества работы широкого класса компьютерных методов анализа и

обработки визуальной информации на основе набора эталонных изображений;

• проведение в соответствии с разработанной методологией сравнительного исследования ряда широко известных и хорошо себя зарекомендовавших методов реставрации изображений, выделения и уточнения границ объектов, анализа текстур и сегментации;

• выработка рекомендации по применимости исследованных методов компьютерной обработки визуальной информации.

Выполненные сравнительные исследования позволили сделать следующие выводы.

• При решении задачи реставрации метод, использующий кусочно-линейную функцию, проявляет нестабильность работы на зашумленных изображениях.

• Алгоритмы выделения границ Heitger и Canny обладают наилучшей чувствительностью, а алгоритмы Canny и Rothwell - наилучшей специфичностью при работе на размытых изображениях простой структуры.

• Для изображений со сложной структурой границ только алгоритмы Canny и Rothwell проявили достаточно хорошие специфичность и чувствительность на размытых изображениях.

• Все тестированные реализации методов выделения границ имеют схожую чувствительность и являются устойчивыми к белому шуму.

• Характер поведения энергетических методов выделения границ Мамфорда-Шаха, Гемана-Рейнольдса и с использованием кусочно-линейной функции при Гауссовом зашумлении для чувствительности и специфичности примерно одинаков.

• Методы уточнения границ GSNAKE и GVF ведут себя одинаково при зашумлении и размытии границ.

• Среди методов текстурного анализа ни одна из реализаций исследуемых методов не показала абсолютного превосходства над другими.

• При аффинных преобразованиях изображений все исследованные реализации различных методов детектирования границ продемонстрировали одинаковый характер поведения на тестовых изображениях.

• Выделение слабоконтрастных областей рассмотренными в работе сегментаторами позволяет выявлять особенности их реализаций.

Приведённые выше выводы вместе с результатами исследования позволяют сделать следующие рекомендации по применимости исследованных методов.

• При решении задач реставрации изображений метод Гемана-Рейнольдса предпочтителен при работе с сильным зашумлением, а метод Мамфорда-Шаха - при слабом.

• При работе на размытых изображениях как простой, так и сложной структуры для достижения наилучшей чувствительности и специфичности предпочтительно использовать алгоритм выделения границ Canny.

• Для зашумленных белым шумом изображений при одинаковой чувствительности всех тестированных алгоритмов, для достижения наилучшей чувствительности предпочтительно использовать алгоритмы выделения границ Canny и Rothwell.

• Использование исследованной реализации метода выделения границ Мамфорда-Шаха при Гауссовом зашумлении нецелесообразно.

• Метод уточнения границ GVF предпочтителен при наличии больших каверн на изображении.

• Метод уточнения границ GSNAKE предпочтителен в случае, если граница изменяется плавно, а уровень шума невелик.

• Для предварительной сегментации предпочтительно использовать алгоритм плотности граничных точек.

• При отсутствии искажений сегментаторы EDISON и MULTISCALE предпочтительны при обработке изображений с углами.

• При малой контрастности при работе на изображениях с плавно изменяющейся яркостью предпочтителен сегментатор MULTISCALE.

• Сегментатор JSEG предпочтителен при работе на зашумлённых и сложных размытых изображениях.

• Сегментатор EDISON предпочтителен при работе на простых размытых изображениях.

Таким образом, выполненная работа создала проверенную на реальных и широко используемых реализациях разнообразных методов компьютерной обработки изображений методологию, позволяющую в практических разработках строить из набора имеющихся средств системы, наиболее адекватные поставленным практическим задачам. Другими словами, практическое применение разработанной методологии сравнительного исследования качества работы различных методов компьютерной обработки изображений позволяет строить автоматические и автоматизированные системы, учитывающие реальные особенности обрабатываемой видеографической информации и используемых методов, включая границы их применимости.

В Приложении приведена структурная схема использованных компьютерных систем PICASSO и PETRA, их архивный номер и децимальный индекс НИИСИ РАН.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Koltsov P.P. A Comparative Study of Image Processing Algorithms // Pattern Recognition and Image Analysis- 2011- Vol. 21, no. 2,-Pp. 148-151.

2. Кольцов П.П. Использование метрик при сравнительном исследовании качества работы алгоритмов сегментации изображений // Информатика и её применения - 2011,- Т. 5, вып. 3.— С. 51—61.

3. Кольцов П.П. Оценка качества работы алгоритмов цифровой обработки изображений // Доклады РАН - 2011- Т. 440, № 3. - С. 1— 3.

4. Кольцов П.П. Оценка размытия изображения // Компьютерная оптика-2011,-Т. 35, № 1-С. 95-102.

5. Кольцов П.П. Эмпирический подход к оценке алгоритмов выделения границ // Информационные технологии и вычислительные системы,- 2011,- № 2,- С. 50-57.

6. Кольцов П.П. Сравнительное изучение алгоритмов выделения и классификации текстур // Журнал вычислительной математики и математической физики - 2011- Т. 51, № 8- С. 1561— 1568.

7. Koltsov P.P. Comparative Analysis of Image Processing Algorithms // Pattern Recognition and Image Analysis - 2012 - Vol. 22, no. l.-Pp. 39^13.

8. Gribkov I.V., Koltsov P.P. et al. Robustness of Noisy and Blurry Images Segmentation // Pattern Recognition and Image Analysis - 2009-Vol. 19, no. 3,- Pp. 484-490.

9. Gribkov I.V., Koltsov P.P. et al. PICASSO - A System for Evaluating Edge Detection Algorithms // Pattern Recognition and Image Analysis.- 2003,- Vol. 13, no. 4,- Pp. 617-622.

10. Gribkov I.V., Koltsov P.P. et al. Performance evaluation of Texture Segmentation Methods // Proc. 13th World MultiConf. on Systemics, Cybernetics and Informatics - 2009- Vol. 4 - Pp. 137-142.

11. Gribkov I.V., Koltsov P.P. et al. Study of Noisy and Blurry Images Segmentation // Proc. 9 Int. Conf. on Pattern Recognition and Image Analysis: New Information Technologies (PRIA-9-2008).- 2008.-Vol. 1.- Pp.193-196.

12. Gribkov I.V., Koltsov P.P. et al. Comparative Study of Image Segmentation Algorithms // Proc. 8th WSEAS Int. Conf. on Signal, Speech and Image Processing.- 2008 - Pp. 21-28.

13. Gribkov I.V., Koltsov P.P. et al. Affine Invariance Study of Edge Detection Algorithms by Means of PICASSO 2 System // Proc. 6th WSEAS Int. Conf. on Signal, Speech and Image Processing - 2006 - Pp. 11-16.

14. Gribkov I.V., Koltsov P.P. et al. Edge Detection Under Affine Transformations: Comparative Study by the PICASSO 2 System // WSEAS Trans, on Signal Processing.- 2006,- Vol. 2, no. 9,- Pp. 12151222.

15. Gribkov I.V., Koltsov P.P. et al. PICASSO 2 - a System for Performance Evaluation of Image Processing Methods // Proc. 5th WSEAS Int. Conf. on Signal Processing, Computational Geometry and Artificial Vision.- 2005.- Pp. 88-93.

16. Gribkov I.V., Koltsov P.P. et al. Empirical Evaluation of Image Processing Methods Using PICASSO 2 System // WSEAS Trans, on Systems.- 2005,- Vol. 4, no. 11. - Pp. 1923-1930.

17. Gribkov I.V., Koltsov P.P. et al. Testing of Energy Minimizing Methods in Image Preprocessing Using the PICASSO System // Proc. 8th World MultiConf. on Systemics, Cybernetics and Informatics - 2004-Vol. 6,- Pp. 233-238.

18. Gribkov I.V., Koltsov P.P. et al. PICASSO - Edge Detectors Evaluation System based on the Comprehensive Set of Artificial Images // Proc. 6th World MultiConf. on Systemics, Cybernetics and Informatics-2002,-Vol. 9.-Pp. 88-94.

Работы с 1 no 9 опубликованы в изданиях, рекомендуемых ВАК

РФ.

Подписано в печать 12.03.12 Усл.печ.л. 2.0 Заказ №1563 Тираж 100 экз. ООО «ВЕГА-СЕРВИС» ИНН 7727545970 117218, Москва, Кржижановского, д.7, (495) 642-84-28 www.awx.ru

Оглавление автор диссертации — доктора технических наук Кольцов, Пётр Петрович

ВВЕДЕНИЕ.

ГЛАВА 1. МЕТОДЫ ПРЕДОБРАБОТКИ ИЗОБРАЖЕНИЙ.

1.1 Модели шумов и фильтры.

1.2 Реставрация (восстановление) изображений.

1.3 Методы выделения границ.

1.4 Методы анализа текстур.

1.5 Методы сегментации.

ГЛАВА 2. ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА СРАВНИТЕЛЬНОГО ИССЛЕДОВАНИЯ МЕТОДОВ ПРЕДОБРАБОТКИ ИЗОБРАЖЕНИЙ.

2.1 Принципы сравнительного исследования.

2.2. Система PICASSO.

2.3 Система PETRA.

2.4 Наборы тестовых изображений.

2.5 Мера различия изображений.

ГЛАВА 3. РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ МЕТОДОВ РЕСТАВРАЦИИ ИЗОБРАЖЕНИЯ.

3.1 Методика сравнительного тестирования.

3.2 Метрика различий.

3.3 Тестирование при изменении уровня Гауссова зашумления.

3.4 Тестирование при других типах шумов.

3.5 Тестирование при варьировании уровня шума и параметра метода.

ГЛАВА 4. РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ МЕТОДОВ ВЫДЕЛЕНИЯ

ГРАНИЦ.

4.1 Методика сравнительного тестирования.

4.2 Меры сходства.

4.3 Тестирование с окном осреднения и добавлением белого шума

4.4 Тестирование энергетических методов на изображениях с добавлением Гауссова шума.

ГЛАВА 5. РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ МЕТОДОВ УТОЧНЕНИЯ ГРАНИЦ.

5.1 Методика сравнительного тестирования.

5.2 Тестирование метода GSNAKE.

5.3 Сравнительное тестирование методов GSNAKE и GVF.

ГЛАВА 6. РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ МЕТОДОВ РАЗДЕЛЕНИЯ ИЗОБРАЖЕНИЯ НА ТЕКСТУРНУЮ И БЕСТЕКСТУРНУЮ ЧАСТИ И АНАЛИЗА ТЕКСТУР.

6.1 Методика сравнительного тестирования методов выделения текстурных областей.

6.2 Результаты тестирования методов предварительной сегментации.

6.3 Методика тестирование методов текстурного анализа.

6.4 Результаты тестирование методов текстурного анализа.

ГЛАВА 7. РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ ПРИ АФФИННЫХ ПРЕОБРАЗОВАНИЯХ ГРАНИЦ.

7.1 Методика сравнительного тестирования детекторов границ.

7.2 Результаты тестирования.

ГЛАВА 8. РЕЗУЛЬТАТЫ ТЕСТИРОВАНИЯ МЕТОДОВ СЕГМЕНТАЦИИ.

8.1 Методика сравнительного тестирования сегментаторов.

8.2 Использованные метрики и их применение.

8.3 Первая группа результатов работы сегментаторов.

8.4 Вторая группа результатов работы сегментаторов.

8.5 Третья группа результатов работы сегментаторов.

ГЛАВА 9. ОЦЕНКА ИСКАЖЕНИЯ ИЗОБРАЖЕНИЯ.

9.1 Подход к оценке размытия.

9.2 Размытие одномерного графика.

9.3 Оценка размытия. Два случая.

9.4 Алгоритмы оценки размытия изображений.

Введение 2012 год, диссертация по информатике, вычислительной технике и управлению, Кольцов, Пётр Петрович

Как известно [1,2], основной объем информации извне человек получает через зрительный тракт. Такую информацию впредь и будем называть визуальной, относя к ней также и иные виды информации или данных, визуализированных тем или иным способом. Эта информация, воспринимаемая человеком и обрабатываемая им некоторым образом, играет важнейшую роль в его способности ориентироваться в пространстве, прогнозировать течение событий внешнего физического мира, находить причинно-следственные связи между этими событиями, а также решать большое число иных задач, относящихся к т.н. интеллектуальной сфере деятельности человека и, в значительной степени, обуславливающих его выживание в окружающей среде. Так, например, человек способен на основе визуальной информации выделить интересующий его объект во внешней среде, взять в руки интересующий объект из группы объектов, оценить взаимное расположение объектов, спрогнозировать скорость их перемещения во внешней среде и т.п. Приведённые примеры задач, эффективно решаемых человеком, а также иные задачи, не поддающиеся столь же эффективному решению без его привлечения, обычно и называют интеллектуальными.

Указанная особая значимость визуальной информации в жизни человека во многом определяет большой интерес со стороны исследователей к тому, каким образом эта информация обрабатывается человеком и как на основе этой обработки человек решает стоящие перед ним задачи. В дальнейшем такую обработку и решение на её основе интеллектуальных задач будем называть интеллектуальной обработкой визуальной информации человеком.

Первоначальное изучение механизмов, позволяющих человеку решать широкий спектр интеллектуальных задач на базе визуальной внешней информации, было связано с анализом различных аспектов работы зрительного тракта человека, а также физиологических аспектов работы высшей нервной системы человека [3,4]. Были детально исследованы работа сетчатки глаза человека, особенности передачи электрических импульсов по нервным волокнам от сетчатки в мозг, активность различных структур головного мозга в ходе обработки визуальной информации и т.п. Эти исследования позволили изучить цепочку преобразований визуальной информации при вводе, передаче и обработке информации в ходе решения человеком конкретных задач, соответсвующий физиологический механизм процессов, обеспечивающих эти преобразования.

Однако в настоящее время, даже при достаточно глубоком проникновении в сущность физиологических процессов, протекающих при интеллектуальной обработке визуальной информации, отсутствует точное знание конкретных механизмов, позволяющих человеку решать интеллектуальные задачи. Таким образом, можно говорить, что вид преобразований исходной визуальной информации и формат получаемых при этом данных достаточно хорошо изучен, однако механизм интеллектуальной обработки визуальной информации человеком до конца не ясен.

Резкое усиление интереса к интеллектуальной обработке визуальной информации с середины XX века связано с насущной потребностью автоматизации такой обработки в роботизированных промышленных системах, при поиске по базам визуальной информации, в системах промышленного зрения и т.п. При достаточной простоте для человека каждой конкретной интеллектуальной задачи из числа требующих автоматизации, их количество и требуемая скорость решения становились непреодолимой преградой при использовании человека для их решения даже в автоматизированном режиме.

В такой ситуации, при отсутствии детального знания механизма решения человеком интеллектуальных задач на базе визуальной информации, исследователи начали искать новые методы исследования. Суть их сводилась к замене неизвестного реального механизма интеллектуальной обработки визуальной информации человеком на конкретный, формально описанный механизм (модель), единственным требованием к которому являлась функциональная эквивалентность модели реально существующему механизму. В общем случае такой подход, когда реальный механизм функционирования некоторой системы неизвестен и подменяется функционально эквивалентной моделью, построенной на основе «разумных» допущений, обычно называется эвристическим, а сами модели - эвристиками. Очевидно, что построение всеобъемлющей модели такого механизма означает создание искусственного интеллекта в области обработки визуальной информации. В настоящее время построение такой модели затруднительно как в силу широкого спектра задач, решаемых человеком на базе визуальной информации, так и в силу их плохой формализуемости. Тем не менее, для весьма большого числа задач, в основном связанных с изображениями конкретных объектов, (идентификация человека по фотоизображению, по отпечаткам пальцев, автоматическое считывание машинописных и рукописных текстов, иридодиагностика, дешифровка данных аэрофотосъёмки и т.д.) такие модели были построены и изучены.

Таким образом, наше незнание реальных механизмов решения задач человеком восполняется внешними предположениями (гипотезами) о принципах работы этих механизмов, позволяющих формализовать построение вышеуказанных моделей интеллектуальной обработки визуальной информации. Алгоритмическую или программную реализацию таких эвристик будем называть информационной моделью или просто моделью интеллектуальной обработки визуальной информации.

Так, например, обычной основой информационной модели процесса распознавания человеком тех или иных образов (в том числе и визуальных) является т.н. гипотеза компактности [5], базирующаяся на предположении о том, что похожие объекты должны быть в некотором смысле близки, а непохожие - далеки друг от друга. Исходя из этого допущения о сущности механизма распознавания, различными исследователями было предложено большое число разнообразных информационных моделей распознавания визуальных образов, объединяемых обычно в классы моделей на основе общности идеологии их функционирования [6].

В рамках описанного выше подхода к созданию моделей интеллектуальной обработки визуальной информации, функциональная эквивалентность той, или иной информационной модели реально существующему механизму решения задачи, и, следовательно, допустимость использованных при создании модели гипотез, оценивается, как правило, близостью «модельного» решения к «идеальному», получаемому человеком. Характер и свойства этой близости обычно определяются конкретным видом используемого для её оценки функционала качества модели.

Реализация разнообразных информационных моделей интеллектуальной обработки визуальной информации, изучение свойств и особенностей этих моделей, стали предметом интенсивных исследований практически сразу с момента появления вычислительной техники в конце 40-х годов XX века, ставшей мощным инструментальным средством реализации таких моделей. Наиболее ярким примером является создание модели нейрона [3] и построение на этой основе перцепртона - первой информационной модели совместной работы коллектива нейронов, предназначенной для решения задач классификации информации на основе обучения [7]. В дальнейшем, на базе исследования этой модели, возник весьма обширный класс моделей, обычно называемых нейросетевыми, позволяющий решать, в том числе, и ряд задач интеллектуальной обработки визуальной информации [8].

В настоящее время число публикаций за год, так или иначе связанных с компьютерными методами обработки визуализированной информации, достигает нескольких тысяч. Как отмечалось выше, такой интерес к компьютерной обработке изображений во многом обусловлен потребностью в автоматических системах для решения различных прикладных задач. Сюда можно отнести задачи автоматического ввода текстов в ЭВМ, задачи автоматической дешифровки аэрофотоснимков, задачи контроля автомобильного движения, и т.д. В качестве конкретного примера задачи такого рода можно привести задачу автоматического выделения объектов простой геометрической формы на аэрофотоснимках при дешифрации объектов на изображении городской территории, полученном с помощью аэрокосмических средств. На Рис. 1 приведён пример такого изображения, на котором требуется выделить строения и автомобили.

Рис. 1. Аэрофотоснимок местности

Задачи такого рода, эффективно решаемые человеком и относящиеся к его интеллектуальной деятельности, представляют собой широкое поле для исследователей с точки зрения построения моделей этого процесса. Можно утверждать, что практически все существующие подходы к построению таких моделей явно или неявно носят эвристический характер в том смысле, что основываются на некоторых разумных допущениях (гипотезах) не только по процедуре их обработки, но и по свойствам обрабатываемых данных. На основе этих допущений, уже формальным образом, строится собственно модель интеллектуального процесса, позволяющая решать охватываемые моделью задачи.

Необходимо отметить, что число достаточно успешных программных реализаций самых разнообразных моделей интеллектуальной обработки визуальной информации к настоящему времени достигает нескольких десятков. Исходным носителем этой информации, как правило, являются фото/видеоизображения конкретных сцен и объектов.

Поскольку интеллектуальная обработка визуальной информации моделью реализуется на ЭВМ, необходимо определить общий вид носителя этой информации, приемлемый для машинной обработки. В данной работе под носителем исходной визуальной информации самого общего вида будет подразумеваться совокупность монохромных оцифровок ||а ||, в общем случае полутоновых, полученных из конечных двумерных фото/видеоизображение сцен с размещёнными на них объектами: а\\е\л}, \\а\\ = \\а ¡, м ,а I, =0,1,.,Ь-1, ¿>0, /=7,.,М, М> 0,

В дальнейшем под исходной визуальной информацией будем подразумевать носитель этой информации в указанном выше виде, пригодном для ввода в ЭВМ. Другими словами, в качестве исходной информации рассматривается совокупность отсчётов яркости изображения, полученная с помощью аналого-цифрового преобразования реального фото/видеоизображения в MxN точках, или оцифровка исходного изображения.

Как правило, содержательно обработку на ЭВМ исходной визуальной информации моделями можно разбить на два этапа. На первом этапе эффективно находятся значения ряда интегральных или локальных характеристик входной визуальной информации. В качестве таких характеристик могут браться распределения яркости, контраста, градиентные, спектральные характеристики, специфические локальные особенности и т.п. Состав характеристик, используемых моделями для решения задач интеллектуальной обработки визуальной информации, определяется как эвристиками, лежащими в основе этих моделей, так и конкретными реализациями моделей. Обычно эти характеристики называют признаками, извлекаемыми моделью из исходной визуальной информации. Причём эти признаки могут извлекаться из исходной информации не только в автоматическом режиме, но и в автоматизированном. В последнем случае, как правило, участие оператора требуется для инициализации процесса поиска и вычисления значений признаков.

Совокупность всех признаков, используемых моделью, образует т.н. признаковое пространство модели. Осями этого пространства являются признаки, используемые моделью, а значения этих признаков для каждой конкретной исходной информации образуют в нём точку. Таким образом, можно говорить, что на первом этапе обработки визуальной информации происходит её отображение в признаковое пространство. Это отображение иногда называют сжатием исходной визуальной информации. Такое название отражает тот факт, что Dim ^Л} при типичных значениях L=256, М=768, N= 1024 существенно больше числа признаков, используемых той, или иной моделью. Кроме того, те модели, в основе которых лежит использование локальных особенностей исходного изображения, при нахождении значений признаков обычно только эти особенности и используют, редуцируя исходную оцифровку и игнорируя с самого начала большую ее часть.

На втором этапе, на основе анализа полученных на первом этапе значений признаков, модель решает стоящую перед ней задачу интеллектуальной обработки визуальной информации. Критерий качества решения задачи определяется, как правило, на основе сравнения результатов работы модели на визуальной информации с известным a priori точным решением. Таким образом, эффективность тех, или иных реализаций на ЭВМ моделей интеллектуальной обработки визуальной информации исследователи обычно подтверждают результатами работы этих моделей на конкретных исходных фото/видеоизображениях объектов и сцен. При этом, поскольку модели содержат большое число управляющих параметров (до десяти и более), то их подбором под конкретное изображение или группу изображений исследователь может добиться вполне приемлемого качества функционирования модели при демонстрации её работоспособности. Очевидно также, что изменением параметров модели, или подбором соответствующих изображений практически всегда можно получить и неприемлемо низкое качество её функционирования. В свою очередь это означает, что при реализации на ЭВМ информационных моделей интеллектуальной обработки визуальной информации неизбежно возникает проблема определения границ применимости таких моделей как по параметрам моделей, так и по параметрам фото/видеоизображений, которые используются в качестве носителя исходной визуальной информации для этих моделей.

Таким образом, в связи с тем, что информационные модели интеллектуальной обработки визуальной информации при наличии формального описания не могут быть, как правило, сформулированы аналитически, исследование проводится феноменологически. Другими словами, поведение ЭВМ-реализаций моделей интеллектуальной обработки визуальной информации исследуется в различных внешних ситуациях, определяемых конкретными особенностями исходной визуальной информации. В этом случае полнота, смысловое содержание этих ситуаций в силу их сложности и плохой формализуемости может быть обоснована и интерпретирована только на содержательном уровне, с привлечением эмпирических данных и допущений гипотетического характера. Отметим, что выполняемая таким образом формализация внешней ситуации, необходимая для проведения исследования моделей обработки визуальной информации, может рассматриваться как эвристика, восполняющая наше незнание о свойствах исследуемой информации.

Необходимо отметить, что задача обработки визуальной информации с целью преобразования её к виду, удобному для последующего принятия решения человеком, также можно рассматривать как задачу интеллектуальной обработки визуальной информации. Примером задач такого типа, решаемого обычно в автоматизированном, интерактивном режиме, могут служить задача фильтрации помех, вносимых аппаратурой подготовки исходной информации, задача выделения объектов («подсказки») для дальнейшего анализа изображения оператором, и т.п. В первом примере типы реализованных фильтров образуют признаковые подпространства, а значения параметров фильтров, выбранных оператором - точки в соответствующем признаковом подпространстве. Во втором примере параметры алгоритмов, используемых для решения задачи «подсказки», образуют признаковое пространство, а конкретные значения этих параметров, назначаемых оператором - точки в этом пространстве. Критерием качества решения с помощью ЭВМ задач такого рода могло бы быть субъективное понятие пользы, получаемой конкретным оператором в решении стоящих перед ним задач. Однако, в силу плохой формализуемости, оно обычно не используется, а соответствующие модели просто используются аБ 18.

В дальнейшем будем различать информационные модели решения задач интеллектуальной обработки визуальной информации человеком и методы компьютерной обработки визуальной информации, преобразующие исходную визуальную информацию к виду, удобному для последующего принятия решения человеком. Во втором случае речь идет только о подготовке информации к её последующей интеллектуальной обработке человеком или информационной моделью. Поэтому такую обработку визуальной информации будем в рамках данной работы называть предобработкой, оставляя термин обработка для обозначения реализаций информационных моделей решения задач интеллектуальной обработки визуальной информации человеком. Таким образом, методы распознавания визуальных образов, анализа сцен, понимания изображений и т.п. будем относить к методам обработки визуальной информации/изображений, а алгоритмы фильтрации шума, улучшения (реставрации) изображения, выделения границ, сегментации изображения, отделения текстурных областей от бестекстурных, алгоритмы анализа текстур и т.п. - к предобработке.

Как и в случае с моделями решения задач интеллектуальной обработки визуальной информации, при решении задач предобработки возникает проблема определения качества решения задачи и области применимости используемого машинного алгоритма. Актуальность такой оценки определяется как большим разнообразием таких алгоритмов, существующих в настоящее время, так и необходимостью подбора алгоритма, являющегося в некотором смысле наилучшим для рассматриваемой задачи.

В данной работе для задач предобработки визуальной информации использован феноменологический подход к получению оценки качества работы алгоритмов предобработки.

Основой предлагаемой методологии оценки качества работы алгоритмов предобработки является сравнение результатов их работы на совокупности искусственных или естественных т.н. тестовых изображений. В этом смысле мы будем говорить о тестировании алгоритмов предобработки на наборе тестовых изображений. Эти изображения должны быть сконструированы или подобраны таким образом, чтобы, во-первых, выявлять существенные свойства тестируемых алгоритмов, и, во-вторых, допускать естественную количественную оценку выявляемых свойств. В предположении, что наиболее существенные свойства тестируемого метода проявляются при обработке типичных и «трудных» для метода ситуаций, необходимым требованием к тестовым изображениям является возможность формирования таких ситуаций с достаточной полнотой. Само же качество получаемого при этом результата предобработки может быть оценено с привлечением той или иной методики вычисления точности решения задачи.

Определение ситуаций, являющихся «трудными» для работы, и вместе с тем типичных для изучаемых методов предобработки, является содержательной задачей, относящейся к числу т.н. плохо формализуемых задач. Обычным методом решения таких задач является обращение к опыту исследователя. В этом случае искомые ситуации определяются при анализе большого количества примеров предобработки изображений различными методами. На основе результатов анализа и создается набор искусственных или естественных тестовых изображений, которые в явном виде и с некоторой полнотой моделируют трудные ситуации.

Целями настоящей работы являются:

• Разработка метода сравнительного исследование качества работы алгоритмов предобработки визуальной информации на основе тестовых изображений.

• Исследование качества работы ряда известных и хорошо зарекомендовавших себя алгоритмов предобработки по разработанной методике сравнительного исследования.

• Выработка на основе полученных результатов исследования рекомендаций по применимости исследованных методов.

Таким образом, цель работы состоит в разработке методов обеспечения высоконадёжной предобработки визуальной информации на базе исследования существующих информационных моделей такой предобработки.

История создания методов предобработки визуальной информации составляет уже более полувека. За это время было создано необозримое количество алгоритмов самого разного назначения. Многие из них весьма эффективно применяются для решения различных, как правило, узкоспециализированных задач. Однако в настоящее время нельзя говорить, что для таких задач, как реставрация изображения, выделение контура, сегментация, текстурный анализ, существует подход для их адекватного решения. Сам факт непрерывного появления все новых и новых методов и алгоритмов решения таких задач говорит об отсутствии в среде исследователей удовлетворенности качеством уже существующих разработок. Сложность стоящих задач существенно возрастает при снижении контрастности и резкости изображении, наличии искажений, как шумовых, так и геометрических. В такой ситуации целенаправленное сравнение по единой методике качества работ широко используемых алгоритмов позволило бы выявить их сильные и слабые стороны. В свою очередь, это послужило бы основой для отбора тех средств цифровой обработки изображений, которые наиболее адекватны как решаемой задаче, так и характерным особенностям обрабатываемого изображения. Это обстоятельство и определяет актуальность и практическую значимость создания такой методики для решения задач, возникающих при построении реальных систем цифровой обработки изображений.

В работе методология сравнительного исследования качества работы алгоритмов предобработки была апробирована на ряде примеров, включающих в себя исследование поведения различных программных реализаций известных методов [9-27] на задачах реставрации, выделения и уточнения границ, текстурного анализа и сегментации.

Для проведения сравнительного изучения качества работы различных реализаций методов предобработки использовалась специально разработанные программные системы PICASSO (Picture Algorithms Study SOftware) и PETRA (Performance Evaluation of Texture Recognition Algorithms).

Системы PICASSO и PETRA предоставляют возможность оценивать качество работы алгоритмов, предназначенных для решения следующих задач:

• восстановление (реставрация) изображений;

• выделение границ на изображениях;

• уточнение границ;

• разделение текстурных и бестекстурных областей на изображении; в анализ текстур;

• сегментация изображений.

Оригинальные количественные и качественные методы сравнения работы названных классов алгоритмов, реализованные в системах PICASSO и PETRA, позволяют пользователю выбрать оптимальный алгоритм для решения конкретной задачи из числа алгоритмов, реализующих различные методы предобработки, имеющихся в его распоряжении.

Основой сравнительного исследования качества работы алгоритмов предобработки являются:

• набор тестовых изображений, позволяющий адекватно (качественно) оценить результаты работы исследуемых реализаций различных методов;

• методика измерения, позволяющая оценить (количественно) результаты работы этих реализаций.

Для систем PICASSO и PETRA были созданы специальные наборы изображений, по большей части искусственных. Эти наборы тестовых, или же т.н. эталонных изображений, учитывают специфику работы исследуемых методов и являются достаточно полными с точки зрения «трудности» их обработки. Достоинством такого подхода является то, что данные наборы тестовых изображений представляют собой т.н. ground truth, то есть, изображения, для которых известны все их характеристики и производные изображения. Например, если исследуется метод выделения границ, то истинные границы тестового изображения всегда наперед известны. Поэтому, если сравнить результат работы какого-либо метода выделения границ с известными точными границами, то можно получить количественную оценку работы метода

Каждый конкретный метод предобработки изображений имеет некоторый набор параметров, влияющих на работу метода. Обычно некоторые параметры более существенны, другие - менее. Для оценки качества функционирования программной реализации каждого из методов в системах PICASSO и PETRA используются несколько параметров с ясным физическим смыслом. Эти параметры играют роль метрик различий (discrepancy measures).

Хорошо известно, что многие методы предобработки, в том числе достаточно простые, дают при их реализации вполне удовлетворительные результаты на высококонтрастных хорошо сфокусированных изображениях с низким уровнем зашумленности. Однако в реальных изображениях в различной степени могут присутствовать факторы, затрудняющих надежную работу алгоритма предобработки: пониженная контрастность, размытость, а также шумы разного типа. В работе проведено исследование влияния этих факторов на качество работы различных методов предобработки. Заметим, что низкая контрастность может быть частично компенсирована изменением (растяжением) шкалы яркости всего изображения или его отдельного фрагмента. Очевидно, что при этом пропорционально вырастет и уровень присутствующих шумов. Тем не менее, это обстоятельство дает возможность не рассматривать данный фактор отдельно, а ограничиться только исследованием эффективности работы алгоритмов предобработки при различных уровнях зашумленности и размытости.

Помимо исследования качества работы алгоритмов предобработки при различных уровнях зашумленности и размытости, для алгоритмов выделения границ - детекторов границ (edge detectors) - исследовалось качество работы данных алгоритмов при аффинных преобразованиях исходных изображений: поворотах, сжатиях/растяжениях и сдвигах. Данные исследования имеют большое практическое значения для решения задачи автоматического распознавания объектов на изображениях, поскольку местоположение, ориентация и размеры распознаваемых объектов априори не всегда известны.

Кроме того, в работе анализируется качество работы тестируемых алгоритмов предобработки с точки зрения применения разных известных метрик различий. Показано, что в некоторых случаях их применение к оценке качества работы приводит к неадекватным результатам.

Относительно сравнительного исследования реализаций тех методов предобработки, которые обычно называют сегментацией необходимо отметить, что сам термин «сегментация» то есть некоторое разбиение изображения на области, в различных работах по обработке изображений трактуется в зависимости от специфики проводимых исследований по разному. Это находит отражение в отличающихся формальных постановках задачи сегментации [см. 28-34]. В данной работе под сегментацией подразумевается разбиение исходного изображения на совокупность непересекающиеся областей, содержащих изображения некоторых объектов или их частей. Такое понятие сегментации зависит от класса объектов. Однако во многих случаях оказывается, что для изображения объекта характерно повышенное сходство между элементами одного и того же объекта по сравнению с прилежащим фоном или прилежащими другими объектами. В частности, для методов сегментации, исследуемых в данной работе, объектами считаются области, в которых наблюдается повышенная однородность их закраски. Таким образом, под задачей сегментации в настоящей работе подразумевается задача разбиения исходного изображения на вышеуказанные области, а под методами сегментации - программно реализуемые методы решения этой задачи.

В работе приведены результаты сравнительного изучения качества работы реализаций ряда известных и часто применяемых методов сегментации, относимых к т.н. энергетическим методам. В исследуемых алгоритмах сегментация изображения достигается путем решения некоторых оптимизационных задач, связанных с минимизацией одного или нескольких функционалов. Разработаны методики, которые позволяют выяснить особенности реализаций методов и определить сферу их применимости. Результаты сравнительного исследования качества работы алгоритмов сегментации отражены в виде графиков, которые дают количественное сравнение изучаемых методов.

На основе полученных результатов были выработаны рекомендации относительно применения исследуемых методов при различных сочетаниях зашумления и размытости, при этом рассмотрен вопрос о получении априорной оценки параметров искажения изображения.

Таким образом, для решения задач, поставленных в работе, была разработана методология сравнительного исследования качества работы алгоритмов цифровой обработки видеографической информации на основе тестовых изображений, выполнена группировка и отбор алгоритмов цифровой обработки информации для проведения исследования качества их работы, разработаны тестовые изображения для экспериментальной отработки методологии сравнительного исследования качества работы алгоритмов цифровой обработки информации.

Основные положения диссертационной работы докладывались и обсуждались на следующих международных конференциях: 6th World Multiconference on Systemics, Cybernetics and Informatics (SCI'2002), Orlando, Florida, USA, July 14-18, 2002r.; 8th World Multiconference on Systemics, Cybernetics and Informatics (SCI'2004), Orlando, Florida, USA, July 18-21, 2004r.; 5th WSEAS International Conference on Signal Processing, Computational Geometry and Artificial Vision, Malta, September 15-17, 2005r.; 6th WSEAS International Conference on Signal, Speech and Image Processing, Lisbon, Portugal, September 22-24, 2006 г.; 8th WSEAS International Conference on Signal, Speech and Image Processing, Santander, Cantabria, Spain, September 23-25, 2008г.; 9-ая Международная конференция «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-9-2008), Нижний Новгород, 14-20 сентября 2008г.; 13th World Multi-Conference on Systemics, Cybernetics and Informatics (WMSCI 2009), Florida, USA, July 1413, 2009г.; 10-ая Международная конференция «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ-10-2010), Санкт-Петербург, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ», 5-12 декабря 2010г.

Основными работами, опубликованными по теме диссертации в журналах, сборниках научных трудов и трудах международных являются работы [35-52], в том числе работы [35-43] в изданиях из списка ВАК.

На защиту выносится:

• Методология сравнительного исследования качества работы алгоритмов цифровой обработки информации на основе тестовых изображений.

• Состав и представительность набора тестовых изображений, используемых для проведения сравнительного тестирования алгоритмов цифровой обработки информации.

• Результаты применения метода сравнительного тестирования на основе тестовых изображений конкретных алгоритмов цифровой обработки.

Работа состоит из введения, 9 глав, заключения, списка литературы и Приложения.

Во введении приведено описание задач интеллектуальной обработки и предобработки видеографической информации, сформулированы цели работы, кратко описана методология сравнительной оценки качества работы алгоритмов, предназначенных для решения задач предобработки, а также её реализация.

В первой главе описаны используемые в работе математические модели шумов и фильтров, методы предобработки изображений, на примере которых в работе проводится сравнительная оценка качества работы алгоритмов, реализующих эти методы.

Во второй главе описаны инструментальные средства, разработанные для получения сравнительных оценок качества работы алгоритмов предобработки изображений, приведены наборы тестовых изображений, используемых для получения оценок качества работы алгоритмов, перечислены метрики, применяемые при получении этих оценок.

В третьей главе приведены результаты сравнительной оценки качества работы алгоритмов, реализующих различные методы реставрации изображений.

В четвёртой главе описаны результаты тестирования различных реализаций методов выделения границ.

Пятая глава посвящена результатам сравнительной оценки качества работы различных реализаций методов уточнения границ.

В шестой главе описаны результаты тестирования алгоритмов, реализующих различные методы текстурного анализа и сегментации.

Седьмая глава посвящена результаты исследования устойчивости работы устойчивости работы детекторов границ при аффинных преобразованиях исходных изображений.

В восьмой главе приведены результаты сравнительных оценок качества работы различных реализаций алгоритмов сегментации.

В девятой главе описан подход к получению оценки характеристик искажений изображения.

В Заключении сформулированы основные результаты и выводы, а также пути практического применения полученных результатов.

В Приложении приведены структурные схемы использованных в работе программных систем PICASSO и PETRA, хранящихся в архиве Отделе научно-технической документации НИИСИ РАН.

Заключение диссертация на тему "Разработка методологии сравнительного исследования компьютерных методов обработки изображений"

ЗАКЛЮЧЕНИЕ

В соответствии с поставленными целями, в работе был предложена методология сравнительного исследования качества работы широкого класса компьютерных методов анализа и обработки визуальной информации. В этот класс вошли методы реставрации изображений, выделения и уточнения границ объектов, анализа текстур и сегментации. Необходимость такой методологии определяется широчайшим спектром компьютерных реализаций вышеназванных методов и отсутствием единого подхода к обоснованному выбору конкретных реализаций при построении реальных компьютерных систем интеллектуальной обработки видеографической информации. Основой методологии является тестирование поведения конкретных реализаций того, или иного метода на эталонных изображениях с априорно известным истинным результатом

Предлагаемая методология сравнительного тестирования базируется на специально разработанный набор эталонных изображений, воспроизводящих с достаточной полнотой сложные для компьютерной обработки ситуации. Применение разработанной методологии опирается на использование традиционных статистических метрик. На основе этой методологии было выполнено сравнительное исследование ряда известных и широко использующихся компьютерных реализаций по широкому спектру различных подходов к созданию методов анализа и обработки визуальной информации. Таким образом, основными результатами работы является: в разработка методологии сравнительного исследования качества работы широкого класса компьютерных методов анализа и обработки визуальной информации на основе набора эталонных изображений;

• проведение в соответствии с разработанной методологией сравнительного исследования ряда широко известных и хорошо себя зарекомендовавших методов реставрации изображений, выделения и уточнения границ объектов, анализа текстур и сегментации;

• выработка рекомендаций по применимости исследованных методов компьютерной обработки визуальной информации, подкреплённых экспериментальным материалом.

Выполненные сравнительные исследования позволили сделать следующие выводы.

• При решении задачи реставрации метод, использующий кусочно-линейную функцию, проявляет нестабильность работы на зашумленных изображениях.

• Алгоритмы выделения границ Heitger и Canny обладают наилучшей чувствительностью, а алгоритмы Canny и Rothwell - наилучшей специфичностью при работе на размытых изображениях простой структуры.

• Для изображений со сложной структурой границ только алгоритмы Canny и Rothwell проявили достаточно хорошие специфичность и чувствительность на размытых изображениях.

• Все тестированные реализации методов выделения границ имеют схожую чувствительность и являются устойчивыми к белому шуму.

• Характер поведения энергетических методов выделения границ Мамфорда-Шаха, Гемана-Рейнольдса и с использованием кусочно-линейной функции при Гауссовом зашумлении для чувствительности и специфичности примерно одинаков.

• Методы уточнения границ GSNAKE и GVF ведут себя одинаково при зашумлении и размытии границ.

• Среди методов текстурного анализа ни одна из реализаций исследуемых методов не показала абсолютного превосходства над другими.

• При аффинных преобразованиях изображений все исследованные реализации различных методов детектирования границ продемонстрировали одинаковый характер поведения на тестовых изображениях.

• Выделение слабоконтрастных областей рассмотренными в работе сегментаторами позволяет выявлять особенности их реализаций.

Приведённые выше выводы вместе с результатами исследования позволяют сделать следующие рекомендации по применимости исследованных методов.

• При решении задач реставрации изображений метод Гемана-Рейнольдса предпочтителен при работе с сильным зашумлением, а метод Мамфорда-Шаха - при слабом.

• При работе на размытых изображениях как простой, так и сложной структуры для достижения наилучшей чувствительности и специфичности предпочтительно использовать алгоритм выделения границ Canny.

• Для зашумленных белым шумом изображений при одинаковой чувствительности всех тестированных алгоритмов, для достижения наилучшей чувствительности предпочтительно использовать алгоритмы выделения границ Canny и Roth well.

• Использование исследованной реализации метода выделения границ Мамфорда-Шаха при Гауссовом зашумлении нецелесообразно.

• Метод уточнения границ GVF предпочтителен при наличии больших каверн на изображении.

• Метод уточнения границ GSNAKE предпочтителен в случае, если граница изменяется плавно, а уровень шума невелик.

• Для предварительной сегментации предпочтительно использовать алгоритм плотности граничных точек.

• При отсутствии искажений сегментаторы EDISON и MULTISCALE предпочтительны при обработке изображений с углами.

• При малой контрастности при работе на изображениях с плавно изменяющейся яркостью предпочтителен сегментатор MULTISCALE.

• Сегментатор JSEG предпочтителен при работе на зашумлённых и сложных размытых изображениях.

• Сегментатор EDISON предпочтителен при работе на простых размытых изображениях.

Таким образом, выполненная работа создала проверенную на реальных и широко используемых реализациях разнообразных методов компьютерной обработки изображений методологию, позволяющую в практических разработках строить из набора имеющихся средств системы, наиболее адекватные поставленным практическим задачам. Другими словами, практическое применение разработанной методологии сравнительного исследования качества работы различных методов компьютерной обработки изображений позволяет строить автоматические и автоматизированные системы, учитывающие реальные особенности обрабатываемой видеографической информации и используемых методов, включая границы их применимости.

Библиография Кольцов, Пётр Петрович, диссертация по теме Теоретические основы информатики

1. Линдгрен Н. Органы чувств животных и их электронные аналоги // Электроника.- 1962.-т. 35, № 7.- С. 22-27.

2. Брагина Н.Н., Доброхотова Т.И. Функциональная асимметрия человека М.: Медицина, 1988 - 240 с.

3. McCulloch W.S., Pitts W. A Logical Calculus of the Ideas Immanent in Nervous Activity // Bulletin of Mathematical Biophysics 1943 - Vol. 5- Pp. 115-133.

4. Арбиб M. Метафорический мозг M.: Эдиториал УРСС, 2010 - 304с.

5. Аркадьев А.Г., Браверманн Э.М. Обучение машины распознаванию образов. М.: Наука, 1964. -110 с.

6. Журавлёв Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики. Вып. 33 М.: Наука, 1978.-С.5-68.

7. Розенблатт Ф. Принципы нейродинамики: перцептроны и теория механизмов мозга. М.: Мир, 1965- 450 с.

8. Минский М., Пейперт С. Персептроны. М.: Мир, 1971. - 262 с.

9. Mumford D., Shah J. Optimal Approximations by Piecewise Smooth Functions and Associated Variational Problems // Commun. Pure Appl. Math.-1989.- Vol. 52.- Pp. 577-685.

10. Geman D., Reynolds G. Constrained Restoration and the Recovery of Discontinuities // IEEE TP AMI.- 1992,- Vol. 14.- Pp. 376-383.

11. Veksler O. Efficient Graph-Based Energy Minimization Methods in Computer Vision // PhD Thesis, Cornell University 1999.

12. Hewer G.A., Kenney C., Manjunath B.S. Variational Image Segmentation Using Boundary Functions // IEEE Trans. Image Processing-1998.-Vol. 7, no. 9.-Pp. 1269-1282.

13. Canny J. A Computational Approach to Edge Detection // IEEE Pattern Anal.Machin. Intell.- 1986.-Vol 8, no. 16.-Pp. 679-698.

14. Heitger E, Rosenthaler L., von der Heydt R., Peterhans E., Kubler O. Simulation of Neural Contour Mechanisms: From Simple to End-Stopped Cells // Vision Research.- 1992.- no. 32,- Pp. 963-981.

15. Rothwell C.A., Mundy J.L., Hoffman W., Nguyen V.-D. Driving Vision by Topology // Int. Symp. Computer Vision.- 1995.- Pp. 395-400.

16. Black M., Sapiro G., Marimont D., Heeger D. Robust Anisotropic Diffusion // IEEE Trans. Image Process.- 1998,- Vol. 7.- no. 3.- Pp. 421^32.

17. Perona P., Malik J. J. Detecting and Localizing Edges Composed of Steps, Peaks and Roofs // Proc. 3rd Int. Conf. on Computer Vision 1990 - Pp. 52-57, 1990.

18. Iverson L.A., Zucker, S.W. Logical/Linear Operators for Image Curves // IEEE Trans. Pattern Anal. Mach. Intell.- 1999.- Vol. 17, no. 10.- Pp. 982-996.

19. Smith S.M. Flexible Filter Neighborhood Designation // Proc. 13th Int. Conf. on Pattern Recognition.- 1996.- Vol. 1.- Pp. 206-212.

20. Cohen L.D., Cohen I. Finite-Element Methods for Active Contour Models and Balloons for 2-D and 3-D Images // IEEE Trans. Pattern Analysis and Machine Intelligence-Vol. 15, no. 11-Pp. 1131-1147.

21. Xu Ch., Prince J.L. Snakes, Shapes and Gradient Vector Flow // IEEE Transactions on Image Processing .- 1998 Vol. 7, no 3- Pp. 359-369.

22. Karu K., Jain A.K., Bolle R.M. // Is There Any Texture in the Image? Pattern Recognition.- 1996.- Vol. 29, no.9.- Pp. 1437-1446.

23. Ojala T., Pietikainen M., Harwood D.A. Comparative Study of Texture Measures with Classification Based on Feature Distributions // Pattern Recognition.- 1996.-Vol. 29, no. l.-Pp. 51-59.

24. Coggins J.M., Jain A.K. A Spatial Filtering Approach to Texture Analysis // Pattern Recognition Letters.- 1985 Vol. 3, no. 3 - Pp. 195-203.

25. Haralick R., Shanmugam K., Dinstein I. Textural Features for Image Classification // IEEE Trans. Systems, Man, Cybernetics-1973- Vol. 3, no. 1 l.-Pp. 610-621.

26. Deng Y., Manjunath B.S. Unsupervised Segmentation of Color-Texture Regions in Images and Video // IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI'01).- 2001.- Vol. 23, no. 8.- Pp. 800-810.

27. Christoudias C.M., Georgescu B., Meer P. Synergism in Low Level Vision // 16th International Conference on Pattern Recognition 2002 - Vol. 4-Pp. 150-55.

28. Tat N.H., Worring M., van den Boomgaard R. Watersnakes: energy-driven watershed segmentation // IEEE Transactions on Pattern Analysis and Machine Intelligence.- 2003.- Vol. 25, no. 3.- Pp. 330-342.

29. Chan T.F., Esedoglu S. A Multiscale Algorithm for Mumford-Shah Image Segmentation // UCLA Computational and Applied Math Report 03-57-2003.-27 p.

30. Arbelaez P.A., Cohen L.D. Energy Partitions and Image Segmentation // Journal of Mathematical Imaging and Vision 2004 - Vol. 20, no. 1-2 - Pp.43-57.

31. Shi J., Malik, J. Normalized Cuts and Image Segmentation // (PAMI 22) .- 2000.- no. 8.- Pp. 888-905.

32. Meyer F., Vachier C. Image Segmentation Based On Viscous Flooding Simulation // Proc. ISMM, CSIRO.- 2002.- Pp. 69-77.

33. Martinez-Uso A., Pla F., Garcia-Sevilla P. Color Image Segmentation Using Energy Minimization on a Quadtree Representation // International Conference on Image Analysis and Recognition ICIAR'04.- 2004,- LNCS 3211-Pp. 25-32 .

34. Chan T.F., Esedoglu S., Nikolova M. Algorithms for Finding Global Minimizers of Image Segmentation and Denoising Models // SIAM Journal on Applied Mathematics.- 2005,- Vol. 66, no. 5.- Pp. 1632-1648.

35. Koltsov P.P. A Comparative Study of Image Processing Algorithms // Pattern Recognition and Image Analysis 2011- Vol. 21, No. 2.- Pp. 148-151.

36. Кольцов П.П. Использование метрик при сравнительном исследовании качества работы алгоритмов сегментации изображений // Информатика и её применения-2011-Т. 5, вып. З.-С. 51-61.

37. Кольцов П.П. Оценка качества работы алгоритмов цифровой обработки изображений // Доклады РАН 2011.- Т. 440, № З.-С. 1-3.

38. Кольцов П.П. Оценка размытия изображения // Компьютерная оптика,-2011.-Т. 35, № 1,-С. 95-102.

39. Кольцов П.П. Эмпирический подход к оценке алгоритмов выделения границ // Информационные технологии и вычислительные системы,- 2011.- № 2.- С. 50-57.

40. Кольцов П.П. Сравнительное изучение алгоритмов выделения и классификации текстур // Журнал вычислительной математики и математической физики-2011-Т. 51, № 8 С. 1561-1568.

41. Koltsov P.P. Comparative Analysis of Image Processing Algorithms // Pattern Recognition and Image Analysis 2012 - Vol. 22, No. 1- Pp. 39-43.

42. Gribkov I.V., Koltsov P.P., Kotovich N.V., Kravchenko A.A., Koutsaev A.S., Osipov A.S., Zakharov A.V. Robustness of Noisy and Blurry Images Segmentation // Pattern Recognition and Image Analysis 2009 - Vol. 19, No. 3-Pp. 484^90.

43. Gribkov I.V., Koltsov P.P., Kotovich N.V., Kravchenko A.A., Kutsaev A.S., Nikolaev V.K., Zakharov A.V. PICASSO A System for Evaluating Edge Detection Algorithms // Pattern Recognition and Image Analysis - 2003- Vol. 13, no. 4.-Pp. 617-622.

44. Gribkov I.V., Koltsov P.P., Kotovich N.V., Kravchenko A.A., Koutsaev A.S., Osipov A.S., Zakharov A.V. Comparative Study of Image Segmentation Algorithms // Proc. 8th WSEAS Int. Conf. on Signal, Speech and Image Processing.- 2008.- Pp. 21-28.

45. Gribkov I.V., Koltsov P.P., Kotovich N.V., Kravchenko A.A., Koutsaev A.S., Osipov A.S., Zakharov A.V. Empirical Evaluation of Image Processing Methods Using PICASSO 2 System // WSEAS Trans, on Systems.- 2005.- Vol. 4, No. 11.-Pp. 1923-1930.

46. Akarun L., Haddad R.A. Adaptive Decimated Median Filtering // Pattern Recognition Letters.- 1992.- Vol. 13.- Pp. 57-62.

47. Arce G.R., Fontana S.A. On the Midrange Estimator // IEEE Trans, on Acoustics, Speech and Signal Processing-1998 Vol. 36 -Pp. 920-922.

48. Bedner J.B., Watt T.L. Alpha-trimmed means and their relationships to median filters // IEEE Trans, on Acoustics, Speech and Signal Processing 1984-Vol. 32.-Pp. 145-153.

49. Blake A., Zisserman A. Visual Reconstruction.- Cambridge, USA: MIT Press, 1987.-232 p.

50. Brownrigg D.R.K. The Weighted Median Filter // Commun. ACM.-1984,- Vol. 27,-Pp. 807-818.

51. Lee J.-S. Digital Image Smoothing and the Sigma Filter // Computer Vision, Graphics and Image Processing.- 1983.- Vol. 24.- Pp. 255-269.

52. McDonnell M.J. Box-Filtering Techniques // Computer Graphics and Image Processing.- 1981,-Vol. 17,-Pp. 65-70.

53. Pratt W.K. Generalized Wiener Filtering Computation Techniques // IEEE Trans. Computers.- 1972,- Vol. C-21, no. 7,-Pp. 636-641.

54. Saint-Marc P.P., Chen J.S., Medioni G. Adaptive Smoothing: A General Tool for Early Vision // Proc. Conf. Computer Vision and Pattern Recognition.- 1989,-Pp. 618-624.

55. Scollar I., Weidner B.B., Huang T.S. Image Enhancement Using the Median and the Interquartile Distance // Computer Vision, Graphics and Image Processing.- 1984,-Vol. 25,-Pp. 236-251.

56. Witkin A.P. Scale-Space Filtering // Proc. IJCAI.- 1983,- Pp. 10191021.

57. Canny J.F. Finding Edges and Lines in Images // Master's Thesis, MIT, Cambridge, USA.- 1983.

58. Rosenthaler L., Heitger F., Kiibler O., von der Heydt R. Detection of General Edges and Keypoints // Proc. 2nd European Conf. on Computer Vision. -1992,-Pp. 78-86.

59. Perona P., Malik J. Scale-Space and Edge Detection Using Anisotropic Diffusion // IEEE Trans. Pattern Anal. Machine Intell.- 1990,- Vol. 12, no. 7,- Pp. 629-639.

60. Smith S.M. Method for Digitally Processing Images to Determine the Position of Edges and/or Corners Therein for Guidance of Unmanned Vehicle-UK Patent 2272285, proprietor: Secretary of State for Defence, UK, 1997.

61. Smith S.M. A Brief Quantitative Assessment of a Passive 3D Measurement System // RARDE Memorandum 31/90,- DRA Chertsey, Chertsey, Surrey, UK, 1990.

62. Smith. S.M. Extracting Information from Images // First year D.Phil. Report, Oxford University, UK 1990.

63. Smith S.M. Feature Based Image Sequence Understanding // D.Phil. Thesis, Oxford University, UK.- 1992.

64. Smith S.M., Brady J.M. A Scene Segmenter; Visual Tracking of Moving Vehicles // Engineering Applications of Artificial Intelligence.- 1994,- Vol. 2, no. 2,-Pp. 191-204.

65. Smith S.M., Brady J.M. SUSAN a New Approach to Low Level Image Processing // Int. Journal of Computer Vision.- 1997,- Vol. 23, no. 1.- Pp. 45-78.

66. Kass M., Witkin A., Terzopoulos D. Snakes: Active Contour Models // Int'l J. Computer Vision.- 1988,- Vol. 1, no. 4,-Pp. 321-331.

67. Grzeszczuk R.P., Levin. D.N. Segmenting Images with Stochastically Deformable Contours // IEEE Trans. Pattern Analysis and Machine Intelligence.-1997,- Vol. 19, no. 10,-Pp. 1100-1114.

68. Caselles V., Kimmel R., Sapiro G. Geodesic Active Contours // Int'l J. Computer Vision.- 1997,- Vol. 22,-Pp. 61-79.

69. Lai K.F., Chin R.T. Deformable Contours: Modelling and Extraction // IEEE Trans. Pattern Analysis and Machine Intelligence.- 1995.- Vol. 17, no 11.-Pp. 1084-1090.

70. Park J., Keller J.J.M. Snakes on the Watershed // IEEE Trans. Pattern Analysis and Machine Intelligence.- 2001,- Vol. 23, no. 10,- Pp. 1201-1205.

71. Hamarneh G., Gustavsson T. Combining Snakes and Active Shape Models for Segmenting the Human Left Ventrickle in Echocardiographic Images // IEEE Computers in Cardiology.- 2000,- Vol 21.- Pp.115-118.

72. Amini A.A., Weimouth T.E., Jain R.C. Using Dynamic Programming for Solving Variational Problems in Vision // IEEE Trans. Pattern Analysis and Machine Intelligence.- 1990,- Vol. 12, no. 9,- Pp. 855-867.

73. Dinstein I., Fong A.C., Ni L.M., Wong K.Y. Fast Discrimination Between Homogeneous and Textured Regions // Proc. of the Seventh International Conference on Pattern Recognition.- 1984,- Vol. 1,- Pp. 361-363.

74. Randen T., Husoy J.H. Filtering for Texture Classification: A Comparative Study // IEEE Transactions on Pattern Analysis and Machine Intelligence.- 1999,-Vol. 21, no. 4,-Pp. 291-310.

75. Jain A.K., Farrokhnia F. Unsupervised Texture Segmentation Using Gabor Filters // Pattern Recognition.- 1991,- Vol. 24, no. 12,- Pp. 1167-1186.

76. Malik J., Perona P. Preattentive Texture Discrimination with Early Vision Mechanisms // J. Opt. Soc. Amer.- 1990.- Vol. 7,- Pp. 923-932.

77. Laws K.I. Rapid Texture Identification // Proc. SPIE Conf. Image Processing for Missile Guidance 1980-Pp. 376-380.

78. Strand J., Taxt T. Local Frequency Features for Texture Classification // Pattern Recognition.- 1994,- Vol. 27, no. 10,- Pp. 1397-1406.

79. Mao J., Jain A.K. Texture Classification and Segmentation Using Multiresolution Simultaneous Autoregressive Models // Pattern Recognition. -1992,- Vol. 25, no. 2,- Pp. 173-188.

80. Pavlidis T. Why Progress in Machine Vision Is So Slow // Pattern Recognition Letters.- 1992,- Vol.13, no. 4,- Pp. 221-225.

81. Haralick R.M. Performance Characterization in Computer Vision // CVGIP: Image Understanding.- 1994,- Vol. 60, no. 2,- Pp. 245-249.

82. Ramesh V., Haralick R.M. Performance Characterization of Edge Detectors // SPIE Applications of Artificial Intelligence X: Machine Vision and Robotics.- 1992,- Vol. l.-Pp. 252-266.

83. Steger C. Analytical and Empirical Performance Evaluation of Subpixel Line and Edge Detection // Empirical Evaluation Techniques in Computer Vision.-Washington, D.C.: IEEE Computer Society Press, 1998.-Pp. 188-210.

84. Salotti M., Bellet F., Garbay C. Evaluation of Edge Detectors: Critics and Proposal //Proc. Workshop on Performance Characteristics of Vision Algorithms, PERF96, Cambridge, UK.- 1996.-ch. 6. http://www.vision.auc.dk/hic/perf-proc.html.

85. Abdou I.E., Pratt W.K. Quantitative Design and Evaluation of Enhancement/Thresholding Edge Detectors // Proc. IEEE.- 1979.- Vol. 67, no. 5.-Pp. 753-763.

86. Jiang X.Y., Hoover A., Jean-Baptiste G., Goldgof D., Bowyer K., Bunke H. A Methodology for Evaluating Edge Detection Techniques for Range Images // Proc. Asian Conf. Computer Vision 1995-Pp. 415-419.

87. Smith G., Bums I. Measuring Texture Classification Algorithms // Pattern Recognition Letters.- 1997,- Vol. 18, no. 14,- P. 1495-1501. http://www.cssip.uq.edu.au/meastex/meastex.html.

88. Brodatz P. Textures: A Photographic Album for Artists and Designers-NY.: Dover Publications, 1966.- 128 p.

89. Borgefors G. Hierarchical Chamfer Matching: A Parametric Edge Matching Algorithm // IEEE Trans. Pattern Analysis and Machine Intelligence.-1988,-Vol. 10, no 6,-Pp. 849-865.

90. Strasters K.C., Gerbrands J.J. Three-Dimensional Image Segmentation Using a Split, Merge and Group Approach // Pattern Recognition Letters.- 1991.-Vol. 12, no. 5,-Pp. 307-325.

91. Baddeley A.J. Errors in Binary Images and an LP Version of the HausdorffMetric// Nieuw.Arch.Wiskd.JV, Ser. 10,- 1992,-no. 3.-Pp. 157-183.

92. Peli T., Malah D. A Study on Edge Detection Algorithms // Computer Graphics and Image Processing.- 1982 Vol. 20.- Pp. 1-21.

93. Pratt W.K. Digital Image Processing.- N.Y.: John Wiley & Sons, Ltd., 2001.-738 p.

94. Mundy J.L., Zisserman A. Geometric Invariance in Computer VisionCambridge, USA: MIT Press, 1992.-512 p.

95. Olver P.J., Sapiro G., Tannenbaum A. Affine Invariant Detection: Edge Maps, Anisotropic Diffusion, and Active Contours // Acta Applicandae Mathematical- 1999,- Vol. 59,- Pp. 45-77.

96. Meer P., Gregorescu B. Edge Detection with Embedded Confidence // IEEE Trans, on Pattern Analysis and Machine Intelligence.- 2001,- Vol. 23, no. 12.-Pp. 1351-1365.

97. Heath N., Sarkar S., Sanocki T., Bowyer K.W. A Robust Visual Method for Assessing the Relative Performance of Edge-Detection Algorithms // IEEE Transactions on Pattern Analysis and Machine Intelligence.- 1997.- Vol.19, no. 12,-Pp. 1338-1359.

98. Sumengen B., Manjunath B.S. Multi-Scale Edge Detection and Image Segmentation // Proc. European Signal Processing Conference (EUSIPCO).-2005 Vol. CD. http://vision.ece.ucsb.edu/publications/05eusipcoBarisMultiscale.pdf.

99. Ma W.-Y., Manjunath B.S. EdgeFlow: A Technique for Boundary Detection and Image Segmentation // IEEE Transactions on Image Processing. -2000,-Vol. 9,-Pp. 1375-1388.

100. Ma W., Manjunath B. Edge Flow: A Framework of Boundary Detection and Image Segmentation // IEEE Int. Conf. on Computer Vision and Pattern Recognition 1997 - Pp.744-749.

101. Deng Y., Kenney C., Moore M.S., Manjunath B.S. Peer Group Filtering and Perceptual Color Image Quantization // Proc. of IEEE Intl. Symposium on Circuits and Systems.- 1999,- Vol. 4.- Pp. 21-24.

102. Gersho A., Gray R.M. Vector Quantization and Signal Compression-Boston, USA: Kluwer Academic Publishers, 1992 750 p.

103. Olsen S.I. Estimation of Noise in Images: An Evaluation // Graphical Models and Image Process.- 1993,- Vol. 55, no. 4,- Pp. 319-323.

104. Olsen S. Noise Variance Estimation in Images // 8th Scandinavian Conf. on Image Analysis.- 1993,- Pp. 25-28.

105. Rank K., Lendl M., Unbehauen R. Estimation of Imagenoise Variance // IEEE Proc. Vis. Image Signal Process.- 1999,- Vol. 146, no. 2,- Pp. 80-84.

106. Konstantinides K., Natarajan B., Yovanof G.S. Noise Estimation and Filtering Using Block-Based Singular-Value Decomposition // IEEE Trans. Image Process.- 1997,- Vol. 6, no. 3,- Pp. 479^83.

107. Luxen M., Forstner W. Characterizing Image Quality: Blind Estimation of the Point Spread Function from a Single Image. // ISPRS Commission III: Theory and Algorithms.- 2002,- Vol. 34, part 3A.- Pp. 205-210.

108. Wald L. Data Fusion, Definitions and Architectures, Fusion of Images of Different Spatial Resolutions Paris: Les Presses de l'Ecole des Mines, 2002198 p.

109. Donoho D. De-Noising by Soft-Thresholding // IEEE Transactions on Information Theory.- 1995,- Vol. 41< no. 3,- Pp. 613-627.

110. Donoho D. Nonlinear Wavelet Methods for Recovery of Signals, Densities and Spectra from Indirect and Noisy Data // Proc. Symposia Applied Mathematics.- 1993,-Vol. 47,-Pp. 173-205.

111. Portilla J., Strela V., Wainwright M.J., Simoncelli E. P. Image Denoising Using Scale Mixtures of Gaussians in the Wavelet Domain // IEEE Transactions on Image Processing.- 2003,- Vol. 12, no. 11.-Pp. 1338-1351.

112. Stefano A., White P., Collis W. Training Methods for Image Noise Level Estimation on Wavelet Components // EURASIP Journal on Applied Signal Processing.-2004,-Vol. 16,-Pp. 2400-2407.

113. Nowak R. Wavelet-Based Rician Noise Removal for Magnetic Resonance Imaging // IEEE Trans, on Image Processing.- 1999.- Vol. 8, no. 10.-Pp. 1408-1419.

114. Tomitani Т. Image Reconstruction and Noise Evaluation in Photon Time-of-Fiight Assisted Positron Emission Tomography // IEEE Trans NucASci NS-28 4582-4589, 1981

115. Elder J.H., Zucker S.W. Local Scale Control for Edge Detectionand Blur Estimation // IEEE Transactions On Pattern Analysis And Machine Intelligence.- 1998.- Vol. 20, no. 7.- Pp. 699-716.

116. Zucker S., Elder J. Scale Space Localization, Blur, and Contour-Based Image Coding // CVPR Proc.- 1996.- Pp. 27-34.

117. Лисицин E., Конушин А., Вежневец В. Отслеживание точечных особенностей в видеопоследовательностях с изменениями резкости // Труды 14-ой междунар. конф. по компьютерной графике и зрению, Москва МГУ, 2004.- С. 233-236.