автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.07, диссертация на тему:Иерархические структурные методы автоматического анализа аэрокосмических изображений

кандидата технических наук
Потапов, Алексей Сергеевич
город
Санкт-Петербург
год
2005
специальность ВАК РФ
05.11.07
Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Иерархические структурные методы автоматического анализа аэрокосмических изображений»

Автореферат диссертации по теме "Иерархические структурные методы автоматического анализа аэрокосмических изображений"



На правах рукописи

Потапов Алексей Сергеевич

ИЕРАРХИЧЕСКИЕ СТРУКТУРНЫЕ МЕТОДЫ АВТОМАТИЧЕСКОГО АНАЛИЗА АЭРОКОСМИЧЕСКИХ ИЗОБРАЖЁНИЙ

С чециальность 05.11.07 -оптические и оптико-электронные приборы и

комплексы

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

На правах рукописи

Потапов Алексей Сергеевич

иерархические структурные методы автоматического анализа аэрокосмических изображений .

Специальность 05.11.0? оптические и оптиктюлекгрони^ге приборы и

комплексы

автореферат диссертации на соискание ученой степени кандидата технических наук

Работа выполнена в ФГУП "ВНЦ Государственный Оптический Институт им.

С. И. Вавилова"

Научный руководитель:

кандида! технических наук, Малышев Игорь Александрович

Официальные оппоненты

ДОКТОР ТЕХНИЧЕСКИХ НАУК

Хорош 1С. -'

£4!5ДЛт ТЕХНИЧЕСКИХ НАУК ДОЦЕНТ. 1УБККН А- Ф-

Ведущая организация:

ОАО *Л0М0»

Защита состоится 2005 года в н часов _ минут на

заседании специализированного совета Д407.001.01 в ВНЦ "Государственный Оптический Институт им. С.И. Вавилова" по адресу: 199034, Санкт-Петербург, В.О., Биржевая линия, д. 12.

С диссертацией можно ознакомиться в библиотеке института. Автореферат разослан^ 0 ^ ^ 2005 г. Ученый секретарь

специализированного совета . . ^

доктор технических наук УутА.И.Степанов

© ФГУП "ВНЦ Государственный ОптмтЧр^^й^Ин^^^-^^им^С.М. Вавилова"

ммштец I

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблемы

Исследование Земли с использованием космических и авиационных систем наблюдения служит мощным инструментом в различных обзастяч хозяйственной и научной деятельности Возрастающие возможности бортовых оптических и радиолокационных сенсоров и увеличивающаяся пропускная способность каналов беспроводной связи приводят к постоянному росту объемов данных изображений, поступающих в наземные центры обработки В этих условиях все более актуальной становится автоматизация, по крайней мере, части операций анализа и интерпретации аэрокосмических снимков

Одной из наиболее важных из иодпежащих автоматизации операций представпяется сопоставление (отождествление идентичных элементов) двух снимков, полученных с разных ракурсов, в разное время, возможно, разными типами сенсоров (инфракрасных, видимого диапазона, радиолокационных и других), поскольку эта операция зачастую предшествует выполнению других операций анализа аэрокосмических снимков Такое сопоставление необходимо для записи снимков в единой системе координат (те для их совмещения) с целью синтеза карт больших размеров на основе локальных снимков, выявления произошедших изменений и тд В практических задачах сопоставление зачастую требуется выполнять с высокой точностью.

В отличие от большинства классических задач автоматического анализа изображений в промышленной робототехнике, медицине, криминалистике, охранных системах и т.п. аэрокосмические видеоданные характеризуются значительно большей априорной неопределенностью Эта неопределенность связана с сезонно-суточными изменениями наблюдаемых ландшафтов, отличиями изображений, сформированных различными типами видеодатчиков, и огромным многообразием подлежащих автоматическому анализу и интерпретаций сюжетов Идентичность содержания одной и той же сцены, присутствующей на разных изображениях, сохраняется независимо от условий съемки

Группой методов, позволяющих использовать содержательную идентичность изображений и преодолевать указанную априорную неопределенность при сопоставлении изображений, являются структурные методы анализа Однако существовавшие на момент начала данной работы структурные методы не позволяли достичь требуемой в практических приложениях точности и робастности сопоставления Устранение этих недостатков могло быть осуществлено с помощью проведения анализа изображений на различных уровнях (пиксельном, контурном и структурном), то есть с помощью иерархического подхода Таким образом, перспективным для решения задачи сопоставления аэрокосмических изображений являлось дальнейшее развитие иерархических структурных методов

Цель работы

Разработка мекмов высокоточною сопоставтения а1рокосмичееких изображений полненных с равных ракурсов но терженных сезонно-суточным вменениям ити содержащих разшчия, вызванные испо п,зованисм сенсоров раз шчных гигтов, разработка метотов и ш течения из изображений информации, инвариантной к во!можным изменениям ус ювий съемки

Основные задачи:

созтание иерархическою структурною представтения изображений, в котором учитываются общие топу тения о свойствах видимого мира,

вывоз критерия оптимальности описания изображения в рамках нредтожентиа представ 1ения и разрабо!ка меюдов построения структурною описания изображений п> гем оптимизации выработанного критерия,

ра(работка мето юв сомостав гения июбражений через соотнесение их иерархических структурных описаний,

разработка мето юв повышения ючности сопосгав гения и расширение во!можних типов взаимных пространственных преобразований изображений путем коррекции результатов стру кту рного сопоставления

Методы исследований

Л тя решения указанных задач в работе нриченя жсь мет очи обработки изображений, теории вероятностей и математической статистики, теории спектральной обработки снгна юв, вычистительные методы, методы машинного модечирования

Научная новизна работы

• Предложен способ иерархической зекомпозиции задачи структурною соностав тения истюзьзуюший результаты сегментации изображений и позво 1яюшии уменьшить вычис 1ите тьную с тожность задачи сопоставзения

• Разработан метод адаптивной коррекции структурных описаний к процессе их сопоставления

• Разработан механизм распространения информации о по тожении опорных ючек в \ieioie юкальной корреляции

• Имве тсны ана титические выражения л 1я фитырации пространственною спектра июбражений \ ве 1ичиваюшей отношение сит на I шум на кросскорретяционном ноте в прису ктвии взаимных теометрических искажении изображений

• Разработано иерархическое структурное нретаав 1сние изображений разтичные

\ровни которою объе тинены общей информационной петевой функцией

• Поточены форч>лы, опрею 1яюшие качество прхмурною описания, а также

выражения опре те тяющис сIеисш. с\оюва стр\ к 1} рны\ ) юментов

Практическая ценность

Автоматические чет ты и а_поритмы иерархического стр\кт\рното анализа а >рокосмически\ и ¡обращении позволяющие достигам. высокой точности совмещения и осуществлять робастное сопостав тение изображении снятых с разных раклреов, в разнос время года и с помощью сенсоров различных типов могут наити широкое применение в фотограмметрии, гистанционноч сборе данных В первую очередь это относится к таким практическим задачам, как т сокотирование, экономический и жото! ический мониториж поверхности Земли, автоматическое и «лечение изображении из баз чанных

На защиту выносятся:

1) Георетико-информатшонный подхот и методы построения иерархических структурных описаний изображений, позволяющие максимизировать количество извлекаемой из изображений информации, инвариантной к изменению условий съемки

2) Метод сопоставления аэрокосмических изображений, потученных с разных ракурсов, в разное время суток и тода, с помощью сенсоров различных типов Сопоставление выполняется иерархически на основе адаптивно корректируемых структурных описаний за время, полиномиально зависящее от количества структурных элементов

3) Метод локальной корреляции как способ достижения более высокой точности совмещения изображений и расширения класса их допустимых взаимных пространственных преобразований в задачах структурного сопоставления и совмещения изображений

4) Аналитические выражения оптимального фильтра пространственного спектра для операции фазовой корреляции, устанавливающие необходимость учета гармоник пространственного спектра с весом, обратно пропорциональным их номеру, поскольку фазы гармоник смещаются при геометрических искажениях изображения тем быстрее, чем выше номер гармоники

5) Многоэтапный способ итеративной оптимизации информационной целевой функции в

задачах построения структурных описаний изображений, включающий этап получения

приближенного решения с использованием упрощенных моделей, этап получения

решения в расширенном пространстве моделей и этап уточнения решения

-5-

Реализация результатов работы

Результаты диссертационной работы были использованы в НИР 12200-060-03 «Разработка и создание методов, алгоритмов и программ автоматического текстурного и структурного анализа изображений в задачах измерения, контроля и сопоставления изображений», проводимой по заказу Министерства науки, а также при постановке и проведении ОКР «Сатрап», выпо шяемой rio заказу M О РФ Результаты диссертационной работы были также использованы в ОКР «Сфера», проводимой в ЗАО НИИВЦ «Карат»

Акты внедрения приложены к диссертации

Апробация работы

Основные результаты работы докладывались на следующих научных форумах

• конференции "Battlespace digitization and network-centric warfare И" в рамках международного симпозиума "AeroSence-2002" (Orlando. 2002),

• конференции "Image and signal processing for remote sensing IX" в рамках международного симпозиу ма "Remote Sensing - 2003" (Barcelona, 2003);

• VII-ой международной конференции "Неразрушающие методы контроля и компьютерное моделирование в науке и технике" NDTCS-2003 (Санкт-Петербург, 2003),

• конференции "Automatic target recognition XIV" в рамках международного симпозиума "Defense and Security - 2004" (Orlando, 2004);

• VI11-ой международной конференции "Неразрушаюшие методы контроля и компьютерное моделирование в на) ке и технике", NDTCS-2004 (С -Петербург, 2004),

• VII 1-ой общероссийской научной конференции "Современная тогика проблемы теории, истории и применения в науке" (Санкт-Петербург, 2004),

• конференции "Automatic target recognition XV" в рачках между нарочного симпозиума "Defense and Security - 2005" (Orlando, 2005)

Публикации

По материалам дисссршции он\ б i и ковано 10 печашых рабог, список которых приведен в конце авюреферата

Структура и объем диссертации

Диссертация состоит из введения, пяти гтав, заключения, двух приложений и списка цитируемой читературы Она содержит 158 страниц машинописного текста, 38 рисунков и 2 табтицы Список цитируемой iитсрату ры содержит 129 наименований

КРАТКОЕ ( ОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуатытоси, темы тиссертании, форму тиру кися нети научная шчшим и практическая значимость работы нривоипся по южения. выносимые на 1анш1>. а также кр.ико in laracicfl со тержание раз те юв шесерыиии

В первой т.таве mcccp г аии к крине юн об top еуществх тощих способов мрс то л men и я изображений и за 1ача\ и\ автоматическою ана тиза а также \нашим ченны сопостав юиия и юбражснии ба зир\ юитиеся на каж том из упомянутых пре (став ichhü Об юр выношен в не 1я\ ана шза раз шчных способов пре тставтения изображении на нречмег и\ применимости в «паче автоматическою соностав юния азрокосчических снимков 'У\а мыча характеризуется необхо тимоыыо сопоставления изображений, по тученных при существенно раз шчных устовиях съемки с равною ракурса. в равное время суток и юта. с исно п.!ованием сенсоров рапичных типов В связи с >тим возникает проб тема выбора способа нре к i an темня шображений. iioíbo |яюше10 строить их описания, инвариантные \с ювияч съемки

В не 1ях решения пни проб темы проапа птшрованы данные, имеющиеся в штерат>р1н,1х источниках посвященные вопросам автоматическою анализ изображении )ю но то ти то выявить е те тмоитне типы пре тстав тений

• низкоуровневые нре тстав 1ения. иснотьзуюптие в качестве базовых ~> теменюв пиксети соответствующими им значениями иигеисивностей.

• промежуточные симво н.пые пре тстав юння. вк ночлюшис контурные преастав 1ения и пре тстав 1епия с помощью раз птчных с i рх кту pnl.ix и ти [еомегрических т icmchiob.

• пре 1сгав юния основанные на знаниях. в рамках которых производится семантическая итперпрегатшя сцены с назначением труппам ттиксетей на июбражении меток, обозначающих фи5ические объекты

Проветснный анатиз показат, что низкоуровневые мето ты сопоставления окатываются исжиючно устойчивыми при сопостав юиии изображений порченных и ратные се юны и ти мри испо тьзовании сенсоров рапичных типов Контурные пре тстав тения у тобпы в испо тьзовании. кот ia неопрететенносп, во взаимном пространственном преобраювании изображений мата, но тпохо применимы при ботыной неопрече тентюсти параметров преобразования, что имеет место в стучае азрокосмичееких шображений Мето ты. основанные на знаниях, могут быть наибо тес робастмымн но они применимы итшт, в узких предметных об тетях, а процесс приобретения знаний явтяетея крайне ресурсоемким Н связи с >тим ынные меготы не потхотят и 1и яв (ятотся не юстаточными 1 тя решения постав теттной задачи

Использование контурных структурных элементов в целях сопоставления аэрокосмических изображений (в особенности, снимков антропогенной местности) представляется наиболее целесообразным При этом, однако, структурные методы сопоставления оказываются недостаточно точными

Иерархические представления изображений используются, в основном, для уменьшения требуемых вычислительных ресурсов и широко распространены в методах сопоставления изображений Иерархичность по уровням абстракции позволяет соединить робастность структурных методов и точность низкоуровневых методов, однако, на данный момент она недостаточно исследована

В первой главе из приведенного обзора сделаны выводы о необходимости привлечения иерархических структурных представлений На момент начала работы существовало достаточно мало таких представпсний, и преимущественно они не разрабатывались в целях достижения инвариантности по отношению к возможным изменениям условий съемки аэрокосмических изображений Таким образом, сделан вывод о необходимости разработки иерархического структурною представления, на базе которого далее следует создать метод сопоставления

Во второй главе автором решается проблема построения иерархического Сфуктурного представления изображений, инвариантного условиям съемки В разрабатываемом подходе к решению проблемы не прои (водится попытка описания класса преобразований над изображениями, которые имеют место при изменениях условий съемки, и вывода инвариантов для них Вместо )того строятся методы восстановления информации о пространственной организации сцены Для этого полагается, что сцена состоит из совокупности видимых поверхностей, каждая из которых обладает картой отражательной способности отличной от карт других поверхностей, причем поверхности разделены резкими границами Далее потагается, что каждая карта отражательной способности может быть описана некоторой функцией, состоящей из регулярной и случайной компонент

Тогда для выполнения первого шага по восстановлению пространственной организации сцены, инвариантной условиям съемки, оказывается необходимым выявить такие области на изображении и описать их такими случайными функциями, которые бы соответствовали видимым поверхностям с их картами отражательных способностей Стожность угой задачи заключается в том, что неизвестными являются как сами области, так и функции, описывающие их содержание При этом число обпастей и количество параметров рсгу гярных компонент функций может быть произвольным Точность (или правдоподобие), с которой совокупность функций, заданных на областях изображения, описывает интенсивности точек изображения, будет тем выше, чем больше взято областей и чем с

большим количеством параметров выбраны функции (при фиксированном семействе функций)

Разрешение подобных трудностей достижимо в рамках теоретико-информационного подхода, в котором выводится принцип минимальной длины описания (МДО) Этот принцип устанавливает, чго чучшая молен», построенная по некоторым данным наблюдения, является компромиссом меж 1\ точностью, с которой модепь описывает данные, и ее сложностью При этом, как точность модели, так и ее сложность в информационном подходе выражаются через количество информации

В задаче разделения изображения на области точность модели может быть оценена через сумму энгропий невязок, с которыми найденные функции описывают интенсивности пикселей, составляющих области июбражения, умноженных на соответствующее число пикселей в каждой области Это соответствует оценке спи)> длины закодированною методом Хаффмана сообщения, в котором бы передавалась информация о невязках С южность чотепи определяется как минимальная длина сообщения, содержащего информацию о нотожении и форме областей на изображении, параметрах функций, описывающих содержание областей, и информацию о табтнца.х перекодировки для сообщения, описывающего невязки В результате автором строится целевая функция для оценки качества разделения изображения на области

Далее во второй главе разрабатывается алгоритм оптимизации этой целевой функции Поскотьку перебор всех возможных вариантов разбиения изображения на области с пос 1едующим их сравнением на основе целевой функции является крайне ресурсоемким, претлагастся алюритм итеративного уменьшения длины описания В качестве начального прибтижения берется разбиение иктбражения на прямоутчьники малых размеров Далее осуществляется последовательное объединение соседних областей на основе критерия минимальной .пины описания В результате формируются обпасти произвольной формы Для каждой новой области, полученной в процессе объединения, строится регрессионная чодечь, описывающая содержание этой области Ког ш не остается двух областей, объединение коюрых приводит к уменьшению длины описания, выполняется переход к следующему шагу итеративного процесса Этот шаг зактючается в последовате 1ьном перемещении отдетьных пикселей, находящихся на 1раницах областей, между областями, ее !и >го приво 1ит к уменьшению длины описания Подобный итеративный оптимизационный процесс помимо ктассическою с жяния областей также содержит несколько юнотните п.ных ламов. что приводит к ботее робастночу вьпелению границ се| ментов, чем в тру I их су шествующих методах се| ментации изображений

I ранипы 11 ol i роен н ы \ обтастсй. et ти они cooi hlmli ву ioi ipainmaM ви тичых поверхностей hd 1янчся инвариан i iimmii по отношению к ус ювиям ti.емки > i и ipaiinui.i ip.iK i\ mi lh как кон i\ pi.i и i в ic'ieiiHi.ie m и зображения О шако н \ t ювиях неонре ie iciiiiol i и в ракчрее сьсмки, имеющей Metí о в ja 1ача\ coiiol i ав 1ения а фокосчических и ioópj/кснни i 1я зффек i иBiioi о uliю 1Ыоиания кон iу ров требу ется выно шение их t тру к iy pnoi о описания )га задача 1акже решается авюроч во вюрой i 1аве 'S

Ис\о |я и) ире ню юления чю ipaiHiin.i ви шмы\ поверхностей почт всю |\ i ia ikii npoó 1ема посфоения кошурных 11 р\ к i s рныч iicmciiiob ipaKiyeiCH как проб |сча раз имения контура на им моим каж тыи т котрых описываемся фра! четом некоюрои кривом В качестве таких фрашенюв кривых (алфавита ырукзурных нечетов) берхтся отрезки прямых i и п и й. [> г и окрхжноети и фра1чешы произвольных кривых шорою норя тка, что связано с их инвариантностью но от ношению к ipyniie аффинных преобразований, яв 1яющихся характерными при смене рак\рса съемки а>рокосмических изображений Каждый ырчкгурныи немент характеризуемся ря юм парамечров Обшими параметрами т 1я всех типов с1р_\к1_\рных iicmciiiob яв|яю!ся коор шпаты центра, moi ориентации и размеры

Построение смрукпрных нечешов на основе копиров оказываемся полным ана ююм ¡азами раззечения изображения на об мсти за hlk ночснисм rao факта чю первая за мча яв тяется о шомернои, а вюрая in> черной Ви i цервой функции и аноритм et оптимизации похожи л 1Я обеих за ыч полому во шорой i laue по тробною их описания 11я задачи построения структурных нементов не нривоштся Ьыюдаря not i роению см poi oí о критерия качеыва структурною описания контура в paóoic у тается корректно решить пробзечу выбора чиеза и типов структурных нечетов описывающих танныи кошур ')ю привозит к более робастныч nponeiypaM построения струкмурных нечешов. чем tpyme существующие методы, как правизо, опирающиеся на раз тичные эвристики

В резутьтате гтоспедовате 1Ытой работы алгоритма разле |ения изображения на об мсти и алюритча описания границ об таыеи как совокупности cei ментов смрошся cipyKiypnoe о!тисанис изображения )ти описания оказываются инвариантными но опюшению к ус ювиям съемки Па рис 1 приведен пример двух описаний изображений потучемных в разные сезоны Изображения обзадают существенными различиями, мно!ие зетали присутствующие на втором изображении, отсутствуют на нервом изображении, что крайне оезожняет о тинаковое раздезение изображений на обзасми 1ем не менее, ря i обласмей. а также структурных элементов, поем роенных на основе их границ совпа iaei

- К)

Рис 1 Резу тыаты структурною описания азрокосчических изображении, по пчснных в разные сезоны а) и б) исходные изображения, в) и I) и\структурные описания, () и с) - примеры 1вух пар обтастей, совпадающих на изображениях и имеющих структурные описания [ранип, на основе коюрых выполняется робастное сопоставтения

В третьей главе автором решается задача построения робастного метода сопостав 1сния (отождеств 1ения итентичных э тементов) аэрокосмических изображений, потученных с разных ракчреов, возможно, в разное время гота иди с испотьзованием сенсоров раз 1ичш.1х 1ипов При лом потатается. что пространственное преобразование сопосчав 1яемых изображений до 1жно восстанавтиваться в явном виде То есть пробтема сопостав тения, тпи нахож гения соответствующих глементов на двух изображениях, решается совместно с проб темой совмещения, или нахождения взаимною пространственною преобразования изображений

При таком по ixoio пыле 1яюгся три компоненты метода сопоставления

• тип сопосчав тяемых лечентов изображений,

• к тасс тогтусгимых пространственных преобразований,

- II -

• стратегия поиска, сосюящая ш целевой функции, определяющей качество решения, и оптимизационного алюритма Далее рассматривался выбор первых двух компонент и разработка третьей компоненты

Тип сопоставляемых цементов изображений

Разрабашваечый мето i сопОсгав юния июбражений опирается на иерархическое структурное предегавтение, предложенное во второй i таве Многоуровневый подход подразумевает выполнение робастною анализа с испо п.зованием верхних уровней представления и последовательное \ ючнение ею рему 1ьгатов на нижних уровнях Задача структурного сопоставления также раз ie icna на две подзадачи получение робастною сопоставления изображений на основе контурных структурных элементов и ею у гочнение на пиксельном уровне В третьей главе рсшае1ся первая подзадача, в то время как в четвертой главе разрабатывав!ся метод локальной коррекции :ия решения второй подзадачи. Итак, задача сопоставления двух изображений рассматривается как задача поиска соответствия между их структурными элементами

Тип взаи много пространственного преобразования

Пространственные преобразования аэрокосмических изображений в общем случае относятся к проективным преобразованиям, возможно, дополненным локальными смещениями, вызванными тем, что ландшафт снимков не является плоским Сильные проективные искажения характерны лишь изображений, полученных с помощью авиационных систем наблюдения, имеющих низкую высоту и производящих съемку местности под большим умом Для изображений, полученных со спутниковых систем, взаимное проективное преобразование вырождае1СЯ в аффинное преобразование Ото преобразование и выбирается для исполыования в разрабатываемом автором методе структурного сопоставления Возможные отклонения от аффинной модели полагаются не слишком большими и вызывакн неточности сопоставления, которые должны компенсироваться на пиксельном уровне меюдом, разрабатываемым в четвертой главе Стратегия поиска

Поиск лучшего сопоставления изображений автор предлагает осуществлять путем

перебора различных способов установления соответствия между структурными элечетами

двух изображений Под гипотезой сопоставления понимается указание для каждою

структурного элемента первого изображения предположительно соответствующего ечу

элемента второго изображения либо указание отсутствия такого соответствия Под

частичной гиполезой понимается указание соответствий для некоторых элементов, а лля

остальных элементов соответствие счи гается неопределенным

12

Для каждой гипотезы сопоставления, которая определяет соответствия между не менее чем тремя парами структурных элементов, может быть рассчитано аффинное преобразование, с наименьшей ошибкой отображающие центры структурных элементов с одного изображения на другое Таким образом, после выбора некоторой гипотезы сопоставления может быть определено соответствующее ей пространственное преобразование Структурные элементы одного изображения отображаются этим преобразованием на второе изображение, после чего параметры поставленных в соответствие структурных эчементов могут быть сравнены для того, чтобы определить качество сопоставления Помимо расстояния между центрами структурных элементов в формировании критерия качества участвуют различия в длинах этементов и их ориентации-

£>= N -н'„ЛО-У1-{Х4-И^А1, (1)

где N - котичество структурных этементов, для которых установлены соответствия, ДО -суммарная ошибка в положении, ДА - суммарная ошибка в азимуте ориентации, А/- -суммарная ошибка в длине элементов, »(|,и - веса, с которыми учитываются

различные ошибки Значение критерия (1) пропорционально числу сопоставленных элементов, но добавление произвольного сопоставления в гипотезу приводит к увеличению ошибок, которые могут перевесить выигрыш от увеличения количества сопоставленных элементов. Таким образом, ищется компромисс между числом сопоставленных элементов и ошибками этого сопоставления, определяющимися тем, насколько хорошо соответствуют друг другу сопоставленные пары структурных элементов.

После введения критерия качества гипотез!.! сопоставления автором разрабатывается алюритм поиска лучшей гипотезы с точки зрения оптимизации этого критерия Поскольку перебор всех возможных гипотез сопоставления является КР-полной задачей, разрабатываемый алгоритм включает ряд эвристик поиска, позволяющих получать приближенное решение за полиномиальное время

Первой эвристикой является установление ограничений на возможность сопоставления некоторых структурных элементов друг с другом и отсечение неперспективных гипотез сопоставления Запрещаются сопоставления разнотипных элементов, а также элементов с большими отличиями в длине. Отсечение неперспективных типотез осуществляется на основе анализа частичных гипотез сопоставления Для каждой частичной гипотезы, включающей не менее трех соответствий, может быть определено значение критерия качества Если добавление некоторого соответствия приводит к заметному ухудшению значения критерия качества, то такое расширение частичной т ипотезы не рассматривается

В юрой нзриыикой яв |яется использование иерархической icmimiiouihhh ы мчи согюстав тения которая выполняется следующим образом Все структурные мечсчпы на каждом и» ивозражений разбиваются на группы по их припал jcahocth обмстям на изображении, поименным в хоте сегментации Далее рассматриваются го гько пшотезы, включающие уемнов генные с001ве1ствия между структурными пометами припал ¡ежащими кпько какой-то паре ipyiin. а не цс гмм и ¡обряжениям Структурное соггоставление каждой группы первого изображения и каждой группы второго изображения выпо пгяется независимо Далее группы рассматриваются как структурные мементы следующего уровня, и для них выполняется сопоставление

Помимо выно гнепия сопоставления на более высоком уровне групп структурных элементов, сопоставление также осуществляется и на более низком, контурном, уровне, что позволяет более точно оценивать сходство сопоставленных элементов Для этого i гя каждой гипотезы соггосмв 1сния производится отображение участков конгуров. на основе которых были получены структурные пементы, на второе изображение и сравнение этих контуров с контурами, яв1яющимися основой структурных пеменлов второго изображения В резу 1ьтате осу шест втяется согласование участков сопоставленных контуров, что приводит к изменению границ структурных печенior, разбиению или слиянию сегментов контура, сопровождающихся созданием новых и ги удалением старых этеченгов Таким образом, осуществляется адаптивная (зависящая ог текущей гипотезы сопоставления) коррекция структурных описаний, что приводит к бо гее точной опенке качества сопоставления

Для уменьшения ошибок сопоставления также выполняется адаптивная коррекция групп структурных элементов Для каждой рассматриваемой гипотезы сопоставления лвух групп определяется область, которую занимает группа первого изображения после отображения на второе изображение, и вторая гру ппа допо шяется элеменлачи, попавшими в эту область После этого текущая гипотеза сопостав |ения рассматривается как частичная гипотеза, которая может быть дополнена соответствиями, установленными т 1я вновь включенных элементов

В итоге автором формулируется алторитм иерархического структурного сопоставления с использованием обратных связей между уровнями

Затем в третьей главе приводятся результаты экспериментальной проверки разработанного алгоритма, воплощенного в виле компьютерной программы Экспериментальная проверка осуществляется на выборке из 320 пар а>рокосчичсских изображений, покрывающей различные типы изменчивости и 1ипы честности В час г nocí и выборка включала пар ь: изображений, поп ученных в разное время года, с испо н.зованисм сенсоров разтичных типов (видичого и инфракрасною зиапазонов. ратиоюкационных). а

- 14

также пары, в которых одно из изображений явчяется цифровой каргой высот или картой местности (см рис 2 и 3) Сопоставление считалось правильным, если идентичные злементы двух изображений совмещались на ею основе с ошибкой, меньшей, чем 10% от размера изображений Идентичные элементы изображений и величина ошибки совмещения в ходе экспериментальной проверки устанавливались человеком-экспертом

Поскольку вероятность правильного сопоставления непосредственно зависит от состава тестовой выборки, вероятность правильного сопоставления структурным методом сравнивается с вероятностью правильного сопоставления методом Фурье-Меллина на той же выборке изображений Резу льтаты сравнения приведены в таблице 1. Эти результаты показывают высокую робастность разработанного метода структурного сопоставления

Таблица 1. Сравнительное тестирование разработанного метода структурного

сопоставления и метода Фурье-Меллина на одной выборке изображений.

Вероятность правильного сопоставления

Сопоставляемые изображения Метод структурного сопоставления Метод Фурье-Меллина

Пара оптических изображений 96% 28%

Изображения, полученные сенсорами разных типов 62% 8%

Все изображения 84% 21%

Далее оценивается сложность алгоритма и экспериментально доказывается, что она является полиномиальной относительно числа структурных элементов на изображении

Рис 2 Результат совмещения изображений, представленных на рис 1, после структурного сопоставления Поскольку площадь перекрытия изображений значительна, совмещенные изображения прелставлены в виде мозаики

На основе резу 1ыатов тестирования обосновывается робастность метода сопоставления и инвариантность разработан нот о во второй главе иерархическою структурною представления усювиям съемки Возможность робастного сопоставления изображений неизвестною априори гипа местности, полученных в разное время года или с

помощью сенсоров различных типов, показывает преимущество разработанною метода перед дру! ими существующими методами сопоставления аэрокосмических изображений

В четвертой главе автором решается проблема получения точного совмещения аэрокосмических изображений на основе резупьтатов структурного сопоставления путем их улучшения на пиксельном уровне В качестве допустимого пространственного преобразования изображений рассматривается проективное преобразование, дополненное полем локальных сдвигов Выпознение такого улучшения необходимо, так как при структурном сопоставлении использовалась аффинная модель пространственного преобразования Кроме расширения класса допустимых глобальных пространственных преобразований, необходима также дополнительная локальная коррекция результатов совмещения для компенсации возможных аберраций оптики, взаимных смещений между точками изображений, вызванных холмистостью местности и т д

Возможные сезонно-су точные различия между изображениями вызывают, в частности, локальную смену знака контраста, что делает глобальные корреляционные методы неприменимыми Построение проективных инвариантов затруднительно, а возможное присутствие поля локальных смещений, выражающихся в непараметрической форме, делает построение инвариантов и вовсе невозможным, равно как и поиск в пространстве пространственных преобразований

В связи с >тим, в разрабатываемом в четвертой i шве метоле определяются не параметры пространственного преобразования, а положение опорных точек, из коюрого уже и ¡в текаекя информация о преобразовании

Опредеюние положения опорных точек осуществляется через сравнение локальных фрагментов Поско тьку изображения являются предварительно совмещенными, то фрагмент, взя1ый вокрут некоторой точки одного изображения, будет примерно соответствовать фра! менту, взятому вокруг точки с теми же координатами другого изображения Далее смещения между этими фрагментами могут быть уточнены корреляционно Для этого применяется фазовая корреляция Поиск максимума молу ля кросскорреляционного поля позволяет опреде 1ять с гвиги между фрагментами, яркости которых преобразованы линейно ipyi относительно ipyia, что включает лакже и возможную локальную инверсию знака кон траста

После установления возможности определения точного соответствия между точками изображений в четвертой главе автором разрабатывается алгоритм локальной корреляции, позволяющий формировать новые опорные точки, равномерно покрывающие изображения

)то! алгоритм включает использование нескольких тополнительных приемов, позволяющих повысить его точность и робасгность Среди них можно назвать

• экстраполяцию измеренных положений опорных точек на новые точки,

• использование подхода с переменным разрешением для больших изображений,

• выпо шепие нескотьких итераций алгоритма, на каждой из .которых у ту читается решение, по (ученное па предыдущей итерации,

• фи 1Ы рацию пространственных спектров сопоставимых фрагментов, летающую фазовую корреляцию менее чувствительной к некомпенсированным геометрических искажениям изображений (аналитические выражения для фильтра выводятся в приложении Ь)

В совокупности эти приемы наделяют метод локальной корреляции следующими преимуществами по сравнению с другими существующими методами сопоставления азрокосмических изображений менее строгими oiраничениями на тин пространственного преобразования, возможностью совмещения изображений, полученных в разные сезоны или

I

с помощью сенсоров различных типов, высокой точностью совмещения Общая схема а поритча привезена на рис 5

Далее ос\ птеств тяется экспериментальная проверка метода токальной корре 1япии, которая уетанав швасч возможность кочпснсиронль >тич чеюдом ошибки сопоставления струмчрпото метота, доститающие 10% размера изображения Доститасмая точность

совмещения зависит от типов изображений В среднем характерные ошибки совмещения не превышают двух пикселей

Рис. 5. Схема алгоритма локальной корреляции К - номер текущей итерации, Ы„„ -общее число итераций

Достижение такой точности методом локальной корреляции совместно с робастностью метода структурного сопоставления делают объединение этих методов мощным инструментом для решения ряда практических задач анализа изображений Далее в четвертой главе кратко описываются те практические приложения, при решении которых эти методы были использованы

Синтез панорамных снимков

Разработанные методы были применены для автоматического синтеза панорамных снимков, что является распространенным приложением методов сопоставления, требующим высокой точности совмещения

Восстание /енне информации, утраченной к ютененпыг и югороженныг оГпастнх июбпажений

При формировании дву мерных аэрокосмических снимков может происходить потеря информации вследствие затенения и закрывания высокими объектами участков честности, находящимися за ними Восстановление утраченной информации может быть выполнено на основе ючно совмещенных снимков одного ландшафм, но ¡ученных с разных ракурсов (см рис~6) Совмещение выпо шя юсь разраболанными методами сопоставления

л) 5) в)

Рис 6 а) и б) - совмещенные разработанными методами радиолокационные изображения, снятые с разных ракурсов и содержащие затененные области, в) -резу 1ыат слияния двух изображений с устранением затененных участков Все изображения уменьшены в 4 раза

Выявтение изменений

Залача выявления изменений, произошедших на ландшафте, по его снимкам, полученным в разное время, является ключевой для экономического и экологического мониюриша Земли из космоса, например, в целях определения ущерба от стихийных бедствий или для обнаружения случаев несанкционированного строительства или вырубки леса Необходимой основой для корректною выявления изменений является высокоточное совмещение изображений Разработанные методы сопоставления были успешно применены в задаче выявления изменений.

Геокодирование

Геокодирование заключается в привязке элементов изображения к географическим координатам точек местности, запечатленной на изображении Точки привязки находятся посредством построения структурных описаний изображений Разработанные методы сопоставления изображений применены для переноса результатов привязки с одного изображения на другое изображение той же местности При этом изображения могут быть получены с помощью сенсоров различных типов

V Выведенные аналитические выражения для шумов кросскорреляционного поля, возникающих в результате взаимных геометрических искажений фрагментов изображений, применены для построения фильтра пространственных частот в методе локальной корреляции, что позволило повысить допустимые исходные ошибки по масштабу с 2%-5% до 10%-15% VI Разработанные методы применены в задачах геокодирования, синтеза панорамных снимков, извлечения изображений из баз данных, выявления изменений в целях экологического и экономического мониторинга и др.

Основные результаты диссертации опубликованы в следующих работах:

1. Lutsiv V R, Malyshev I А , Pepelka V, Potapov A.S Target independent algorithms for description and structural matching of aerospace photographs // Proc SPIE, 2002, Vol. 4741, pp. 351-362.

2. Lutsiv V , Malyshev I, Potapov A Hierarchical structural matching algorithms for registration of aerospace images //Proc SPIE, 2003, Vol. 5238, pp. 164-175

3. Potapov AS, Lutsiv VR Information-theoretic approach to image description and interpretation // Proc SPIE, 2003, Vol. 5400, pp 277-283

4. Погапов А С , Мазышев И A , Луцив В Р Совмещение афокосчичсских изображений с субпиксельной точностью методом локальной корреляции // Оптический журнал, 2004, т. 71, №5, с. 31-36.

5. Потапов АС В шяние взаичных геометрических искажений изображений на возможность их пространственного совмещения методом локальной корреляции // Оптический журнал, 2004, т. 71, № 8, с 74-80

6 Potapov A S Image matching with the use ot the minimum description length approach // Proc SPIF.2004, Vol. 5426. pp 164-175

7. Potapov AS. Camayunova OS Information criterion for constructing the hierarchical structural representations of images /' Proc SPIE, 2005, Vol. 5807, pp 443-454

8. Lutsiv V, Potapov A, No\ikova 1 . 1 apma N Hierarchical 3D structural matching in the aerospace photographs and indoor scenes'/Proc SPIE, 2005, Vol 5807, pp 455-466

9 AS Potapov VR lucn, I A Malyshev Sub-pixel precise image analysis in the industrial environment ' Proc SPIE 2004, Vol. 5831, pp 199-203

ЮПомпов AC Принцип минима 1ыюй длины описания и сравнение 1ипотез / Современная Ю1ика проб 1ечы теории, истории и применения в науке Материалы VIII Общероссийской нау чнои конференции, С анкл-Петербу pt, 2004, с 409-412

ь

146998

РНБ Русский фонд

2006-4 19587

Оглавление автор диссертации — кандидата технических наук Потапов, Алексей Сергеевич

Оглавление.

Введение.

Глава 1. Обзор современного состояния проблем интерпретации в автоматическом анализе изображений.

1.1. Введение.

1.2. Представления изображений в виде необработанных данных.

1.3. Низкоуровневые представления.

1.3.1. Функциональные модели.

1.3.2. Вероятностные модели.

1.3.3. Сопоставления изображений на пиксельном уровне.

1.4. Средний уровень: структурные методы.

1.4.1. Контурные представления изображений.

1.4.2. Непроизводные структурные элементы.

1.4.3. Составные структурные элементы.

1.4.4. Сопоставление символьных описаний.

1.5. Верхний уровень: методы, основанные на знаниях.

1.6. Иерархические представления изображений.

Выводы из первой главы.

Глава 2. Разработка методов автоматического построения иерархических структурных описаний изображений.

2.1. Введение.

2.2. Критерий сравнения гипотез в индуктивном выводе.

2.2.1. Байесовский вывод.

2.2.2. Принцип минимальной длины описания.

2.2.3. Интерпретация изображений как минимизация длины описания.

2.2.4. Выводы.

2.3. Модели общих типов.

2.3.1. Регрессионные модели.

2.3.2. Модели, использующиеся в задачах распознавание и группирование.

2.3.3. Модели сегментация.

2.3.4. Выводы.

2.4. Формирование пространства моделей изображений.

2.4.1. Предположения Д. Марра.

2.4.2. Сведение предположений Д. Марра к моделям общих классов.

2.4.3. Выводы.

2.5. Сегментация изображений как переход к контурным представлениям.

2.5.1. Построение целевой функции.

2.5.2. Алгоритм сегментации.

2.5.3. Расширение класса регрессионных моделей в алгоритме сегментации.

2.5.4. Выводы.

2.6. Построение структурных элементов на основе контуров.

2.6.1. Выбор представления контуров.

2.6.2. Алгоритм сегментации контуров.

2.6.3. Выводы.

2.7. Верхний структурный уровень.

2.7.1. Подходы к объединению структурных элементов.

2.7.2. Группирование элементов по их подобию и регулярности расположения.

2.7.3. Формирование составных структурных элементов.

2.7.4. Выводы.

Выводы из второй главы.

Глава 3. Автоматическое структурное сопоставление изображений в условиях их сезонно-суточного и спектрального несоответствия.

3.1. Компоненты методов сопоставления изображений.

3.2. Определение пространства поиска.

3.2.1. Выбор характерных признаков изображений для сопоставления.

3.2.2. Выбор класса взаимных пространственных преобразований.

3.2.3. Выводы.

3.3. Стратегия поиска оптимального сопоставления.

3.3.1. Критерий качества сопоставления.

3.3.2. Многоуровневый алгоритм поиска оптимального сопоставления.

3.3.3. Выводы.

3.4. Экспериментальная проверка метода сопоставления изображений.

3.4.1. Сопоставление изображений, полученных в разное время года и при использовании сенсоров различных типов.

3.4.2. Робастность алгоритма структурного сопоставления.

3.4.3. Временные характеристики алгоритма сопоставления.

3.4.4. Выводы.

Выводы из третьей главы.

Глава 4. Метод локальной корреляции для совмещения изображений с высокой точностью.

4.1. Введение.

4.2. Метод локальной корреляции.

4.2.1. Установление соответствия между опорными точками.

4.2.2. Алгоритм локальной корреляции.

4.2.3. Выводы.

4.3. Экспериментальная проверка метода локальной корреляции.

4.3.1. Исправление ошибок структурного сопоставления и расширение класса допустимых взаимных пространственных преобразований изображений.

4.3.2. Устойчивость и точность алгоритма локальной корреляции.

4.3.3. Выводы.

4.4. Практическое применение.

4.4.1. Введение.

4.4.2. Синтез панорамных снимков.

4.4.3. Восстановление информации в загороженных областях изображений.

4.4.4. Выявление изменений.

4.4.5. Геокодирование.

4.4.6. Автоматическое извлечение изображений из баз данных.

4.4.7. Распознавание отпечатков пальцев.

4.4.8. Выводы.

Выводы из четвертой главы.

Введение 2005 год, диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам, Потапов, Алексей Сергеевич

Актуальность проблемы

Исследование Земли с использованием космических и авиационных систем наблюдения служит мощным инструментом в различных областях хозяйственной и научной деятельности. Возрастающие возможности бортовых оптических и радиолокационных сенсоров и увеличивающаяся пропускная способность каналов беспроводной связи приводят к постоянному росту объемов данных изображений, поступающих в наземные центры обработки. В этих условиях все более актуальной становится автоматизация, по крайней мере, части тех операций анализа и интерпретации аэрокосмических снимков, которые по сей день выполняются квалифицированными экспертами-дешифровщиками.

Одной из наиболее важных из подлежащих автоматизации операций представляется сопоставление (отождествление идентичных элементов) двух снимков, полученных с разных ракурсов, в разное время, возможно, разными типами сенсоров (инфракрасных, видимого диапазона, радиолокационных и других), поскольку эта операция зачастую предшествует выполнению других операций анализа аэрокосмических снимков. Такое сопоставление необходимо для записи снимков в единой системе координат (т.е. для их совмещения) с целью либо синтеза карт больших размеров на основе локальных снимков, либо дополнения информации, содержащейся в одном снимке, данными из других снимков того же фрагмента земной поверхности, либо выявления произошедших изменений. В практических задачах сопоставление зачастую требуется выполнять с высокой точностью. и

В отличие от большинства классических задач автоматического анализа изображений в промышленной робототехнике, медицине, криминалистике, охранных системах и т.п. аэрокосмические видеоданные характеризуются значительно большей априорной неопределенностью. Эта неопределенность связана с сезонными и суточными изменениями наблюдаемых ландшафтов, специфическими отличиями изображений, сформированных различными типами видеодатчиков, и огромным многообразием подлежащих автоматическому анализу и интерпретации сюжетов. При этом идентичность содержания одной и той же сцены, присутствующей на разных изображениях, сохраняется независимо от условий съемки.

Группой методов, позволяющих использовать содержательную идентичность изображений и преодолевать указанную априорную неопределенность при сопоставлении изображений, являются структурные методы анализа. Однако существовавшие на момент начала данной работы структурные методы не позволяли достичь требуемой в практических приложениях точности и робастности сопоставления. Устранение этих недостатков могло быть осуществлено с помощью проведения анализа изображений на различных уровнях (пиксельном, контурном и структурном), то есть с помощью иерархического подхода. Таким образом, перспективным для решения задачи сопоставления аэрокосмических изображений являлось дальнейшее развитие иерархических структурных методов.

Цель работы

Высокоточное сопоставление аэрокосмических изображений, полученных с разных ракурсов, подверженных сезонно-суточным изменениям или содержащих различия, вызванные использованием сенсоров различных типов; разработка методов извлечения из изображений информации, инвариантной к возможным изменениям условий съемки.

Основные задачи: создание иерархического структурного представления изображений, в котором учитываются общие допущения о свойствах видимого мира; вывод критерия оптимальности описания изображения в рамках предложенного представления и разработка методов построения структурного описания изображений путем оптимизации выработанного критерия; разработка методов сопоставления изображений через соотнесение их иерархических структурных описаний; разработка методов повышения точности сопоставления и расширение возможных типов взаимных пространственных преобразований изображений путем коррекции результатов структурного сопоставления.

На защиту выносятся:

1) Теоретико-информационный подход и методы построения иерархических структурных описаний изображений, позволяющие максимизировать количество извлекаемой из изображений информации, инвариантной к изменению условий съемки.

2) Метод сопоставления аэрокосмических изображений, полученных с разных ракурсов, в разное время суток и года, с помощью сенсоров различных типов. Сопоставление выполняется иерархически на основе адаптивно корректируемых структурных описаний за время, полиномиально зависящее от количества структурных элементов.

3) Метод локальной корреляции как способ достижения более высокой точности совмещения изображений и расширения класса их допустимых взаимных пространственных преобразований в задачах структурного сопоставления и совмещения изображений.

4) Аналитические выражения оптимального фильтра пространственного спектра для операции фазовой корреляции, устанавливающие необходимость учета гармоник пространственного спектра с весом, обратно пропорциональным их номеру, поскольку фазы гармоник смещаются при геометрических искажениях изображения тем быстрее, чем выше номер гармоники.

5) Многоэтапный способ итеративной оптимизации информационной целевой функции в задачах построения структурных описаний изображений, включающий этап получения приближенного решения с использованием упрощенных моделей, этап получения решения в расширенном пространстве моделей и этап уточнения решения.

Научная новизна работы

1 • Предложен способ иерархической декомпозиции задачи структурного сопоставления, использующий результаты сегментации изображений и позволяющий уменьшить вычислительную сложность задачи сопоставления.

• Разработан метод адаптивной коррекции структурных описаний в процессе их сопоставления.

• Разработан механизм распространения информации о положении опорных точек в методе локальной корреляции.

• Выведены аналитические выражения для фильтрации пространственного спектра изображений, увеличивающей отношение сигнал/шум на кросс корреляционном поле в присутствии взаимных геометрических искажений изображений.

• Разработано иерархическое структурное представление изображений, Г различные уровни которого объединены общей информационной целевой v функцией.

• Получены формулы, определяющие качество структурного описания, а также выражения, определяющие степень сходства структурных элементов.

Научная и практическая значимость

Автоматические методы и алгоритмы иерархического структурного сопоставления аэрокосмических изображений, позволяющие достигать высокой ^ точности совмещения и осуществлять робастное сопоставление пар изображений, снятых с разных ракурсов, в разное время суток и года и с помощью сенсоров различного типа, могут найти широкое применение в фотограмметрии, дистанционном сборе данных. В первую очередь это относится к таким практическим задачам, как геокодирование и экономический и экологический мониторинг поверхности Земли. ч

Реализация результатов работы > Результаты диссертационной работы были использованы в НИР 12200

060-03 «Разработка и создание методов, алгоритмов и программ автоматического текстурного и структурного анализа изображений в задачах измерения, контроля и сопоставления изображений», проводимой по заказу Министерства науки, а также при постановке и проведении ОКР «Сатрап», ,4 выполняемой по заказу М.О. РФ. Результаты диссертационной работы были также использованы в ОКР «Сфера», проводимой в ЗАО НИИВЦ «Карат». Акты внедрения приложены к диссертации.

Личный вклад автора построение иерархического структурного представления изображений на основе теоретико-информационного подхода; модернизация метода построения структурного описания изображений на основе теоретико-информационного подхода; усовершенствование метода структурного сопоставления: расширение * класса допустимых взаимных пространственных преобразований изображений с группы подобия до аффинной группы, разработка механизма адаптивной коррекции структурных описаний изображений в ходе их сопоставления; вывод аналитических выражений для оптимального фильтра пространственных спектров изображений, использующегося при решении задачи локальной корреляции; воплощение разработанных методов в форме компьютерных программ; проведение экспериментальной проверки разработанных методов на большой выборке реальных аэрокосмических снимков.

Апробация работы

Основные результаты работы докладывались на следующих научных форумах: ч

• конференции "Battlespace digitization and network-centric warfare II" в рамках международного симпозиума "AeroSence-2002" (Orlando, 2002);

• конференции "Image and signal processing for remote sensing IX" в рамках международного симпозиума "Remote Sensing - 2003" (Barcelona, 2003);

• VII-ой международной конференции "11еразрушающие методы контроля и компьютерное моделирование в науке и технике" NDTCS-2003 (Санкт-Петербург, 2003);

• конференции "Automatic target recognition XIV" в рамках международного симпозиума "Defense and Security-2004" (Orlando, 2004);

• VIII-ой международной конференции "Неразрушающие методы контроля и компьютерное моделирование в науке и технике", NDTCS-2004 (Санкт-Петербург, 2004);

• VIII-ой общероссийской научной конференции "Современная логика: проблемы теории, истории и применения в науке" (С.-Петербург, 2004);

• конференции "Automatic target recognition XV" в рамках международного симпозиума "Defense and Security - 2005" (Orlando, 2005).

Публикации

По материалам диссертации опубликовано 10 научных работ:

1. Lutsiv V.R., Malyshev I.A., Pepelka V., Potapov A.S. Target independent algorithms for description and structural matching of aerospace photographs // Proc. SPIE, 2002, Vol. 4741, pp. 351-362.

2. Lutsiv V.» Malyshev I., Potapov A. Hierarchical structural matching algorithms for registration of aerospace images // Proc. SPIE, 2003, Vol. 5238, pp. 164-175.

3. Potapov A.S., Lutsiv V.R. Information-theoretic approach to image description and interpretation // Proceedings of SPIE, 2003, Vol. 5400, pp. 277-283.

4. Потапов A.C., Малышев И.А., Луцив B.P. Совмещение аэрокосмических изображений с субпиксельной точностью методом локальной корреляции // Оптический журнал, 2004, т. 71, № 5, с. 31-36.

5. Потапов А.С. Влияние взаимных геометрических искажений изображений на возможность их пространственного совмещения методом локальной корреляции // Оптический журнал, 2004, т. 71, № 8, с. 74-80.

6. Potapov A.S. Image matching with the use of the minimum description length approach // Proc. SPIE, 2004, Vol. 5426, pp. 164-175.

7. Potapov A.S., Gamayunova O.S. Information criterion for constructing the hierarchical structural representations of images // Proc. SPIE, 2005, Vol. 5807, pp. 443-454.

8. Lutsiv V., Potapov A., Novikova Т., Lapina N. Hierarchical 3D structural matching in the aerospace photographs and indoor scenes // Proc. SPIE, 2005, Vol. 5807, pp. 455-466.

9. Potapov A.S., Luciv V.R., Malyshev I.A. Sub-pixel precise image analysis in the industrial environment // Proceedings of SPIE, 2004, Vol. 5831, pp. 199-203.

Ю.Потапов А.С. Принцип минимальной длины описания и сравнение гипотез // Современная логика: проблемы теории, истории и применения в науке. Материалы VIII Общероссийской научной конференции, Санкт-Петербург, 2004, с. 409-412.

Полный список научных трудов:

1. Губанов А.Г., Потапов А.С., Трушкина А.С. Развитие базы данных скоплений галактик // Всероссийская астрономическая конференция. Тезисы докладов, С.-Пб., 2001, с.54-55.

2. Губанов А.Г., Копылов А.И., Потапов А.С. Поиск группировок внегалактических радиоисточников // ПАЖ, 2003, т.29, № 4, с.1-13.

3. Потапов А.С. Принцип минимальной длины описания и сравнение гипотез // Современная логика: проблемы теории, истории и применения в науке. Материалы VIII Общероссийской научной конференции 24-26 июня 2004 г, с. 409-412.

4. Potapov A.S. Image matching with the use of the minimum description length approach // Proc. SPIE, 2004, Vol. 5426, pp. 164-175.

5. Potapov A.S., Luciv V.R. Information-theoretic approach to image description and interpretation // Proceedings of SPIE, 2003, Vol. 5400, pp. 277-283.

6. Lutsiv V., Malyshev I., Potapov A. Hierarchical structural matching algorithms for registration of aerospace images // Proc. SPIE, 2003, Vol. 5238, pp. 164-175.

7. Lutsiv V.R., Malyshev I.A., Pepelka V., Potapov A.S. Target independent algorithms for description and structural matching of aerospace photographs // Proc. SPIE, 2002, Vol. 4741, pp. 351-362.

8. Потапов A.C., Малышев И.А., Луцив В.P. Совмещение аэрокосмических изображений с субпиксельной точностью методом локальной корреляции // Оптический журнал, 2004, т. 71, №5, с. 31-36.

9. Потапов А.С. Влияние взаимных геометрических искажений изображений на возможность их пространственного совмещения методом локальной корреляции // Оптический журнал, 2004, т. 71, № 8, с. 74-80.

10. A.S. Potapov, V.R. Luciv, I.A. Malyshev. Sub-pixel precise image analysis in the industrial environment // Proceedings of SPIE, 2004, Vol. 5831, pp. 199-203.

11. J.N. Bahvalov, A.S. Potapov. A statistical model of interpolation and its application to texture segmentation // Proceedings of SPIE, 2004, Vol. 5831, p. 191-198.

12. Potapov A.S., Gamayunova O.S. Information criterion for constructing the hierarchical structural representations of images // Proc. SPIE, 2005, Vol. 5807, pp. 443-454.

13. Lutsiv V., Potapov A., Novikova Т., Lapina N. Hierarchical 3D structural matching in the aerospace photographs and indoor scenes // Proc. SPIE, 2005, Vol. 5807, pp. 455-466.

14. Potapov A.S., Luciv V.R. Information-theoretic approach to image description and interpretation // Proc. SPAS, 2003, Vol. 7, pp. F8-F11.

15. Potapov A.S., Luciv V.R., Malyshev I.A. Sub-pixel precise image analysis in the industrial environment // Proc. SPAS, 2004, Vol. 8, pp. E17-E20.

16. Bahvalov J.N., Potapov A.S. A statistical model of interpolation and its application to texture segmentation // Proc. SPAS, 2004, Vol. 8, pp E26-E30.

17. Малышев И.А., Луцив B.P., Лапина H.IL, Андреев B.C., Новикова T.A., Потапов А.С. Разработка и создание методов, алгоритмов и программ автоматического текстурного и структурного анализа изображений в задачах измерения, контроля и сопоставления изображений. Отчет по НИР 12200-060-03 по заданию Министерства науки, 2004, 22 стр.

Структура и объем диссертации

Диссертация состоит из введения, четырех глав, заключения и списка цитируемой литературы. Она содержит 158 страниц машинописного текста, 38 рисунков и 2 таблицы. Список цитируемой литературы содержит 129 наименований. Нумерация формул самостоятельная в каждой главе, нумерация рисунков и таблиц сквозная по всей диссертации.

Заключение диссертация на тему "Иерархические структурные методы автоматического анализа аэрокосмических изображений"

Основные результаты и выводы

В ходе исследований были достигнуты следующие результаты

I. Разработано иерархическое структурное представление изображений, основанное на информационной целевой функции.

1) Выведена целевая функция на основе принципа минимальной длины описания для выбора оптимального в рамках рассматриваемого представления описания изображения.

2) Разработан метод и реализован алгоритм сегментации изображений на однородные области, границы которых используются для формирования контурных описаний изображений.

3) Разработан метод и реализован алгоритм сегментации контуров, в результате работы которого формируются непроизводные структурные элементы изображения.

4) Разработан метод и реализован алгоритм группирования структурных элементов.

II. Разработан метод сопоставления изображений, использующий в качестве основы их иерархическое структурное представление.

1) Разработан метод обхода дерева вариантов с их эффективным отсечением на основе частичных гипотез сопоставления.

2) Разработан метод иерархической декомпозиции проблемы структурного сопоставления на основе групп структурных элементов.

3) Разработан метод взаимной коррекции структурных описаний (размера, положения и ориентации структурных элементов и формы их групп) в процессе их сопоставления, позволяющий компенсировать ошибки декомпозиции.

4) Достигнута возможность робастного совмещения пар аэрокосмических изображений, снятых с разных ракурсов и подверженных сезонно-суточному изменению, смене типа сенсора.

III. Разработан метод и реализован алгоритм локальной корреляции, уточняющий результат работы метода структурного сопоставления.

1) Выведены формулы для фильтрации пространственного спектра фрагментов, для которых вычисляется корреляция, позволяющие повысить вероятность обнаружения истинного корреляционного максимума в присутствие некомпенсированных взаимных пространственных искажений изображений.

2) Разработан метод распространения информации от опорных точек с измеренными положениями к точкам, соответствие для которых на втором изображении неизвестно.

3) Достигнута возможность исправления ошибкок совмещения, составляющих до 10% от размера изображения.

4) Достигнута возможность высокоточного (вплоть до субпиксельного) совмещения изображений, взаимно преобразованных глобальным проективным преобразованием, дополненным полем локальных смещений.

На основе полученных результатов и проведенных исследований можно сделать следующие выводы.

I. Иерархические структурные представления являются эффективным средством для автоматического анализа аэрокосмических снимков.

II. Использование теоретико-информационного подхода позволяет повысить информативность описания изображений, что ведет к повышению робастности работы алгоритмов анализа, в частности, алгоритмов сопоставления изображений.

III. Робастное сопоставление изображений, снятых с разных ракурсов и обладающих высокой степенью априорной неопределенности по сюжету, а также подверженных сезонно-суточным изменениям и содержащих отличия, вызванные сменой ракурса съемки и типа сенсора, достижимо на основе структурных методов.

IV. Одновременное достижение робастности и точности совмещения аэрокосмических изображений невозможно на основе методов, работающих только на структурном или только на пиксельном уровне. Привлечение иерархического подхода, в рамках которого выполняется сопоставление изображений на разных уровнях абстракции, позволяет одновременно достичь требуемой точности и робастности.

V. Разработанные методы применимы в задачах геокодирования, синтеза панорамных снимков, извлечения из баз данных изображений, выявления изменений в целях экологического и экономического мониторинга и др.

Библиография Потапов, Алексей Сергеевич, диссертация по теме Оптические и оптико-электронные приборы и комплексы

1. Jain R.C., Binford Т.О. 1.norance, myopia and naivete in computer vision systems // CVGIP: Image Understanding. 1991. Vol. 53. No. 1. P. 112-117.

2. Jain R.C., Binford Т.О. Revolutions and experimental computer vision // CVGIP: Image Understand. 1991. Vol. 53. No 1. P. 127-128.

3. Фурман Я.А. и др. Введение в контурный анализ и его приложения к обработке изображений и сигналов: М., ФИЗМАТЛИТ. 2002. 592 с.

4. Tarr M.J. and Black M.J. A computational and evolutionary perspective on the role of representation in vision // CVGIP: Image Understanding. 1994. Vol. 60. No l.P. 65-73.

5. Aloimonos J. Purposive and qualitative active vision // Proc. 10th International Conference on Pattern Recognition. 1990. Vol. 1. P. 346-360.

6. Mapp Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов: М., Радио и связь. 1987. 400 с.

7. Павлидис Т. Иерархические методы в структурном распознавании образов // ТИИЭР. 1979. Т. 67. № 5. С. 39-49.

8. Козлов Ю.М. Адаптация и обучение в робототехнике: М., Наука. Гл. ред. физ.-мат. лит. 1990. 248 с.

9. Rares A., Reinders M.J.T., Hendriks Е.А. Image Interpretation Systems // Technical Report (MCCWS 2.1.1.3.C), MCCWS project, Information and Communication Theory Group. TU Delft. 1999. 32 p.

10. Nacken P. Image Analysis Methods Based on Hierarchies of Graphs and Multi-Scale Mathematical Morphology: PhD thesis, Univ. of Amsterdam. 1994. 176 p.

11. Pinz A. Interpretation and fusion recognition versus reconstruction // In Pinz A. and Burger W., eds. Vision Milestones 1995, OGAI lecture series. 1995. P. 9-21.

12. Искусственный интеллект: В 3 кн. Кн. 1. Системы общения и экспертные системы: Справочник/Под ред. Э.В.Попова. М., Радио и связь. 1990. 464 с.

13. Chan T.F., Shen J., and Vese L. Variational PDE models in image processing // Notice of Amer. Math. Soc. 2003. Vol. 50. P. 14-26.

14. Ерош И.Л., Игнатьев М.Б., Москалев Э.С. Адаптивные робототехнические системы: Л., ЛИАП. 1985. 144 с.

15. Lillholm М., Nielsen М., Griffin L.D. Feature-Base Image Analysis // Int. J. of Computer Vision. 2003. Vol. 52. No. 2/3. P. 73-95.

16. Тихонов A.H., Арсенин В.Я. Методы решения некорректных задач: М., Наука. 1986.

17. Field D.J. Relations between the statistics of natural images and response properties of cortical cells // J. Opt. Soc. Am. 1987. Vol. 12. No. 4. P.2379-2394.

18. Ruderman D.L. and Bialek W. Statistics of natural images: Scaling in the woods // Physical Review Letters. 1994. Vol. 73. No. 6. P. 100-105.

19. Розенфельд А., Дейвис Л.С. Сегментация и модели изображения // ТИИЭР. 1979. Т. 67. №5. С. 71-81.

20. Zhu S.C., Wu Y.N., Mumford D.B. Filters, Random Fields, and Maximum Entropy (FRAME): Towards a Unified Theory for Texture Modeling // Int'l J. Computer Vision. 1998. Vol. 27. No. 2. P. 1-20.

21. Tu Z.W. and Zhu S.C. Image Segmentation by Data Driven Markov Chain Monte Carlo // IEEE Trans. PAMI. 2002. Vol. 24. No. 5. P. 657-673.

22. Прэтт У. Цифровая обработка изображений: М. Мир. 1982. Кн. 2. 480 с.

23. Geman D. et al. Boundary detection by constrained optimization // IEEE Trans. Pattern Analysis and Machine Intelligence (PAMI). 1990. Vol. 12. P. 609-628.

24. Zhu S.C., Wu Y., Mumford D. Minimax Entropy Principle and its Application to Texture Modeling//Neural Computation. 1997. No. 9. P. 1627-1660.

25. Geman S. and Geman D. Stochastic relaxation, Gibbs distributions and Bayesian restoration of images // IEEE Trans. PAMI. 1984. Vol. 6. P. 721-741.

26. Mumford D. and Shah J. Optimal approximation by piecewise smooth functions // Comm. Pure and Appl. Math. 1989. Vol. 42. P. 577-685.

27. Фу К. Структурные методы в распознавании образов: М., Мир. 1977. 320 с.

28. Mumford D. and Gidas В. Stochastic Models for Generic Images // Quaterly of Applied Mathematics. 2001. Vol. 59. P. 85-111.

29. Kersten D. Predictability and Redundancy of Natural Images // J. Optical Soc. Am. A, 1987. Vol. 4. No. 12. P. 2395-2400.

30. Koloydenko A. Modeling Natural Microimage Statistics: PhD thesis, Dept. of Math and Statistics, Univ. of Massachusetts, Amherst. 2000.

31. Atick J.J. and Redlich A.N. What Does the Retina Know about Natural Scenes? // Neural Computation. 1992. Vol. 4. P. 196-210.

32. Barlow H.B. What is the computational goal of the neocortex? // In C. Koch, J.L. Davis, eds. Large-scale neuronal theories of the brain: MIT Press. 1994. P. 1-22.

33. Christensen G.E. Consistent Linear-Elastic Transformations for Image Matching // Proc. Information Processing in Medical Imaging. 1999. P. 224-237.

34. Thevenaz P. et al. A pyramid approach to subpixel registration based on intensity // IEEE Trans, on Image Processing. 1998. Vol. 7. No. 1. P. 27-41.

35. Brown L.G. A survey of Image Registration Techniques // ACM Computing surveys. 1992. Vol. 24. P. 325-376.

36. Olson C.F. A probabilistic formulation for Hausdorff matching // Proc. IEEE Conf. on Computer Vision and Pattern Recognition. 1998. P. 150-156.

37. Baumberg A. Reliable feature matching across widely separated views // Conf. on Computer Vision and Pattern Recognition. 2000. P. 774-781.

38. Efrat A., Gotsman C. Subpixel Image Registration Using Circular Fiducials // Int. J. of Сотр. Geom. and Appl. 1994. Vol. 4, No. 4. P. 403-422.

39. Lutsiv V.R., Malyshev I.A., Pepelka V., Potapov A.S. Target independent algorithms for description and structural matching of aerospace photographs // Proc. SPIE. 2002. Vol. 4741. P. 351-362.

40. Lutsiv V., Malyshev I., Potapov A. Hierarchical structural matching algorithms for registration of aerospace images // Proc. SPIE. 2003. Vol. 5238. P. 164-175.

41. Lutsiv V., Potapov A., Novikova Т., Lapina N. Hierarchical 3D structural matching in the aerospace photographs and indoor scenes // Proc. SPIE. 2005. Vol. 5807. P. 455-466.

42. Абду И.Э., Прэтт У.К. Количественный расчет детекторов контуров, основанных на подчеркивании перепадов яркости с последующим пороговым ограничением // ТИИЭР. 1979. Т. 67. № 5. С. 59-70.

43. Роберте JI. Автоматическое восприятие трехмерных сцен. // В кн. Интегральные роботы: М., Мир. 1973. С. 162-208.

44. Prewitt J.M.S. Object enhancement and extraction // In Lipkin B.S. and Rosenfeld A., eds. Picture processing and Psychopictorics: Academic Press, New York. 1970. P. 75-149.

45. Дуда Р.,Харт П. Распознавание образов и анализ сцен: М., Мир.1976. 511 с.

46. Marr D. and Hildreth Е. Theory of edge detection // Proc. R. Soc. Lond. B207. 1980. P. 187-217.

47. Canny J.F. A computational approach to edge detection // IEEE Transactions on pattern analysis and Machine Intelligence. 1986. Vol. 8. No. 6. P. 679 698.

48. Deriche R. Optimal edge detection using recursive filtering // Proc. 1st Int. Conf. Computer Vision. 1987. P. 501 505.

49. Lindeberg T. Edge detection with automatic scale selection // In IEEE Computer Vision and Pattern Recognition. 1996. P. 465 470.

50. Park R.-II., Yoon K.S., Choi W.Y. Eight-point discrete Hartley transform as an edge operator and its interpretation in the frequency domain // Pattern Recognition Letters. 1998. Vol. 19. P. 569-574.

51. Chanda В., Kundu M.K., Padmaja Y.V. A multi-scale morphologic edge detector// Pattern Recognition. 1998. Vol. 31. No. 10. P. 1469-1478.

52. Olson C.F., Huttenlocher D. Automated target recognition by matching oriented edge pixels // IEEE Trans, on Image processing. 1997. Vol. 6. No 1. P. 103-113.

53. Grimson W.E.L. and Marr D. A computer implementation of a theory of human stereo vision // Proc. ARPA Image Understanding Workshop, L.S. Baumann, ed., SRI. 1979. P. 41-45.

54. Lei B.J., Hendriks E.A., Reinders M.J.T. On Feature Extraction from Images // Technical Report, Deliverable 2.1.1.2.A+B, MCCWS project. 1999. 57 p.

55. Moravec H.P. Towards automatic visual obstacle avoidance // In Proc. of the International Joint Conference on Artificial Intelligence. 1977. P. 584.

56. Moravec H.P. Visual mapping by a robot rover // In Proc. of the 6(h International Joint Conference on Artificial Intelligence. 1979. P. 598-600.

57. Smith S.M. and Brady J.M. SUSAN a new approach to low level image processing // Int. Journal of Computer Vision. 1997. Vol. 23. No. 1. P. 45-78.

58. Parida L., Geiger D., and Hummel R. Junctions: Detection, Classification, and Reconstruction // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1998. Vol. 20. No. 7. P. 687-698.

59. Baker S. Design and Evaluation of Feature Detectors: PhD thesis. Columbia University. 1998. 167 p.

60. Baxter R.A. Minimum Message Length Inference: Theory and Applications: PhD thesis, Department of Computer Science, Monash University, Clayton, Australia. 1996. 246 p.

61. Lagunovsky D. and Ablameyko S. Straight-line-primitive extraction in grey-scale object recognition // Pattern Recog. Letters. 1999. Vol. 20. P. 1005-1014.

62. Cappellini V., Fini S., Harrigan E., Mecocci A. Circular shape detection in remote sensing multispectral images // In Arcelli C., Cordelia L.P., Sanniti di Baja G. (Eds.). Visual Form Analysis and Recognition: Plenum Press, New York. 1992. P. 119-126.

63. Kanatani K. and Ohta N. Automatic detection of circular objects by ellipse growing // Proc. SSII2002. 2002. P. 355-360.

64. Gander W., Golub G.H., and Strebel R. Fitting of circles and ellipses least squares solution // BIT. 1994. Vol. 34. P. 556-577.

65. Fitzgibbon A., Pilu M., Fisher R. Direct least-square fitting of Ellipses // IEEE Trans. PAMI. 1999. Vol. 21. No. 5. P. 476-480.

66. Gull N. and Zapata E.L. Lower order circle and ellipse Hough Transform // Pattern Recognition. 1997. Vol. 30. No. 10. P. 1792-1744.

67. McLaughlin R.A. Randomized Hough Transform: Improved ellipse detection with comparison // Pattern Recognition Letters. 1998. Vol. 19. P. 299-305.

68. Shaw A.C. A formal picture description scheme as a basis for picture processing system // Information and Control. 1969. Vol. 14. P. 9-52.

69. Ma B. Parametric and Nonparametric Approaches for Multisensor Data Fusion: PhD thesis, University of Michigan. 2001. 196 p.

70. Noronha S., Nevatia R. Detection and Modeling of Buildings from Multiple Aerial Images // IEEE Trans. PAMI. 2001. Vol. 23. No. 5. P. 501-518.

71. Iqbal Q. and Aggarwal J.K. Lower-level and High-level Approaches to Content-based Image Retrieval // Proc. IEEE South West Symposium on Image Analysis and Interpretation. 2000. P. 197-201.

72. Pinz A., Prantl M., Ganster H. A Robust Affine Matching Algorithm Using an Exponentially Decreasing Distance Function // J. of Universal Computer Science. 1995. Vol. 1. No. 8. P. 614-631.

73. Thomas P. and Vernon D. Image registration by differential evolution // Proc. Irish Machine Vision and Image Processing Conference. 1997. P. 221-225.

74. Jerebko A., Barabanov N., Luciv V., Allinson N. Neural net based image matching. Proc. SPIE. 2000. Vol. 3962. P. 128-137.

75. Linying S., Sharp В., Chibelushi C. Knowledge-Based Image Understanding: A Rule-Based Production System for X-Ray Segmentation // Int. Conf. on Enterprise Information Systems (ICEIS). 2002. P. 530-533.

76. Минский M. Фреймы для представления знаний: пер. с англ. — М., Энергия. 1979. 151 с.

77. Lowe D. Object Recognition from Local Scale-Invariant Features // In Proc. Int. Conf. on Computer Vision. 1999. P. 1150-1157.

78. Kreutz M., Volpel В., and Janfien H. Scale-invariant Image Recognition based on Higher-order Autocorrelation Features // Pattern Recognition. 1996. Vol.29. No.l.P. 19-26.

79. Котлецов Б.Н. Микроизображения: Оптические методы получения и контроля: Л., Машиностроение. 1985, 240 с.

80. Чернявский А.Ф., Афанасьев Г.К., Михаилов В.П. Выявление дефектов интегральных схем методом оптической пространственной фильтрации // Дефектоскопия. 1974. № 5. С. 41-49.

81. Choo Y.C. On the use of the polycurve codes for structural pattern recognition // Proc IEEE Int. Conf. on systems, man and cybernetics. 1987. Vol. 2. P.739.

82. Olson C.F. Improving the generalized Hough transform through imperfect grouping // Image and Vision Computing. 1998. Vol. 16. P. 627-634.

83. Liedtke C.-E., Grau O., Growe S. Use of explicit knowledge for the reconstruction of 3-D object geometry // Int. Conf. on Computer Analysis of Images and Patterns. 1995. P. 580-587.

84. Growe S. Knowledge based interpretation of multisensor and multitemporal remote sensing images // IAPRS. 1999. Vol. 32. Part 7-4-3 W6. P. 130-138.

85. Draper B.A. et al. The Schema System // Int. J. of Computer Vision. 1989. No. 2. P. 209-250.

86. Crevier D., Lepage R. Knowledge-Based Image Understanding Systems: A Survey // Сотр. Vision and Image Underst. 1997. Vol. 67. No. 2. P. 161-185.

87. Boissier O., Demazeau Y. MAVI: A Multi-Agent system for Visual Integration // Proc. IEEE Conf. on Multisensor Fusion and Integration for Intelligent Systems. 1994. P. 731-738.

88. Veenman C.J., Reinders M.J.T. A Multi-Agent Framework for a Hybrid Facial Action Tracker // Proc. 4th annual conference of the Advanced School for Computing and Imaging. 1998. P. 127-132.

89. Джексон П. Введение в экспертные системы.: Пер. с англ.: Уч. Пос. М., Изд. дом "Вильяме". 2001. 624 с.

90. Liedtke C.-E., Buckner J., Grau О., Growe S., Tonjes R. AIDA: a system for the knowledge based interpretation of remote sensing data // 3d Airborne Remote Sensing Conference and Exhibition. 1997. Vol. 2. P. 313-320.

91. Roy D.K. Learning Words from Sights and Sounds: A Computational Model: PhD thesis, Massachusetts Institute of Technology. 1999. 176 p.

92. Gorniak P., Roy D. Grounded Semantic Composition for Visual Scenes // J. of Artificial Intelligence Research. 2004. Vol. 21. P. 429-470.

93. Roy D. Learning Visually-Grounded Words and Syntax for a Scene Description Task// Computer Speech and Language. 2002. Vol. 16. No. 3. P. 353-385.

94. Growe S., Tonjes R. A Knowledge Based Approach to Automatic Image Registration // Proc. Int. Conf. on Image Processing. 1997. Vol. 3. P. 228-231.

95. Ковалевский B.A. Локальные и глобальные решения в распознавании изображений // ТИИЭР. 1979. Т. 67, № 5, С. 50-58.

96. Анисимов В.А. Исследование и разработка методов идентификации объектов на изображениях на основе пирамидально-рекурсивных структур: Тезисы диссертации, СПИИА РАН, Санкт-Петербург. 1992.

97. Mallat S. A theory for multiresolution signal decomposition: the wavelet representation // IEEE Trans. PAMI. 1989. Vol. 11, No. 7, pp. 674-693.

98. Wang Yu-Ping. Image representations using multiscale differential operators // IEEE Trans. Image Processing. 1999. Vol. 8. No. 12. P. 1757-1771.

99. Grossberg S. Adaptive pattern classification and universal recoding (I, II). Parallel development and coding of neural feature detectors // Biol. Cybernet. 1976. Vol. 23. P. 121-134, 187-202.

100. Carpenter G.A. and Grossberg S. ART 2: Self-organization of stable category recognition codes for analog input patterns // Applied Optics. 1987. Vol. 26. P. 4919-4930.

101. Carpenter G. and Grossberg S. Adaptive resonance theory (ART) // In Arbib M., ed. Handbook of Brain Theory and Neural Networks: MIT Press. 1995. P. 79-82.

102. Kuo R.J. Integration of adaptive resonance theory II neural network and genetic K-Means algorithm for data mining // Journal of the Chinese Institute of Industrial Engineers. 2002. Vol. 19. No. 4. P. 64-70.

103. Thevenaz P., Ruttimann U.E., Unser M. Iterative multi-scale registration without landmarks // Proc. IEEE Int. Conf. Image Processing. 1995. Vol. 3. P. 228-231.

104. Russell S. and Norvig P. Artificial Intelligence: A Modern Approach (Second Edition): Prentice Hall. 2003.

105. Юб.МасКау D.J.C. Bayesian Methods for Adaptive Models: PhD thesis, Dept. of Computation and Neural Systems, California Institute of Technology, Pasadena, California. 1992. 92 p.

106. Li M. and Vitanyi P. Philosophical Issues in Kolmogorov complexity // Proc. ICALP'92, invited lecture. 1992. P. 1-15.

107. Кайберг Г. Вероятность и индуктивная логика: М., Прогресс. 1978. 374 с.

108. Rissanen J.J. Modeling by the shortest data description // Automatica-J.IFAC. 1978. Vol. 14. P. 465-471.

109. Vitanyi P.M.B. and Li M. Minimum description length induction, Bayesianism, and Kolmogorov complexity // IEEE Transactions on Information Theory. 2000. Vol. 46. No. 2. P. 446-464.

110. Solomonoff R. A formal theory of inductive inference, part 1 and part 2 // Information and Control. 1964. Vol. 7. P. 1-22, 224-254.

111. Sund R. Minimum Description Length based model selection in linear regression // Lectures on Statistical Modeling Theory, fall 2001 course (J. Rissanen). Department of Computer Science, University of Helsinki, Finland. 2001.

112. T. С. M. Lee. Tree-based wavelet regression for correlated data using the minimum description length principle // Australian & New Zealand Journal of Statistics. 2002. Vol. 44. No. 1. P. 23-40.

113. Akaike H. Information theory and an extension of the maximum likelihood principle // Proc. 2nd Int. Symp. Information Theory. 1973. P. 267-281.

114. Fitzgibbon L.J., Allison L., Dowe D.L. Minimum message length grouping of ordered data // Proc. 11th Conf. ALT2000. 2000. Vol. 1968. P. 56-70.

115. Ayer S. and Sawhney H. Layered representation of motion video using robust maximum-likelihood estimation of mixture models and MDL encoding // ICCV. 1995. P. 777-784.

116. Mansouri A.-R. and Konrad J. Minimum description length region tracking with level sets // Proc. SPIE Image and Video Communications and Process. 2000. Vol.3974. P. 515-525.

117. Li M., Gao Q. and Vitanyi P.M.B. Recognizing on-line handwritten characters using MDL // Proc. IEEE Information Theory Workshop. 1993. P. 24-25.

118. Yvan G. et al. Self-Consistency and MDL: A Paradigm for evaluating point-correspondence algorithms, and its application to detecting changes in surface elevation // Int. J. of Computer Vision. 2003. Vol. 51. No. 1. P. 63-83.

119. Maybank S.J. and Sturm P.F. MDL, Collineations and the Fundamental Matrix // Proc. 10th British Machine Vision Conference. 1999. P. 53-62.

120. Li M. Minimum description length based 2-D shape description // In IEEE 4th Int. Conf. on Computer Vision. 1992. P. 512-517, May 1992.

121. Davies R.H. et al. An information theoretic approach to statistical shape modeling // Proc. 12th British Machine Vision Conference. 2001. pp. 3-12.

122. Gabrani M., Tretiak O.J. Surface-based matching using elastic transformations // Pattern Recognition. 1999. Vol. 32. P. 87-97.

123. Lan Z-D., Mohr R., Remagnino P. Robust matching by partial correlation // Proc. of 6th British Machine Vision Conference. 1995. P. 651-660.

124. Rohr K. Image registration based on thin-plate splines and local estimation of anisotropic landmark uncertainties // Medical Image Computing and Computer-Assisted Intervention. 1998. Vol. 1496. P. 1174-1183.

125. Potapov A.S., Lutsiv V.R. Information-theoretic approach to image description and interpretation // Proceedings of SPIE. 2003. Vol. 5400. P. 277-283.

126. Potapov A.S. Image matching with the use of the minimum description length approach // Proc. SPIE. 2004. Vol. 5426. P. 164-175.

127. Viola P.A. Alignment by Maximization of Mutual Information: PhD thesis, MIT, Cambridge, Massachusetts. 1995. 156 p.

128. Wells W.M., Viola P., Atsumi H., Nakajima S., and Kikinis R. Multi-modal volume registration by maximization of mutual information // Medical Image Analysis. 1996. Vol. 1. No. 1. P. 35-51.