автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Методы и средства формообразования объектов изображения

кандидата технических наук
Синенков, Дмитрий Вячеславович
город
Нижний Новгород
год
2003
специальность ВАК РФ
05.13.17
Диссертация по информатике, вычислительной технике и управлению на тему «Методы и средства формообразования объектов изображения»

Автореферат диссертации по теме "Методы и средства формообразования объектов изображения"

Нижегородский государственный технический университет

На правах рукописи

СИНЕНКОВ Дмитрий Вячеславович

г л

МЕТОДЫ И СРЕДСТВА ФОРМООБРАЗОВАНИЯ ОБЪЕКТОВ ИЗОБРАЖЕНИЯ

Специальность 05.13.17 - «Теоретические основы информатики»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Нижний Новгород 2003

Работа выполнена на кафедре вычислительной техники Нижегородского государственного технического университета (НГТУ)

Научный руководитель:

доктор технических наук, профессор УТРОБИН В.А.

Официальные оппоненты:

- доктор технических наук, профессор, зав. кафедрой системного анализа и математики Волго-вятской академии государственной службы НАДЕЕВ А.Т.

- кандидат технических наук, доцент, ХРАНИЛОВ В.П.

Ведущая организация:

Федеральное государственное унитарное предприятие "Научно-исследовательский институт измерительных систем имени Ю.Е. Седакова" (ФГУП НИИИС).

Защита состоится «_»_2003 г. в_часов

на заседании диссертационного совета № Д 212.165.05

при Нижегородском государственном техническом университете

по адресу 603600, г. Нижний Новгород, ГСП-41, ул. Минина, 24, НГТУ.

С диссертацией можно ознакомиться в библиотеке Нижегородского государственного технического университета.

Автореферат разослан «_»_2003 г.

Ученый секретарь диссертационного совета

кандидат технических наук

А.П. Иванов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы

Наметившиеся в последнее время тенденции указывают на то, что современные промышленные системы быстро расширяют горизонты применения систем машинной обработки изображений, а системы машинного зрения становятся неотъемлемой частью общего плана автоматизации промышленных предприятий.

Одной из важнейших проблем, привлекающей в настоящее время пристальное внимание ученых и инженеров, является проблема автоматического анализа формы и состояния пространственных объектов, ' информация о которых представлена в виде изображений — фотографий, видеосигналов и т.д. Например, при дистанционных исследованиях природных ресурсов земли с помощью космических или авиационных средств необходимо анализировать форму, размеры и состояние лесных массивов, водных поверхностей, подсчитывать площади сельскохозяйственных угодий и т.п. В медико-биологических исследованиях изображения рентгеновских снимков, являются основой анализа биологических процессов и диагностики заболеваний. В визуальном контроле на промышленных предприятиях, для обеспечения качества деталей путем проверки формы. При использовании в качестве . органов зрения роботов и др.

Вопросы распознавания изображений и анализа форм объектов получили фундаментальное развитие в работах научных коллективов Вычислительного центра РАН, Института систем обработки изображений РАН, Института проблем передачи информации РАН, Института прикладной математики и кибернетики при Нижегородском университете, кафедры "вычислительной техники при Нижегородском техническом университете и др. Значительный вклад в решение проблем распознавания внесли: Р.Байчи, П.Берт, А.Л.Горелик, Р.Дуда, Н.Г.Загоруйко, В.Кантони, В.В.Кондратьев, Д.Марр, Ф.Розенблатт, В.АУтробин, Ю.Г.Васин, Р.Фишер, П.Харт и многие другие российские и зарубежные ученые.

В настоящее время полностью автоматизировать процесс анализа и интерпретации изображений в большинстве областей человеческой деятельности невозможно.

Дело не только в том, что для переработки больших объемов информации, содержащейся в изображении, требуются большие мощности вычислительных средств. К сожалению, полные математические модели объектов и явлений, а также процессов регистрации их на изображении, как правило, очень сложны, а в ряде случаев до сих пор в деталях и не известны. Это обстоятельство является главным препятствием на пути создания эффективных алгоритмов автоматического анализа и интерпретации сложных изображений.

Между тем многие из упомянутых выше задач на качественном уровне достаточно быстро и легко решает человек. Са\ факх, щц при ¿додо ая ]

БИБЛИОТЕКА | С.Петербург у »

\ ОЭ ?(Ху акт XV/- |

он достаточно хорошо представляет себе объект исследования, говорит о том, что в основе решения всех таких задач лежат достаточно представительные модели, среди которых зрительный анализатор производит выбор, основываясь на информации, представленной в изображении. Понятно, что такие модели суть не что иное, как отражение научного опыта и практической деятельности человека, но в данный момент мы имеем слишком мало указаний на то, каким образом эта сторона человеческого интеллекта может быть формализована для реализации на ЭВМ.

Вместе с тем имеется довольно обширный класс важных задач анализа изображений, с которыми ЭВМ справляется существенно лучше, чем человек. В их основе лежат простые модели, позволяющие в той или иной степени анализировать информацию о форме объектов, содержащуюся в изображении.

На сегодняшний день предложено множество систем анализа форм. Однако большинство из этих систем узко специализированы и для своей работы требуют большого количества априорных данных, что в большинстве случаев невозможно. Причем, во многих системах форма определяется по одному конкретному фактору. В последнее же время исследователи пришли к выводу о необходимости объединения информации о различных факторах изображения для лучшего оценивания параметров, описывающих присущие изображению свойства. Ко всему прочему, большинство систем для обработки данных применяют трудоемкие и требующие больших вычислительных затрат типы операций, а современные условия требуют обработки в реальном масштабе времени.

Цель работы

Разработка методов и средств формообразования объектов наблюдаемой сцены в условиях априорной неопределенности.

На защиту выносятся:

1. Информационная модель формообразования объектов наблюдаемой сцены в условиях априорной неопределенности.

2. Информационная модель процесса сегментации.

3. Процедуры сегментации изображений.

4. Процедура формирования обобщенных эталонов форм.

5. Информационная модель принятия решения о форме объекта по двумерным признакам.

6. Методы анализа поверхностей с позиций теории активного восприятия.

7. Информационная модель формообразования поверхностей.

8. Методы получения дополнительной информации о форме.

Методы исследования

Работа базируется на методах системного анализа, теории активного восприятия (Кондратьев В.В., Утробин В.А. Основы теории активного восприятия. -Н.Новгород: НГТУ, 1997г.; Утробин В.А. Информационные модели системы зрительного восприятия для задач компьютерной обработки изображения. -Н.Новгород: НГТУ, 2001г.), математической теории управления (теории групп, графов, устойчивости), теории вычислительных систем, теории поверхностей, теории распознавания образов и цифровой обработки изображений.

Научная новизна

Научная новизна состоит в следующем:

Разработана информационная модель формообразования объектов в условиях априорной неопределенности. В рамках которой:

1. Разработана иерархия фильтров, решающая задачу сегментации изображения с различной степенью точности в условиях априорной неопределенности.

2. Разработана информационная модель принятия решения о форме объекта по двумерным признакам в условиях априорной неопределенности и методы формирования образов объектов по двумерным признакам.

3. Разработаны методы анализа поверхностей применительно к теории активного восприятия и методы формирования II-пирамиды принятия решения о форме наблюдаемой поверхности с различной степенью точности, в условиях априорной неопределенности.

Практическая ценность

На базе разработанных методик решены следующие прикладные задачи:

1. Разработаны алгоритмы сегментации бинарных и полутоновых изображений, а так же изображений при наличии шумов.

2. Разработана процедура подавления шума, не требующая априорного знания природы шума на исходном изображении.

3. Разработана информационная модель определения координат подвижного объекта по одному двумерному изображению.

4. Разработано алгоритмическое обеспечение поиска двумерного объекта на заданном изображении.

Реализация результатов работы

Результаты исследований реализованы:

1. В программных продуктах НИР "Теоретические исследования и машинное моделирование процессов этапа узнавания изображений", "Теоретическое и экспериментальное моделирование процессов этапа понимания изображений"

финансируемых по программе РФФИ (проекты № 01-01-00452, № 01-01-00459).

2. В программных продуктах НИР "Исследование методов распознавания и идентификации объектов", "Разработка сверхбыстрых алгоритмов идентификации объектов", финансируемых по программе ФГУП НИИИС (проекты № 335033-02, № 3350-25-03).

3. В учебном процессе Нижегородского государственного технического университета.

Апробация работы

Основные результаты диссертационной работы докладывались и обсуждались на следующих научно - технических конференциях и семинарах:

- Всероссийская научно-техническая конференция "Информационные системы и технологии" (Нижний Новгород, 2001);

- Научно-технический форум "Будущее технической науки Нижегородского региона" (Нижний Новгород, 2002);

- 8-я Нижегородская сессия молодых ученых (технические науки) (Дзержинск, 2003);

- 2-я региональная молодежная научно-техническая конференция "Будущее технической науки Нижегородского региона" (Нижний Новгород, 2003).

Кроме того, результаты работы докладывались на семинарах кафедры вычислительной техники Нижегородского государственного технического университета.

Публикации

Основное содержание диссертационной работы отражено в 11 печатных работах.

Структура и объем диссертации

Диссертационная работа состоит из введения, семи глав, заключения, изложенных на 184 с. машинописного текста, содержит 143 рисунка, 5 таблиц и библиографию из 96 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Во введении рассматривается актуальность, цель исследований, научная новизна и практическая ценность результатов диссертационной работы, реализация результатов и апробация работы, публикации, объем и структура диссертации.

в

В первой главе проводится аналитический обзор современных методов обработки изображений и анализа формы. По результатам анализа поставлена цель и определены задачи подлежащие решению. Приведены основные понятия и определения.

Во второй главе на основе анализа моделей обработки изображения существующими системами машинного зрения, системами на основе теории активного восприятия (TAB) и самим человеком строится информационная модель формообразования объектов изображения (рис. 1). Она базируется на TAB, как системе работающей в условиях априорной неопределенности и реализующей врожденные механизмы зрительного восприятия.

Третья глава посвящена разработке информационной модели сегментации изображения в условиях априорной неопределенности и построению алгоритмов сегментации бинарных и полутоновых изображений.

Вводится понятие сегментирующего фильтра.

Определение. Фильтр,

полученный в результате сложения и умножения операторов { область единиц (темная область) которого соответствует области расположения объектов в поле зрения, называется

сегментирующем фильтром.

Получение сегментирующего фильтра сводится к анализу долевого участия операторов Уь которое в свою очередь однозначно распределению масс в векторе полученному при применении системы фильтров (рис. 2) к изображению.

Например, для рис. 3, а сегментирующий фильтр представлен суммой операторов У\+У2 (рис. 3, в), а для рис. 3, б произведением У1У2 (рис. 3, г).

а)

г)

*ia={80,32,32,-16,16,16,16,16,0,0,0,0,0,0,0,0} |1б={32,32,-32,-32,0,0,0,0,0,0,0,0,0,0,0,0}

Рис. 3. Примеры изображений и сегментирующие фильтры для них

Кроме операторов, сегментирующий фильтр предлагается также строить на основе полных групп, что в соответствии с TAB означает построение предложения на множестве {Ли}, являющемся алфавитом слов, элементы которого объединены на операциях сложения и умножения.

Для выбора слов, из множества {J°ni}5 входящих в состав предложения следует воспользоваться правилом, что слово наиболее подходит предложению, если буквы входящие в состав этого слова из множества {Tj}, являющемся алфавитом букв, имеют наибольшее долевое участие.

Сегментирующий фильтр является покрытием реального изображения (оценкой с сверху), выявляющую структуру реального изображения. А само изображение находится под покрытием (рис. 4). Таким образом, для того, чтобы выделить объект из изображения, достаточно наложить на это изображение сегментирующий фильтр.

Определяются методы построения II-пирамиды решающей задачу сегментации с различной степенью точности, которой для удобства дано название ¿-пирамиды.

¿-пирамида сегментирующие ^-пирамиды, сегментирующих

содержит в себе фильтры полей зрения причем построение фильтров каждого уровня зависит от предыдущих. Пример построения ¿-пирамиды для рис. 5, а приведен на рис. 5, б.

Каждый уровень ¿-пирамиды, кроме нулевого, содержит несколько сегментирующих фильтров. Для сегментации изображения в целом, для каждого уровня ¿"-пирамиды строится общий, для всего изображения, сегментирующий фильтр ¿/^ по формуле

Рис. 4.

где I- номер уровня ¿"-пирамиды.

Показано, что принцип действия ¿-пирамиды согласуется со стратегией зрительного восприятия: если нам изначально ничего не известно, то мы смотрим в целом (0-й уровень ¿-пирамиды). В дальнейшем мы уже смотрим в определенной последовательности (последующие уровни ¿-пирамиды, каждый из которых определяется предыдущим).

Для получения окончательной сегментации с целью присвоения каждому объекту своей метки, осуществляется разметка сегментирующих фильтров ¿-пирамиды. Ее можно осуществить любым из известных методов.

Отличительной особенностью разметки сегментирующих фильтров является то, что разметка осуществляется не для пикселей изображения, а для клеток сегментирующего фильтра, что позволяет выиграть в скорости обработки, по сравнению с существующими алгоритмами.

Сегментация бинарных изображений

Разрабатывается процедура сегментации бинарных изображений. Она выглядит следующим образом:

1. Строятся сегментирующие фильтры (57^) ¿"-пирамиды, для выбранных полей зрения (Зу, соответствующего уровня ^-пирамиды. Для полей зрения Су, которые не вошли в рассмотрение, сегментирующий фильтр равен 0. Для бинарных изображений сегментирующий фильтр предлагается строить на основе операторов, исхода из анализа вектора Вектор {р.,} для удобства предлагается рассматривать условно в виде спектра (рис. 7). Примеры построенных сегментирующих фильтров, для изображений на рис. 6, представленных спектрами {ц;} на рис. 7,# приведены на рис. 8.

2. Строится общий сегментирующий фильтр текущего /-го уровня 5-пир амиды для всего изображения.

3. Пункты 1-2 выполняются для всех уровней (^-пирамиды, по которой строится ¿»-пирамида.

4. Производится разметка сегментирующих фильтров 57^ для всех уровней 5-пирамиды.

я) Рис. 6. б)

Сегментация полутоновых изображений

Разрабатывается процедура сегментации полутоновых изображений. Ее отличие от процедуры сегментации бинарных изображений заключается в принципе формирования сегментирующего фильтра. Для полутоновых изображений, он строится на основе полных групп исходя из анализа спектра {д*}. Выделяются полные группы, наиболее точно отражающие распределение объектов на изображении, то есть вносящие наибольший вклад и на их основе строится фильтр.

Примеры построенных сегментирующих фильтров, для изображений на рис. 9, представленных спектрами {ц,} на рис. 10, приведены на рис. 11.

Данный принцип построения сегментирующих фильтров подходит и для бинарных изображений, так как бинарное изображение является частным случаем полутонового.

а)

Рис. 9.

б)

Ай

Цшзх

а)

АЦ

Мтах

ц«

"Нта.ч

Рис. 10.

а)

* V,* V,) + (V, * V,* V,) + (V* % * V,,) 8Рб=(У, + V, + V,) * (V, + V, + У9) * (V, + V, + V,,)

Рис. И.

Сегментация при шумах

При сегментации зашумленных изображений, кроме объектов иногда ошибочно выделяются области содержащие шум. Для исключения этих областей разработана процедура тремора поля зрения, которая согласуется со стратегией зрительного восприятия, так как для создания оптимальных условий работы органов зрения человека необходимо некоторое постоянное движение сетчатого изображения.

Рис. 12.

Принцип исключения ошибочных областей показан на рис. 12. Путем сдвига поля зрения по четырем направлениям на половину клетки уровня, формируются четыре сегментирующих фильтра (¿Т^-ЗУ^) сдвинутых полей зрения. Они накладываются друг на друга, то есть логически перемножаются, в результате чего формируется промежуточный фильтр Для получения окончательного результата фильтр £7^ накладывается на фильтр (для не сдвинутого поля зрения).

Четвертая_глава посвящена

построению информационной модели принятия решения о форме объекта по

двумерным признакам.

В качестве признаков выбраны признаки М-пирамиды. Она представляет собой иерархическую структуру, содержащую на каждом уровне признаки различной степени обобщенности. Тогда формирование эталона заданного объекта будет заключается в построении для этого объекта ^-пирамиды с последующим выделением из нее М-пирамиды.

Построение обобщенного эталона

Признаки, выделяемые при помощи А/-пирамиды, дают точное представление о конкретном объекте. Во многих же случаях достаточно лишь его быстрого узнавания, то есть отнесения к классу подобных объектов, виденных ранее.

Изображения М\ и A/j, принадлежащие одному классу эквивалентны. По TAB следует

М-.Щ о 0(A/i)=0(A/j), где О (МО, 0(Mj) - описания образов на {V{}, {PSi}, {Рт}- То есть, для каждого класса подобных изображений существует один единственный образ, описывающий данный класс, который обобщает и выделяет наиболее общие их свойства. Такой обобщенный образ называется обобщенным эталоном класса эталонных изображений.

23 456789 1011 12 13П4 15

6)

Рис. 13.

Разработаны методы формирования обобщенных эталонов, на {К,}, {Л,}, исходя из анализа векторов признаков. На рис. 13 приведен пример сформированного образа (рис. 13, в) объекта (рис. 13, а) исходя из анализа {ц,}.

Построение И-пиршиды обобщенного эталона объекта

Применяя полученные правила построения образов для каждого поля зрения всех уровней 0-пирамиды объекта, мы получим ¿/-пирамиду решающую задачу построения обобщенного эталона объекта с различной степенью точности. В дальнейшем ¿/-пирамиду решающую такую задачу будем называть /-пирамидой. Пример /-пирамиды для рис. 14, а приведен на рис. 14, б (два уровня^

Одна из особенностей /пирамиды - это ее инвариантность к растяжению, сжатию и масштабированию изображения объекта,

вытекающая из свойств применяемой системы

фильтров. Так для рисунков 15, а и б сформированный образ будет одинаков (рис. 15, в,

первый уровень).

Трехмерный объект на изображении может дать бесконечное число проекций получаемых в связи с изменением направления наблюдения. Тем не менее эти видимые проекции трехмерного объекта можно сгруппировать в конечное число классов эквивалентности, которые называются ракурсами.

Рис. 14.

а)

Рис. 15.

Таким образом, в базе данных, объекту предлагается ставить в соответствии несколько эталонов по числу всевозможных ракурсов, которые образуют класс эталонов соответствующий данному объекту.

Принятие решения

Принятие решения о форме заключается сравнении /-пирамид, а затем, если этого требуется, М-пирамид объекта и эталона. Сравнение идет либо по всем уровням, либо до определенного в зависимости от требуемой точности.

Сравнения /-пирамид

осуществляется путем сложения по модулю два битовых

последовательностей полей зрения /пирамид выделенного и текущего рассматриваемого объекта из базы данных. При этом, если получился нулевой результат, то данные поля зрения /-пирамид идентичны. Если же результат не нулевой, то единичные биты будут указывать на места различия в образах. Например, результат сравнения двух образов (рис. 16, а, б) показан на рис. 16, в. Достоинства данного метода сравнения - высокая скорость обработки, т.к. логические операции самые элементарные и быстро реализуемые.

Сравнение Л/-пирамид сводится к нахождению расстояния

О =д/2>;

б)

001100110011)100 0011001100111111 0000000000000011 Рис. 16.

й?)2

между j-м найденным объектом и эталоном в пятнадцати мерном

пространстве признаков, где щ - компоненты вектора {¿д,} рассматриваемого уровня М-пирамиды объекта, а - компоненты вектора рассматриваемого уровня Л/-пирамиды эталона. Такой

подход естественен и является стандартным подходом в теории распознавания образов.

Решение о соответствии j-го рассматриваемого объекта эталону принимается исходя из условия

Г)<Г°,

где г° - некое допустимое расстояние, либо из условия

min Гц,

i=\.k ß

где к - количество сравниваемых объектов базы данных.

В пятой главе разрабатывается информационная модель формообразования поверхностей.

Рассматриваются методы анализа поверхностей с точки зрения функционального анализа и теории поверхностей.

Исходя из TAB, фильтры есть дифференциальные операторы. Так если у) функция яркости наблюдаемого изображения, то справедливо

djj(x,y) д/и(х,у) dfj{x,y) d2j.i{x,v) „ д2/л(х,у)

' *---' 2---Г-^ ~->ГА ---w--Гз-'

дх ау дхду дх ду

где производные берутся в некоторой заданной точке (центре планигона).

Результат действия фильтров на поле зрения выражается вектором

{р.,}. Тогда компоненты вектора р.2, цз, -ц4, будут выражать

значения соответствующих дифференциальных операторов в точке Ао,

являющейся центром планигона.

Отсюда, достаточное условие экстремума наблюдаемой функции у) для задач обработки методами TAB, может быть выражено в следующей

~ Ма МЗ

форме; если jlij и \х2 равны нулю и определитель положителен,

/'з ~ Ms

то функция у) имеет в точке Л0(центре планигона) экстремум: максимум, когда щ или р5 больше нуля, минимум - если ji4 или щ меньше нуля.

С позиций TAB, если jii положительно, то функция ju(jt, у) в точке А0 возрастает по координате х, если отрицательна, то убывает. Соответственно, если ji2 положительно, то функция у) в точке А0 возрастает по координате у, если отрицательна, то убывает.

Вектор градиента, с позиций TAB, можно представить в виде grad // = /4/ + fi2j ■> а его длину

\grad А + И? . Точкой начала вектора при этом является центр планигона.

С точки зрения теории поверхностей, внутреннюю геометрию поверхности заданной функцией г=~(х, у) определяет ее первая квадратичная форма

ds2 = Edx2 + IFdxdy + Gdy2, где коэффициенты с позиций TAB могут быть представлены следующим образом

Е + ju2, F = » G = 1 + •

Изучение пространственного строения окрестности точки поверхности производится при помощи ее второй квадратичной формы

2/7 = Ldx2 + IMdxdy + Ndy2. Коэффициенты второй квадратичной формы с позиций TAB могут быть записаны как:

N = ~Ms м_ Яч

Ш^1

Одной из важнейших характеристик пространственной формы поверхности является кривизна. Так различают:

~к\, кг - главные кривизны, являющиеся экстремальными значениями нормальной кривизны в точке А0 поверхности;

- К~к\*к2 - Гауссова или внешняя кривизна в точке А0 поверхности;

- Н=(к\+кг)!2 - средняя кривизна в точке А0 поверхности.

Знаки двух главных кривизн позволяют определить вид поверхности в окрестности точки А0 и делят поверхности на шесть возможных классов форм (табл. I).

Гауссова и средняя кривизна могут быть выражены через коэффициенты первой и второй квадратичных форм поверхности

K_LN~M2 _ LG-2FM + EN ~ EG-F2' ~ 2(EG-F2)

Главные же кривизны к\ и к2-корни квадратного уравнения

к2 ~2Нк + К = 0. Таблица 1. Классы форм поверхностей____________

кх< 0 кг- 0 *1>0

к2<0 Вогнутый эллипсоид Вогнутый цилиндр Гиперболическая поверхность

¿2=0 Вогнутый цилиндр Плоскость Выпуклый цилиндр

к2>0 Гиперболическая поверхность Выпуклый цилиндр Выпуклый эллипсоид

Кривизна является локальной характеристикой, на которую, в отличие от глобальных свойств (например, площадь), не влияет частичное загораживание, что нередко встречается в трехмерных сценах.

В главе так же рассматривается взаимосвязь между поверхностью и ее наблюдаемым изображением. При этом для упрощения модели принимается, что поверхности обладают свойством ламбертовости, т.е. отраженный свет распространяется с равной интенсивностью во всех направлениях. Применение таких допущений находит широкое распространение в фотометрических и светотехнических расчетах. И рассматривается один удаленный источник света. Он характеризуется тем, что лучи идущие от него параллельны друг другу. Такое освещение характерно для большинства конкретных ситуаций, т.к. источники освещения обычно располагаются на расстояниях много больших чем рассматриваемый объект. В частности, при естественных условиях освещения, солнце рассматривается как удаленный источник.

Тогда по закон}' Ламберта яркость изображения элемента da поверхности

/ = /0cos(«,«c),

где JQ - интенсивность падающего излучения, Я - вектор нормали к поверхности в данной точке, пс - направление на источник света.

Так как направление на удаленный источник света в любой точке поверхности будет одинаково, то его предлагается задавать двумя углами

аир (рис. 17). Тогда справедливо

пс = sin(«)sin(/?)i + cos(a)$in(/?)J +- cos(J3)k. Вектор нормали к поверхности z=z(x, у) может быть выражен как

дх ду

п =

Рис. 17.

Far) 1 +1

Следовательно, функция яркости изображения точек поверхности 2=г(х, у) будет иметь вид

- 8т(а)зт(/?) - со5(а)яп(>!?) + со${0)

, V , дх_ду_

у \ дх ) ^ ду

В дальнейшем, в работе исследуются при различных условиях наблюдения изображения р.(дг, у) поверхностей следующих типов: конические, цилиндрические, эллипсоидные (как поверхности тел вращения) и плоскость (как поверхности призматических тел). Такой выбор ориентирован на промышленные изделия.

Так, например, можно выделить следующие самые основные отличительные особенности:

- для цилиндрических поверхностей: вектора градиентов параллельны, кривизны соответствуют таблице 1.

- для эллиптических поверхностей: вектора градиентов направлены в одну точку, кривизны так же соответствуют таблице 1.

- для конических поверхностей: вектора градиентов имеют определенный угол наклона, увеличивающийся при удалении от точки максимума функции, кривизны же соответствуют гиперболической поверхности по таблице 1.

- для плоскости: функция яркости распределена равномерно по всему полю зрения.

Разрабатываются методы построения (/-пирамиды анализа поверхностей с различной степенью точности.

Так ¿/-пирамида принятия решения о форме наблюдаемой поверхности будет на каждом своем i уровне содержать 4' поля, зрения, каждое из которых, начиная с третьего уровня, характеризуется 14 коэффициентами, описывающими данную поверхность в поле зрения уровня. Уровни с первого по второй характеризуются только шестью коэффициентами. Введены следующие коэффициенты:

1) е - наличие или отсутствие экстремума (исходя из анализа р.2> Цз, ji4. ji5). Принимает значение: 0 - нет экстремума, 1 - максимум, -1 -минимум;

2) idx, idy - возрастание или убывание функции по осям х и у (исходя из анализа щ, цл). Принимают значения: 0 - нет возрастания/убывания, 1 -возрастание функции, -1 - убывание функции;

3) g М-г) - вектор градиента;

4) к\ и к2 - главные кривизны;

5) ек\, ек2 - наличие или отсутствие экстремума функций k\(j, v)/k2(J, v) на данном уровне (/-пирамиды в ее системе координат (/V). Принимают значения: 0 - нет экстремума, 1 - максимум, -1 - минимум;

h v2 n— J\ w=v,

6) idkix, tdk\y, idk2K, idk2y - возрастание или убывание функций kx{j, v) и v) по осям дг ну. Принимают значения: 0 - нет возрастания/убывания, 1

- возрастание, -1 - убывание;

7) Р-2) - вектор градиента для kx{j, v) и gk2 =0ii; fi2) для k2(J, v). Данные коэффициенты ¿/-пирамиды позволяют достаточно просто

получить некоторые глобальные характеристики рассматриваемого уровня в его системе координат (Jv)

Л \и- j., то на [у,, j2 ] при заданном v функция возрастает по х,

\idx(n,v) =■<

[-Ui'Jil убывает.

^ fv2 - vt, то на [vj,v2] при заданном j функция возрастает по у,

У ' [-(v2-v,), убывает.

h v2

2 " количество экстремумов выделенной области уровня,

п=]I W=V[

' h v2

X Xl e(n>lто в выделенной области только шах, "=j\ m=v\

- е(п,т) только min.

Решение о форме принимается исходя из сравнения ^-пирамиды объекта и эталонов. При этом решение начинает приниматься сразу, начиная с первого уровня, на котором выдвигается первоначальная гипотеза, которая в последствии уточняется при анализе последующих уровней.

В шестой главе рассматриваются дополнительные факты, дающие информацию о наблюдаемой форме поверхности и объекте в целом.

Так, например, блик - самое яркое пятно на освещенной поверхности. Хорошо видимый человеком блик также хорошо выделяется с помощью полных и замкнутых групп.

Поверхности разной кривизны дают разные формы бликовых пятен. Так, для эллипсоида - это эллипс, для цилиндра - прямоугольник, для конуса - треугольник. Таким образом, анализ формы блика дает дополнительные данные о форме поверхности.

Так же дополнительную информацию может дать анализ теней. Тень фактически самое темное место на сцене, причем она однородна по яркости при использовании одного источника освещения. Поэтому тени легко выделить из изображения при его сегментации.

Тень всегда легко соотнести с объектом ее отбрасывающим, т.к. она всегда примыкает к объекту, а не оторвана от него. Причем она примыкает к нему всегда в области собственной тени. Расположение тени так же тесно связано с расположением бликового пятна на объекте. Тень находиться на стороне объекта обратной той, где расположен блик.

Основной источник информации, получаемой об объекте из тени является ее форма. Форма тени всегда соответствует форме объекта, но не повторяет ее. Таким образом, сравнивая признаки форм рассматриваемой тени и эталонной, мы можем судить о форме объекта.

Л Для получения более точной

информации о форме объекта по форме тени, предлагается воспользоваться методом оценивания формы тени по ее контуру. Так в контуре тени можно выделить 4 части (рис. 18): 1 - основание, форма его контура несет информацию об основании объекта; 2 - вершина, .форма ее контура несет информацию о верхней части объекта; 3 - передняя сторона, несет информацию о боковой части объекта, повернутой к камере; 4 - задняя сторона, наиболее ценна как источник информации о форме объекта, т.к. несет информацию о боковой части объекта невидимой на изображении.

Рис. 18. Контур тени. 1-основание, 2-вершина, 3-передняя, 4-задняя сторона.

Глава седьмая посвящена практическому применению разработанных методик.

Алгоритмическое обеспечение поиска двумерного объекта В настоящее время актуальна задача поиска заданного двумерного объекта или множества объектов на фото или видео изображениях. Спектр применения алгоритмов поиска достаточно широк, они применяются в робототехничёских системах при поиске роботом заданной детали для ее захвата или обработки, в картографических системах, для поиска заданного объекта на карте местности и т.п.

Разрабатывается алгоритм поиска заданного двумерного объекта. Он базируется на схеме, представленной на рис. 1., но в виду того, что трехмерная часть не используется, то обобщенную схему алгоритма можно изобразить на рис. 19.

р(х,>0

эталон

Рис. 19. Схема поиска объекта на изображении

Входной информацией для обработки является цифровое полутоновое изображение ИхМ точек представленное своей функцией яркости у) и эталон объекта поиска. На выходе выдаются координаты найденного объекта (.х°%у°).

Информационная модель определения координат подвижного объекта по одному двумерному изображению

Задача определения координат подвижного объекта по изображению находит свое применение в такой области как пассивное слежение за целью. В ней исходные данные являются видеоизображением, содержащим объект.

Положение объекта в пространстве определяется тремя координатами: ха, у0, г0. Координата не присутствует на изображении в силу того, что полученное изображение двумерная проекция. Тем не менее, все три координаты можно выразить через видимые и реальные размеры наблюдаемого объекта, исходя из искажений изображения вызываемых в камере, в виду ее работы по принципу центрального проецирования.

* =2?о£яп(£Г)8И109) , у0 =^С05(«г), Г0 = С08(/?),

IV м> м>

где: м>0 - реальные размеры объекта; - размеры объекта на изображении;

/ - фокусное расстояние камеры, которое может изменяться; а - угол

наклона камеры относительно плоскости горизонта; (3 - угол поворота

камеры.

Для определения реальных размеров объекта предлагается его идентифицировать (по схеме рис. 1). После чего его реальные размеры берутся из базы данных об объектах.

Подавление шумов

Разрабатывается так же процедура подавления шума, с целью улучшения качества изображения, не требующая априорного знания природы шума. Предлагается, уменьшая массу всех точек на изображении (изменяя яркость), следить за поведением компонент спектра, графики которых в зависимости от уменьшаемой массы, будут иметь вид представленный на рис. 20, б. Если произошло резкое искажение спектра, то процедуру уменьшения массы следует прекратить. Таким способом мы приведем точки шума к одной яркости, а это будет соответствовать полутоновому изображению без шума.

Пример обработки изображения рис. 20, а таким способом представлен на рис. 20, в.

Показано, что в общем случае, при такой обработке, нельзя полностью убрать шум из изображения, тем не менее, это позволит убрать шум, яркость точек которого не равна яркости точек объекта.

а) б) в)

Рис. 20. 20

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Разработана информационная модель формообразования объектов, основными достоинствами которой являются: анализ изображения без этапа предварительной обработки; параллельность обработки, как на разных этапах, так и выполнения самих этапов; возможность работы в условиях априорной неопределенности; обработка и принятие решения с различной степенью точности.

2. Разработана информационная модель процесса сегментации изображений в условиях априорной неопределенности и алгоритмы для сегментации бинарных и полутоновых изображений. В частности:

2.1. Введено понятие сегментирующего фильтра, позволяющего выделять области расположения объектов и разработаны алгоритмы его формирования.

2.2. Построена иерархия сегментирующих фильтров, позволяющая решать задачу сегментации изображения с различной степенью точности.

2.3. Разработана процедура тремора поля зрения, позволяющая работать в условиях зашумленности изображения.

3. Разработана информационная модель принятия решения о форме объекта по двумерным признакам. В рамках которой разработаны принципы формирования образа объекта на планигоне и процедуры построения ¿/-пирамиды описания образа с различной степенью точности.

4. Разработана информационная модель формообразования поверхностей. В частности:

4.1. Разработаны методы анализа поверхности с позиций теории активного восприятия.

4.2. Разработаны процедуры построения (/-пирамиды принятия решения о форме наблюдаемой поверхности и принципы принятия решения на ее основе.

5. Разработана информационная модель учета бликов и теней, позволяющая получать дополнительные данные о форме анализируемого объекта.

6. Разработан алгоритм поиска заданного двумерного объекта на фото или видео изображениях.

7. Разработана процедура подавления шума, не требующая априорного знания природы шума на исходном изображении.

8. Разработана информационная модель определения координат подвижного объекта по одному двумерному изображению.

Основные публикации по теме диссертации

1. Синенков Д.В. Модель процесса сегментации зашумленных изображений при неизвестных параметрах шума // Тез. докл. Всероссийской научно-техн. конф. "Информационные системы и технологии". -Н. Новгород, 2001, с. 146-147.

2. Синенков Д.В. Информационная модель процесса сегментации в условиях априорной неопределенности // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 8, -Н. Новгород, 2001, с. 37-40.

3. . Синенков Д.В. Алгоритмическое обеспечение процесса сегментации бинарных и= полутоновых изображений в условиях априорной неопределенности // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 8, -Н. Новгород, 2001, с. 41-49.

4. Синенков Д.В., Утробин В.А. Информационная модель восстановления трехмерного изображения по двумерной фронтальной проекции // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 7, -Н. Новгород, 2001, с. 73-76.

5. Синенков Д.В. Информационная модель процесса подавления шума на изображениях, в условиях априорной неопределенности // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 7, -Н. Новгород, 2001, с. 77-79.

6. Синенков Д.В. Процедура учета тени объекта при анализе его формы // Тез. докл. научно-техн. форума "Будущее технической науки Нижегородского региона". -Н.Новгород, 2002, с.134.

7. Цифровая обработка изображений: Сегментация: Методические указания к лабораторным и курсовым работам по курсу «Методы и средства обработки сигналов» / НГТУ; Сост. Д.В. Синенков. -Н. Новгород, 2003. -16с.

8. Синенков Д.В. Методы улучшения работы алгоритмов сегментации при помощи S-пирамиды. // сб. "Труды НГТУ: Системы обработки информации и управления", том 37, -Н. Новгород, 2002, с. 27-30.

9. Синенков Д.В. Алгоритмическое обеспечение поиска и узнавания объекта. // сб. "Труды НГТУ: Системы обработки информации и управления", том 35, -Н. Новгород, 2002, с. 42-47.

10. Синенков Д.В. Информационная модель синтезирующего формообразования объектов // Тез. докл. 8-й Нижегородской сессии молодых ученых (технические науки). -Н. Новгород, 2003, с.45-46.

И. Синенков Д.В. Информационная модель определения координат подвижного объекта по двумерному изображению // Тез. докл. 2-й региональной молодежной научно-технической конференции «Будущее технической науки Нижегородского региона». -Н. Новгород, 2003. с.28.

Подписано в печать 14.05.03. Формат 60x84 '/16. Бумага офсетная. Печать офсетная. Уч.-изд. л. 1,0. Тираж 80 экз. Заказ 381.

Нижегородский государственный технический университет. Типография НГТУ. 603600, Нижний Новгород, ул. Минина, 24.

13657

cLooJ-A

Оглавление автор диссертации — кандидата технических наук Синенков, Дмитрий Вячеславович

ВВЕДЕНИЕ.

ГЛАВА 1. Аналитический обзор современных методов обработки изображений, применительно к задаче определения формы объектов.

1.1. Исходные положения.

1.2. Классификация систем обработки изображений.

1.3. Современные методы анализа и определения форм.

1.4. Некоторые проблемы задач обработки изображений.

Цели и задачи.

ГЛАВА 2. Информационная модель формообразования объектов изображения.

2.1. Принципы обработки изображения системами машинного зрения

2.2. Обработка зрительной информации человеком.

2.3. Теория активного восприятия.

2.4. Информационная модель формообразования объектов изображения.

Выводы.

ГЛАВА 3. Информационная модель процесса сегментации.

3.1. Сегментирующий фильтр.

3.2. Иерархия сегментирующих фильтров.

3.3. Разметка областей (окончательная сегментация).

3.4. Алгоритмы сегментации бинарных изображений.

3.5. Алгоритмы сегментации полутоновых изображений.

3.6. Сегментация изображений при наличии шумов.

3.6.1. Сегментация по массе.

3.6.2. «Попиксельный тремор» поля зрения.

3.7. Сопоставительный анализ по скоростным и аппаратным затратам на заданном уровне разрешения с классическими методами.

Выводы.

ГЛАВА 4. Информационная модель принятия решения о форме объекта по двумерным признакам.

4.1. Формирование класса эталонов.

4.1.1. Формирование эталона объекта.

4.1.2. Формирование обобщенного эталона.

4.1.3. Построение {/-пирамиды эталона объекта.

4.1.4. Учет ракурсов.

4.2. Формирование признаков объекта.

4.3. Принятие решения.

Выводы.

ГЛАВА

§. Информационная модель формообразования поверхностей

5.1. Общие принципы анализа поверхностей с позиций теории активного восприятия.

5.1.1. Анализ поверхности с точки зрения функционального анализа

5.1.2. Анализ поверхности с точки зрения теории поверхностей '.

5.2. Ограничения на класс рассматриваемых поверхностей.

5.3. Взаимосвязь между поверхностью и ее наблюдаемым изображением.

5.4. Анализ видимых форм поверхностей различных типов.

5.4.1. Цилиндрические поверхности.

5.4.2. Эллипсоидные поверхности.

5.4.3. Конические поверхности.

5.4.4. Плоскость.

5.5. ^/-пирамида анализа поверхностей.

5.5.1. Построение {/-пирамиды.

5.5.2. Принципы принятия решения на {/-пирамиде.

Выводы.

ГЛАВА 6. Дополнительные факты, дающие информацию о ф наблюдаемой форме поверхности и объекте в целом.

6.1. Анализ бликового пятна.

6.2. Информационная модель учета тени объекта при анализе его формы.

Выводы.

ГЛАВА 7. Практическое применение разработанных методик.

7.1. Алгоритмическое обеспечение поиска двумерного объекта.

7.2. Информационная модель определения координат подвижного объекта по двумерному изображению.

7.3. Информационная модель процедуры подавления шума на изображениях, в условиях априорной неопределенности.

Выводы.

Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Синенков, Дмитрий Вячеславович

Актуальность темы

Наметившиеся в последнее время тенденции указывают на то, что современные промышленные системы быстро расширяют горизонты применения систем машинной обработки изображений, а системы машинного зрения становятся неотъемлемой частью общего плана автоматизации промышленных предприятий.

Одной из важнейших проблем, привлекающей в настоящее время пристальное внимание ученых и инженеров, является проблема автоматического анализа формы и состояния пространственных объектов, информация о которых представлена в виде изображений — фотографий, видеосигналов и т.д. Например, при дистанционных исследованиях природных ресурсов земли с помощью космических или авиационных средств необходимо анализировать форму, размеры и состояние лесных массивов, водных поверхностей, подсчитывать площади сельскохозяйственных угодий, занятых под посевы, и т.п. В медико-биологических исследованиях изображения молекул, клеток, их ядер, формируемые микроскопом, рентгеновских снимков, являются основой анализа биологических процессов и диагностики заболеваний. В ядерной физике по изображениям треков — следов, оставляемых частицами вдоль своих траекторий в пузырьковых или искровых камерах, в ядерных фотоэмульсиях, камерах Вильсона и т.д., определяют массу, заряд и другие характеристики частиц. Все новые элементарные частицы были открыты путем анализа изображений треков. В визуальном контроле на промышленных предприятиях, для обеспечения качества деталей путем проверки формы. При использовании в качестве органов зрения роботов и др.

Хорошо известно, что в настоящее время полностью автоматизировать процесс анализа и интерпретации изображений в перечисленных областях невозможно.

Дело не только в том, что для переработки больших объемов информации, содержащейся в изображении, требуются исключительно большие мощности вычислительных средств. К сожалению, полные математические модели объектов и явлений, а также процессов регистрации их на изображении, как правило, очень сложны, а в ряде случаев до сих пор в деталях и не известны. Это обстоятельство является главным препятствием на пути создания эффективных алгоритмов автоматического анализа и интерпретации сложных изображений.

Между тем многие из упомянутых выше задач на качественном уровне достаточно быстро и легко решает человек. Речь идет, например, о диагностике заболеваний по изображениям цитопрепаратов, расшифровке запутанных ситуаций на изображениях треков элементарных частиц, диагностике состояния некоторых сельскохозяйственных культур по результатам аэрофотосъемки.

Сам факт, что при этом человек достаточно хорошо представляет себе объект исследования, говорит о том, что в основе решения всех таких задач лежат достаточно представительные модели, среди которых зрительный анализатор производит выбор, основываясь на информации, представленной в изображении. Понятно, что такие модели суть не что иное, как отражение научного опыта и практической деятельности человека, но в данный момент мы имеем слишком мало указаний на то, каким образом эта сторона человеческого интеллекта может быть формализована для реализации на ЭВМ.

Вместе с тем имеется довольно обширный класс важных задач анализа изображений, с которыми ЭВМ справляется существенно лучше, чем человек. В их основе лежат простые модели процесса формирования изображений, позволяющие в той или иной степени анализировать информацию о форме объектов, содержащуюся в изображении. Однако большинство таких систем узко специализированы и для своей работы требуют априорного знания объекта исследования, что в большинстве случаев невозможно.

Вопросы распознавания изображений и анализа форм объектов получили фундаментальное развитие в работах научных коллективов Вычислительного центра РАН, Института систем обработки изображений РАН, Института проблем передачи информации РАН, Института прикладной математики и кибернетики при Нижегородском университете, кафедры вычислительной техники при Нижегородском техническом университете и др. Значительный вклад в решение проблем распознавания изображений внесли: Р.Байчи, П.Берт, А.Л.Горелик, Р.Дуда, Н.Г.Загоруйко, В.Кантони, В.В.Кондратьев, С.Левиальди, Д.Марр, М.Минский, Ф.Розенблатт, В.А.Утробин, Ю.Г.Васин, Р.Фишер, П.Харт и многие другие российские и зарубежные ученые.

Цель работы

Разработка методов и средств формообразования объектов наблюдаемой сцены в условиях априорной неопределенности.

На защиту выносятся:

1. Информационная модель формообразования объектов наблюдаемой сцены в условиях априорной неопределенности.

2. Информационная модель процесса сегментации.

3. Процедуры сегментации изображений.

4. Процедура формирования обобщенных эталонов форм.

5. Информационная модель принятия решения о форме объекта по двумерным признакам.

6. Методы анализа поверхностей с позиций теории активного восприятия.

7. Информационная модель формообразования поверхностей.

8. Методы получения дополнительной информации о форме.

Методы исследования

Работа базируется на методах системного анализа, теории активного восприятия, математической теории управления (теории групп, графов, устойчивости), теории вычислительных систем, теории поверхностей, теории распознавания образов и цифровой обработки изображений.

Научная новизна

В диссертационной работе получены следующие основные результаты, характеризующиеся научной новизной:

Разработана информационная модель формообразования объектов изображения в условиях априорной неопределенности, в рамках которой:

1. Разработана иерархия фильтров, решающая задачу сегментации изображения с различной степенью точности в условиях априорной неопределенности.

2. Разработана информационная модель принятия решения о форме объекта по двумерным признакам в условиях априорной неопределенности и методы формирования образов объектов по двумерным признакам.

3. Разработаны методы анализа поверхностей применительно к теории активного восприятия и методы формирования ^/-пирамиды принятия решения о форме наблюдаемой поверхности с различной степенью точности, в условиях априорной неопределенности.

Практическая ценность

На базе разработанных методик решены следующие прикладные задачи:

1. Разработаны алгоритмы сегментации бинарных и полутоновых изображений, а так же изображений при наличии шумов.

2. Разработана процедура подавления шума, основанная на устойчивости структуры объекта к изменениям функции яркости изображения, не требующая априорного знания природы шума на исходном изображении.

3. Разработана информационная модель определения координат подвижного объекта по одному двумерному изображению.

4. Разработано алгоритмическое обеспечение поиска двумерного объекта на заданном изображении.

Реализация результатов работы

Результаты исследований реализованы:

1. В программных продуктах НИР "Теоретические исследования и машинное моделирование процессов этапа узнавания изображений", "Теоретическое и экспериментальное моделирование процессов этапа понимания изображений" финансируемых по программе РФФИ (проекты № 01-01-00452, № 01-01-00459).

2. В программных продуктах НИР "Исследование методов распознавания и идентификации объектов", "Разработка сверхбыстрых алгоритмов идентификации объектов", финансируемых по программе ФГУП НИИИС (проекты № 3350-33-02, № 3350-25-03).

3. В учебном процессе Нижегородского государственного технического университета.

Апробация работы

Основные результаты диссертационной работы докладывались и обсуждались на следующих научно - технических конференциях и семинарах:

- Всероссийская научно-техническая конференция "Информационные системы и технологии" (Нижний Новгород, 2001);

- Научно-технический форум "Будущее технической науки Нижегородского региона" (Нижний Новгород, 2002);

- 8-я Нижегородская сессия молодых ученых (технические науки) (Дзержинск, 2003);

- 2-я региональная молодежная научно-техническая конференция "Будущее технической науки Нижегородского региона" (Нижний Новгород, 2003).

Кроме того, результаты работы докладывались на семинарах кафедры вычислительной техники Нижегородского государственного технического университета.

Публикации

Основное содержание диссертационной работы отражено в 11 печатных работах.

Структура и объем диссертации

Диссертационная работа состоит из введения, семи глав, заключения, изложенных на 184 с. машинописного текста, содержит 143 рисунка, 5 таблиц и библиографию из 96 наименований.

Заключение диссертация на тему "Методы и средства формообразования объектов изображения"

Выводы

1. Разработан алгоритм поиска заданного двумерного объекта на фото или видео изображениях области применения которого могут быть, например, поиск роботом заданной детали или поиск объекта на карте местности.

2. Разработана информационная модель определения координат подвижного объекта по двумерному изображению. Позволяющая, к примеру, реализовать алгоритм слежения за целью без дополнительных аппаратных затрат и увеличения сложности на реализацию механизма стереовосприятия.

3. Разработана процедура подавления шума, основанная на устойчивости структуры объекта к изменениям функции яркости изображения (к изменениям массы точек) и не требующая априорного знания природы шума на исходном изображении. Что позволит улучшать качество исходных изображений в различных системах машинного зрения для их последующей обработки. В частности:

3.1. Исследовано поведение компонент спектра при уменьшении массы всех точек изображения. В результате чего выявлено 3 типа зависимостей графики которых имеют: постоянный спад величины ||ij|; интервалы возрастания и убывания; участки смены знака.

3.2. Показано, что фильтры F„ графики зависимости от вычитаемой массы которых имеют интервалы возрастания и убывания или смены знака, выявляют симметрию на изображении и соответствующие им операторы V\ не принимают участия в формировании сегментирующего фильтра.

3.3. Разработан принцип определения шума или объекта во всем поле зрения, на основе анализа графиков зависимости р.; от массы вычитаемой из массы точек изображения. Это позволило отказаться от нахождения таких типов изображений с помощью пороговой обработки, в процедуре сегментации полутоновых изображений.

ЗАКЛЮЧЕНИЕ

Главным результатом диссертационной работы является разработка методов и средств формообразования объектов изображения в условиях априорной неопределенности. Решение этой научной проблемы позволяет построить высокоэффективные, функционирующие в реальном масштабе времени системы технического зрения, в областях требующих автоматического распознавания формы.

Основные научные и практические результаты работы:

1. Разработана информационная модель формообразования объектов изображения, основными достоинствами которой являются: анализ изображения без этапа предварительной обработки; параллельность обработки, как на разных этапах, так и выполнения самих этапов; возможность работы в условиях априорной неопределенности; обработка и принятие решения с различной степенью точности.

2. Разработана информационная модель процесса сегментации изображений в условиях априорной неопределенности и алгоритмы для сегментации бинарных и полутоновых изображений. В частности:

2.1. Введено понятие сегментирующего фильтра, позволяющего выделить области расположения объектов, и разработаны принципы формирования сегментирующего фильтра, на основе V\ и Pni, исходя из анализа вектора {pi}.

2.2. Построена иерархия сегментирующих фильтров, позволяющая решать задачу сегментации изображения с различной степенью точности.

2.3. Разработаны алгоритмы формирования сегментирующих фильтров для бинарных и полутоновых изображений.

2.4. Разработана процедура тремора поля зрения, позволяющая работать в условиях зашумленности изображения.

3. Разработана информационная модель принятия решения о форме объекта по двумерным признакам. В частности:

3.1. Разработаны принципы формирования образа изображения объекта на планигоне.

3.2. Разработаны процедуры построения (У-пирамиды описания образа объекта с различной степенью точности.

3.3. Определены принципы принятия решения о форме по двумерным признакам.

4. Разработана информационная модель формообразования поверхностей. В частности:

4.1. С позиций теории активного восприятия, разработаны методы анализа поверхности с точки зрения функционального анализа и теории поверхностей.

4.2. Разработаны процедуры построения ^/-пирамиды принятия решения о форме наблюдаемой поверхности и принципы принятия решения на ее основе.

5. Разработана информационная модель учета бликов и теней, позволяющая получать дополнительные данные о форме анализируемого объекта.

6. Разработан алгоритм поиска заданного двумерного объекта на фото или видео изображениях

7. Разработана процедура подавления шума не требующая априорного знания природы шума на исходном изображении.

8. Разработана информационная модель определения координат подвижного объекта по одному двумерному изображению.

Библиография Синенков, Дмитрий Вячеславович, диссертация по теме Теоретические основы информатики

1. Адамар Ж. Задача Коши для линейных уравнений с частными производными гиперболического типа. -М.: Наука, 1978. -268с.

2. Адаптивные телеизмерительные системы / Под ред. А.В.Фремке. -Л.: Энергоиздат., Ленингр. отд-ние, 1981. -248с.

3. Алоимонос Дж. Зрительное определение формы // ТИИЭР, 1988, т.76, № 8, с. 50-69.

4. Анисимов Б.В., Курганов В.Д., Злобин В.К. Распознавание и цифровая обработка изображений. -М.: Высшая школа, 1983. -295с.

5. Арене X., Лёйтер Ю. Многомерный дисперсионный анализ. -М.: Финансы и статистика, 1985.-230с.

6. Аркадьев А.Г., Браверман Э.М. Обучение машины классификации объектов. -М.: Наука, 1971.-192с.

7. Александров В.В., Горский Н.Д. Представление и обработка изображений: рекурсивный подход. -Л.: Наука. -192с.

8. Александров В.В., Горский Н.Д. ЭВМ видит мир. -Л.: Машиностроение, 1990. -139с.

9. Альберг Дж., Нильсон Э., Уолш Дж. Теория сплайнов и её приложения. -М.: Мир, 1972. -380с.

10. Бакут П.А., Колмогоров Г.С. Сегментация изображений: методы выделения границ областей // Зарубежная радиоэлектроника, 1987, № 10, с.25-47.

11. Бакут П.А., Колмогоров Г.С. Сегментация изображений: методы пороговой обработки // Зарубежная радиоэлектроника, 1987, № 10, с.6-24.

12. Белютин Э.М. Основы изобразительной грамоты. -М.: Госкультпросветиздат, 1956.-86с.

13. Берт П.Дж. Интеллектуальное восприятие в пирамидальной зрительной машине // ТИИЭР, 1988, т.76, № 8, с. 175-186.

14. Бесл Дж. Геометрическое моделирование и машинное зрение // ТИИЭР, 1988, т.76, №8, с. 90-117.

15. Бунимович Д.З. Краткий курс фотографии. -М.: Искусство, 1972. -352с.

16. Бутаков Е.А. Обработка изображений на ЭВМ. М.: Радио и связь, 1987. -240с.

17. Бэрроу Х.Д., Тенебаум Дж.М. Алгоритмическое зрение. // ТИИЭР, 1981, №5. с. 91-120.

18. Верлер К.Х. Обработка графической информации с помощью вычислительной техники: Пер. с нем./Под ред. и с предисл. Д.М. Зозулевича; Пер. А.П. Стукач, Д.Р. Шерлинг. -М.: Машиностроение, 1979. -254с.

19. Выгодский М.Я. Справочник по высшей математике. -М.: Наука, 1966. -872с.

20. Горелик A.JL, Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания. -М.: Радио и связь, 1985. -160с.

21. Грановская P.M. Элементы практической психологии. —JL: Издательство Ленинградского университета, 1988. —560с.

22. Грановская P.M., Березная И.Я. Интуиция и искусственный интеллект. -JL: Издательство Ленинградского университета, 1991. -272с.

23. Грановская P.M., Березная И.Я., Григорьева А.Н. Восприятие и признаки формы. -М.: Наука, 1981. -208с.

24. Гуревич И.Б. Проблемы распознавания изображений / Распознавание, классификация, прогноз. Математические методы и их применение, вып.1. -М.: Наука, 1989, с.280-328.

25. Денисов Д.А., Низовкин В.А. Сегментация изображений на ЭВМ // Зарубежная радиоэлектроника, 1985, №10, с.5-30.

26. Дуда Р., Харт П. Распознавание образов и анализ сцен. -М.: Мир, 1976. -511с.

27. Дюк В.А. Компьютерная психология. -Санкт-Петербург: Братство, 1994. -364с.

28. Елисеев И.И., Руковишников В.О. Группировка, корреляция, распознаваниеобразов. -М.: Статистика, 1977. -144с.

29. Жаботинский Ю.Д., Исаев Ю.В. Адаптивные промышленные роботы и ихприменение в микроэлектронике. -М.: Радио и связь, 1985. -413с.

30. Журавлев Ю.И. Об алгоритмических методах в задачах распознавания и классификации / Распознавание, классификация, прогноз. Математические методы и их применение, вып.1. -М.: Наука, 1989, с.9 16.

31. Журавлев Ю.И., Гуревич И.В. Распознавание образов и анализ изображений // Искуственный интеллект. В 3-х кн. -М.: Радио и связь, 1990. Кн. 2. Модели и методы : Справочник / Под ред. Д.А. Поспелова. -304с.

32. Завалишин Н.В., Мучник И.Б. Модели зрительного восприятия и алгоритманализа изображений. -М.: Наука, 1974. -344с.

33. Загоруйко Н.Г. Методы распознавания и их применение. -М.: Сов. радио, 1972. -208с.

34. Зеленин Е.В. Курс начертательной геометрии. -М.: Физматгиз, 1959. -386 с.

35. Ивахненко А.Г. Самообучающиеся системы распознавания и автоматического управления. -Киев: Техшка, 1969. -392с.

36. Икэути К., Канадэ Т. Автоматическое формирование программ распознавания образов // ТИИЭР, 1988, т. 76, №8, с. 186-209.

37. Кантони В., Левиальди С. Мультипроцессорные системы для обработки изображений//ТИИЭР, 1988, т.76, №8, с. 118-130.

38. Катыс Г.П. Автоматическое сканирование. М.: Машиностроение, 1969. -520с.

39. Катыс Г.П. Обработка визуальной информации. -М.: Машиностроение, 1990. -320с.

40. Козлов Ю.М. Адаптация и обучение в робототехнике. -М.: Наука, 1990. -248с.

41. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. -М.: Наука, 1974. -832с.

42. Ли Д. Вычислительные аспекты нижнего уровня машинного зрения //

43. ТИИЭР, 1988, т.76, №8, с.40-50. В 43. Литвак И. И., Ломов Б. Ф., Соловейчик И. Е. Основы построенияаппаратуры отображения в автоматизированных системах. Под ред. А. Я. Брейтбарта. М.: «Сов. радио», 1975. -352с.

44. Логвиненко А.Д. Зрительное восприятие пространства. -М.: МГУ, 1981. -224с.

45. Лотон Д.Т., Макконел К.С. Системы понимания изображений // ТИИЭР, 1988, т.76, №8, с.209-227.

46. Марр Д. Зрение: Информационный подход к представлению и обработке ^ зрительных образов у человека. -М.: Радио и связь, 1987. -402с.

47. Медынский С.Е. Мастерство кинооператора хроникально-документальных фильмов. -М.: Искусство, 1984. -223 с.

48. Минг Куай Ху. Математическая модель зрительного восприятия / Проблемы бионики: Биологические прототипы и синтетические системы. -М.: Мир, 1965, с.308-318.

49. Михели-Цанаку Э. Нейрофизиологические механизмы зрения и успехи в области нейромоделирования и машинного зрения // ТИИЭР, 1988, т.76,Г9, с.80-94.

50. Мучник И.Б. Формирование языка описания зрительных образов // Автоматический анализ сложных изображений / Сб. пер. под ред. Э. М. Бравермана. -М.: Мир, 1969, с.299-308.

51. Мушик Э., Мюллер П. Методы принятия технических решений. -М.: Мир, 1990, -208с.

52. Нарасимхан Р. Лингвистический подход к распознаванию образов // Автоматический анализ сложных изображений / Сб. пер. под ред. Э. М. Бравермана. -М.: Мир, 1969, с.22-49.

53. Нотон Д., Старк Л. Движение глаз и зрительное восприятие / Восприятие: механизмы и модели. -М.: Мир, 1974, с.226-240.

54. Павлидис Т. Алгоритмы машинной графики и обработки изображений. -М.:

55. Радио и связь, 1986. -400с.

56. Панфилов Н.Д. Школа кинолюбителя. —М.: Искусство, 1979. -223с.

57. Патрик Э. Основы теории распознавания образов. -М.: Сов. радио, 1980. -408с.

58. Пересада В.П. Автоматическое распознавание образов. -Л.: Энергия, 1970. -97с.

59. Прэтт У. Цифровая обработка изображений: В 2т. -М.: Мир, 1982. Т.2. -480с.

60. Психология машинного зрения / Под ред. П. Уинстон. -М.: Мир, 1978. -344с.

61. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. - 320с.

62. Рашевский П.К. Риманова геометрия и тензорный анализ. -М.: Наука, 1967. -664с.

63. Рашфорт К. Восстановление сигналов, функциональный анализ и интегральные уравнения Фредгольма первого рода // Реконструкция изображений / Под ред. Г. Старка. -М.: Мир, 1992. с. 15-46.

64. Розенфельд А. Машинное зрение: Основные принципы //ТИИЭР, 1988, т.76, №8, с. 10-16.

65. Розенфельд А. Распознавание и обработка изображений. -М.: Мир, 1972. -232с.

66. Садыков С.С., Самандаров И.Р. Скелетизация бинарных изображений // Зарубежная радиоэлектроника, 1985, №10, с.30-37.

67. Секачева А.В., Чуйкина A.M., Пименова Л.Г. Рисунок и живопись. -М.:

68. Легкая и пищевая промышленность, 1983. -216с.

69. Синенков Д.В. Модель процесса сегментации зашумленных изображений при неизвестных параметрах шума // Тез. докл. Всероссийской научно-техн. конф. "Информационные системы и технологии". -Н. Новгород, 2001, с.146-147.

70. Синенков Д.В. Информационная модель процесса сегментации в условиях априорной неопределенности // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 8, —Н. Новгород, 2001, с. 37-40.

71. Синенков Д.В. Алгоритмическое обеспечение процесса сегментации бинарных и полутоновых изображений в условиях априорной неопределенности // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 8, -Н. Новгород, 2001, с. 41-49.

72. Синенков Д.В. Информационная модель процесса подавления шума на изображениях, в условиях априорной неопределенности // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 7, -Н. Новгород, 2001, с. 77-79.

73. Синенков Д.В. Процедура учета тени объекта при анализе его формы // Тез. докл. научно-техн. форума "Будущее технической науки Нижегородского региона". -Н.Новгород, 2002, с. 134.

74. Синенков Д.В. Методы улучшения работы алгоритмов сегментации при помощи S-пирамиды. // сб. "Труды НГТУ: Системы обработки информации и управления", том 37, -Н. Новгород, 2002, с. 27-30.

75. Синенков Д.В. Алгоритмическое обеспечение поиска и узнавания объекта. // сб. "Труды НГТУ: Системы обработки информации и управления", том 35, -Н. Новгород, 2002, с. 42-47.

76. Синенков Д.В., Утробин В.А. Информационная модель восстановления трехмерного изображения по двумерной фронтальной проекции // Межвуз. сб. науч. тр. "Системы обработки информации и управления", вып. 7, -Н. Новгород, 2001, с. 73-76.

77. Сиран Иосиаки. Анализ массивов интенсивности с использованием знаний о сцене // Психология машинного зрения / Под ред. П. Уинстон. -М.: Мир, 1978, с.112-136.

78. Советский энциклопедический словарь/Гл. ред. A.M. Прохоров. -М.: Сов. энциклопедия, 1989.-1632с.

79. Трухаев Р.И. Модели принятия решений в условиях неопределенности. -М.: Наука, 1981. -257с.

80. Турбович И.Т., Гитис В.Г., Маслов В.К. Опознание образов: детерминированно-статистический подход. -М.: Наука, 1971. -246с.

81. Утробин В.А. Методы обработки изображений в условиях априорной неопределённости // Дисс. . д.т.н. Н. Новгород., 1997. - 409с.

82. Утробин В.А. Информационные модели системы зрительного восприятия для задач компьютерной обработки изображения: Учебное пособие. -Н.Новгород: НГТУ, 2001г. -231с.

83. Утробин В.А. Информационные модели этапа принятия решений в условиях априорной неопределенности: Часть 1 //Межвуз. сб. научн. тр. "Системы обработки информации и управления", вып. 3, Н. Новгород, 1998г. с.5-14.

84. Утробин В.А. Информационные модели этапа принятия решений в условиях априорной неопределенности: Часть 2 //Межвуз. сб. научн. тр. "Системы обработки информации и управления", вып. 4, Н. Новгород. 1998г, с.29-42.

85. Утробин В. А. Информационные модели этапа принятия решений в условиях априорной неопределенности: Часть 3 //Межвуз. сб. научн. тр.

86. Системы обработки информации и управления", вып. 6, Н. Новгород, 2000г, с.20-32.

87. Утробин В.А., Кондратьев В.В. Теория активного восприятия. -Н.Новгород: НГТУ, 1999. -316с.

88. Фишер Р. От поверхностей к объектам. Машинное зрение и анализ трехмерных сцен. -М.: Радио и связь, 1993. -288с.

89. Фу К. Структурные методы в распознавании образов. -М.: Мир, 1977. -319с.

90. Хорн Б. Определение формы по данным о полутонах // Психология машинного зрения / Под ред. П. Уинстон. -М.: Мир, 1978, с. 137-184.

91. Цзуанг Ц., Эстевалд Э., Харалик Р. Принцип максимальной энтропии в восстановлении изображений // Реконструкция изображений / Под ред. Г. Старка. -М.: Мир, 1992. С. 196 239.

92. Чекмарев А.А. Инженерная графика. -М.: Высшая школа, 1988.

93. Чэн Ш.-К. Принципы проектирования систем визуальной информации. -М.: Мир, 1994. -408с.

94. Шавров А.В., Солдатов В.В. Многокритериальное управление в условиях статистической неопределенности. -М.: Машиностроение, 1990. -160с.

95. Шильяк Д. Децентрализованное управление сложными системами. -М.: Мир, 1994. -576с.

96. Яншин В.В. Анализ и обработка изображений: Принципы и алгоритмы. -М.: Машиностроение, 1980. -112с.

97. Kanatani К. Detection of surface orientation and motion from texture by a stereological technique. // Artif. intell., vol.23, 1984, pp.213-237.