автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа
Автореферат диссертации по теме "Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа"
На правах рукописи
\/М
/уУг
7 '
ХАФИЗОВ Ринат Гафиятуллович
СИСТЕМЫ РАСПОЗНАВАНИЯ ПЛОСКИХ И ОБЪЕМНЫХ ИЗОБРАЖЕНШГПО ИХ ФОРМЕ НА ОСНОВЕ КОНТУРНОГО АНАЛИЗА
Специальность 05.12.04 - Радиотехника, в том числе системы и устройства
телевидения
Автореферат диссертации на соискание ученой степени доктора технических наук
Казань - 2009
003492754
Работа выполнена на кафедре радиотехнических и медико-биологических систем Марийского государственного технического университета
Научный консультант:
Официальные оппоненты:
Ведущая организация:
доктор технических наук, профессор
Фурман Яков Абрамович,
ГОУ ВПО «Марийский государственный
технический университет»,
г. Йошкар-Ола
доктор физико-математических наук, профессор Надеев Адель Фирадович, ГОУ ВПО «Казанский государственный технический университет им А.Н. Туполева», г. Казань
доктор технических наук, профессор Попов Дмитрий Иванович, ГОУ ВПО «Рязанский государственный радиотехнический университет», г. Рязань
доктор технических наук, профессор Петров Евгений Петрович, Вятский государственный технический университет», г. Киров
ФГУП НПО «Государственный институт прикладной оптики», г Казань
Защита состоится «22» ОН _2010 г. в часов на заседании диссертационного совета Д 212.079.04 при ГОУ ВПО «Казанский государственный технический университет им. А.Н. Туполева» по адресу: 420111, Казань, ул. К. Маркса, 31/7
Отзывы на автореферат просим присылать по адресу: 420111, Казань, ул. К. Маркса, 10. КГТУ им. А.Н. Туполева, ученому секретарю диссертационного совета
С диссертацией можно ознакомиться в библиотеке Казанского государственного технического университета им. А.Н. Туполева
Автореферат разослан «26 » о2
20-1° г.
Ученый секретарь диссертационного совета кандидат технических наук, профессор
В. Р. Линдваль
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Современный этап развития радиотехнических информационных систем характеризуется следующей общей тенденцией. Она заключается в том, что объектом их обработки являются различного рода изображения, достаточно сложные по структуре и с неоднородными статистическими свойствами. Примером могут служить телевизионные, диагностические и охранные системы, системы наблюдения за земной и водной поверхностями, ближним космическим пространством и др. Задачей таких систем является не только такая пассивная функция, как формирование самих изображений, но, в первую очередь, понимание изображений - обнаружение на сложном статистически неоднородном и многоградационном по яркости фоном представляющих интерес объектов, распознавание и оценка их параметров. Аэрокосмические сцены поверхности Земли и сцены с изображениями медико-биологических объектов относятся к наиболее сложным для обработки изображениям. Чаще всего изображения содержащихся в них объектов весьма несовершенны, обладают недостаточной по отношению к фону контрастностью, четкостью, искажены помехами и шумами. По этим сигналам оператору затруднительно принимать необходимые решения в темпе поступления изображения, т.е. в реальном масштабе времени. Особенно остро стоит эта проблема в полностью автоматизированных системах. Требуемая для решения поставленных задач производительность цифрового процессора составляет Ю^Ю1"1 и более элементарных операций в секунду, что затрудняет, а в целом ряде случаев, исключает получение результатов обработки в реальном или близком к нему масштабах времени.
В последние годы задача значительно осложнилась в связи с необходимостью обработки не только плоских, 20 изображений, но и пространственных, 30 изображений. Как показывает обзор достигнутых результатов в этой области, решение таких задач, как с теоретических, так и с практических позиций, далека от завершения. Существует немало причин для подобного вывода, но необходимо отметить, что такая часто приводимая причина как недостаточная степень развития вычислительной техники, является, на наш взгляд, второстепенной. Отсутствие результатов обработки изображений, сопоставимых по своей эффективности с возможностями человека, объясняется, в первую очередь, недостаточно развитыми теоретическими подходами. В большинстве публикаций по вопросам обработки изображений рассматриваются различные эвристические подходы и даются рекомендации в пользу слабо проверенных и сильно ограниченных методов.
Особенностью данной диссертационной работы является компромисс, состоящий в выборе упрощенной, но достаточно адекватной модели изображения, и применение на базе такой модели строгих теоретических подходов для обработки реальных изображений, основанных на теории сигналов. Рассматриваемая в диссертации упрощенная модель изображения,
представляет в аналитическом виде форму этого изображения, задаваемую ее контуром. Форма изображения является концентратором информации, содержащейся в изображении. Она интерпретируется как заданный в аналитическом виде сигнал, для обработки которого используются известные и новые разработанные в диссертации методы контурного и кватернион-ного анализа сигналов.
В экспериментальных исследованиях по психологии оператора радиолокационной станции обзора земной поверхности было показано, что процесс предварительного формирования у него зрительного образа состоит из следующих этапов: грубое различение общих пропорций изображения объекта и его положения на экране индикатора, мерцание формы, различение резких перепадов яркости, выделение отдельных деталей, восприятие формы и контура изображения объекта. Приводится гипотеза о формировании зрительного образа в сознании человека. Предполагается, что при восприятии глаз осуществляет отслеживание границы изображения объекта. В результате в сознании человека отличаются характерные особенности формы объекта. Также высказывается, мнение о том, что при восприятии в сознании человека вырабатываются два образа: образ формы и образ внутренней части изображения объекта. Вместе с тем, общепринятое определение формы объекта отсутствует. В большинстве работ, где определение этого термина является важным моментом, указывается на сложность данного вопроса.
Большой вклад в развитие теории распознавания изображений внесли: У. Прэтт, Р. Гонсалес, Т. Павлидис, Ю.И. Журавлев, В.А. Сойфер, B.C. Киричук, Ю.Г. Васин, B.C. Титов, К.К. Васильев, A.A. Потапов, Г.И.Василенко, П.А. Бакут и многие другие. Важнейшие результаты в области анализа радиотехнических сцен и распознавания образов получены учеными, входящими в Российскую общественную организацию «Ассоциация распознавания образов и анализа изображений»
Научная проблема, на решение которой направлена диссертационная работа, заключается в разработке методов распознавания изображений, инвариантных к преобразованиям переноса, масштабирования и вращения этих изображений при условии сохранении их формы. Выбор в качестве адекватной модели изображения аналитического представления формы этого изображения, задаваемую ее контуром, позволяет с единых позиций теории сигналов подходить к обработке реальных изображений. Интерпретация формы изображения как заданный в аналитическом виде сигнал, для обработки которого используются разработанные в диссертации методы контурного и кватернионного представления сигналов, должно послужить основой для применения аналитических методов обработки 3D изображений при создании новых, более совершенных, систем.
Цель диссертационной работы заключается в разработке методов распознавания плоских и объемных изображений по их форме, заданной в аналитическом виде на основе контурного и кватернионного анализа. Для
достижения этой цели в диссертационной работе решаются следующие задачи:
1) выбор пространства для представления сигналов при решении задачи распознавания изображений;
2) формирование адекватных моделей изображений плоских и объемных изображений на основе контурного и кватернионного анализа;
3) разработка аналитического представления формы плоских и объемных изображений на основе контурного и кватернионного анализа;
4) разработка методов фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений;
5) разработка методов обработки и распознавания, расположенных на плоскости и в ЗБ пространстве изображений по их форме;
6) реализация разработанных методов обработки и распознавания 20 и ЗО изображений по их форме и оценка их эффективности.
Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, контурного и кватернионного анализа, цифровой обработки сигналов и изображений, теории вероятностей, теории функции комплексного переменного, алгебры гиперкомплексных чисел, численные методы и методы математического моделирования.
Научная новизна определяется результатами, полученными в диссертации впервые, и заключается в следующем:
1. Разработаны методы распознавания двумерных и трехмерных изображений по их форме, инвариантные к преобразованиям переноса, масштабирования и вращения этих изображений.
2. Исследованы методы фильтрации комплекснозначных и кватерни-онных сигналов, задающих контуры плоских и объемных изображений. Получены аналитические соотношения для согласованной фильтрации поливекторных сигналов и выяснены механизмы работы таких фильтров. Обнаружен эффект расщепления кватернионным фильтром гармоник спектра фильтруемого сигнала.
3. Разработан метод обработки изображений на основе согласованно-избирательной фильтрации для решения задачи обнаружения изображений объектов на сложном многоградационном и статистически неоднородном фоне.
4. Разработан на базе анализа векторных полей метод детектирования формы участков ЗБ поверхности.
Практическая значимость работы.
I. Полученные методы распознавания изображений по их форме, задаваемой контуром в комплекснозначном (для 2Т> изображений) или в ква-тернионном (для ЗБ изображений) виде, применены для решения задач распознавания плоских и объемных изображений биомедицинских объектов при создании информационных автоматизированных систем поддержки хирурга.
2. Разработанный метод согласованно-избирательной фильтрации изображений позволил решить задачу обнаружения изображений объектов на сложным нестационарном фоне в ландшафтных сценах и в сценах с изображениями медико-биологических объектов.
3. На базе фильтров, согласованных с комплекснозначными и кватер-нионными сигналами, решены инвариантно к преобразованиям переноса, масштабирования, вращения и сдвига начальной точки задачи распознавания плоских и объемных изображений по их форме.
4. Разработанный метод детектирования формы участков 3D поверхности использован для решения задач визуализации пространственных изображений.
Реализация результатов работы. Теоретические и практические результаты диссертационной работы использованы в НИР «Притирка-1 К» и «Эксперт» при разработке распределенных информационных систем специального назначения ФГУП «Курский НИИ» МО РФ, а также при проведении НИР № 200/01709 («Статуэтка-УПКБ») в ОАО «УПКБ «Деталь». Результаты диссертационной работы использованы в следующих НИР, выполняемых автором в качестве исполнителя по фантам РФФИ (№№ 9701-00906, 99-01-00186, 01-01-14029, 01-01-00298, 03-01-14065д, 04-0100243, 05-01-96510 р_поволжье_а), Министерства общего и профессионального образования РФ (1997-1998 гг.), Миннауки и технологий (№0201.05.021, 1998г.), Минобразования РФ (№03.01.06.001, 2000г.), а также в НИР, выполняемых автором в качестве руководителя по г/б НИР в рамках Государственного контракта от «28» февраля 2006 г. №02.442.11.7328 ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 годы» «Единая теория обработки изображений групповых точечных объектов» (шифр 2006-РИ-19.0/001/348), а также по гранту РФФИ «Разработка методов и создание информационной технологии визуализации и сравнительного анализа сопряженных пространственных статических и динамических сцен», проект 08-01-12000-офи. Результаты диссертационной работы внедрены в учебный процесс по направлениям подготовки «Радиотехника» и «Биомедицинская инженерия».
Апробация работы. Результаты работы обсуждались на международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (Нижний Новгород, 1997; Великий Новгород, 2002; Санкт-Петербург, 2004; Йошкар-Ола, 2007; Нижний Новгород, 2008); на Всероссийской конференции «Математические методы распознавания образов» (Москва, 2003, 2005, 2009); на Всероссийской научно-технической конференции «Компьютерные технологии в науке, проектировании и производстве» (Нижний Новгород, 1999); на международной конференции «Распознавание» (Курск, 2001, 2005, 2008); на международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей В.А. Котельникова» (Москва, 2003); на региональной научно-технической конференции (Ка-
зань, 2004); на международной научно-практической конференции «Авиакосмические технологии и оборудование» (Казань, 2006); на ежегодных научных конференциях по итогам НИР МарГТУ и научных семинарах кафедры радиотехнических и медико-биологических систем и др.
Публикации. Всего по теме диссертации опубликовано 67 работ: из них 2 монографии (издательство «Физматлит», Москва); 14 -в центральных научных журналах из Перечня ВАК; 26 - материалы конференций; 18 - в других научных изданиях и депонированные в ВИНИТИ; 6 - свидетельств об официальной регистрации программ в Роспатент.
Структура и объем работы. Диссертация состоит из введения, 6 глав, заключения и содержит 140 рисунков, 8 таблиц. Список литературы включает 179 наименований. Основная часть работы изложена на 322 страницах.
На защиту выносятся.
1. Метод аналитического представления формы плоских и объемных изображений, обладающего метрическими свойствами и содержащим необходимую для их распознавания информацию.
2. Методы распознавания плоских и объемных изображений по их форме, обеспечивающие инвариантность к преобразованиям переноса, масштабирования и вращения этих изображений.
3. Методы фильтрации комплекснозначных и кватернионных сигналов, задающих контуры плоских и объемных изображений, обеспечивающие формирование достаточной статистики для принятия решения при распознавании изображений по их форме.
4. Метод обработки изображений на основе согласованно-избирательной фильтрации, обеспечивающий обнаружение изображений объектов на сложном многоградационном и статистически неоднородном фоне.
5. Метод детектирования формы ЗО изображений поверхности на базе принципа обработки множества ближайших точек генерального точечного поля и анализа векторных полей.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, сформулирована цель, направление исследований и основные научные положения, показана научная новизна и практическая значимость полученных результатов. • ! :
В первой главе исследовано современное состояние и проблемы теории обработки и распознавания изображений. Показано, что эти проблемы обусловлены действием следующих факторов: низкое отношение сигнал/шум; высокая степень детальности изображений объектов в анализируемой сцене; необходимость получения результатов распознавания в реальном или близком к нему масштабов времени; сильная статистическая неоднородность многоградационных по яркости фонов и изображений
объектов; неинвариантность применяемых алгоритмов к линейным преобразованиям изображений, в первую очередь, к их повороту; несовершенство теоретических подходов к обработке и распознаванию изображений, особенно в 3D сценах, вызванных использованием эвристических подходов.
Рассмотрен метод распознавания, относящийся к классу алгоритмов вычисления оценок (ABO). Алгоритм основан на вычислении приоритетов (оценки сходства, меры близости, меры сходства), характеризующих «близость» распознаваемого и эталонного объектов по системе ансамблей признаков, представляющей собой систему подмножеств заданного множества признаков. Важным частным случаем ABO применительно к решению задач распознавания сигналов и изображений являются алгоритмы распознавания, основанные на геометрическом подходе. В соответствии с ним, сигнал в виде непрерывной функции f(x) может обрабатываться (преобразовываться) методами математического анализа. При дискретизации функции У(лг) с интервалом дискретизации Л/ ей можно поставить в соответствие вектор и , компонентами которого являются отсчеты функции f{x). Векторный сигнал и обрабатывается с применением методов векторного анализа. По векторному сигналу и с некоторой ошибкой восстанавливается непрерывный сигнал f[x). Эта ошибка стремится к нулю при уменьшении интервала дискретизации Лt. Таким образом, бесконечномерный векторный сигнал и полностью адекватен непрерывному сигналу /(х). Если же выполняются условия теоремы Котельникова (теоремы отсчетов), то адекватность /(х) и и наблюдается и при некотором конечном значении интервала Ai. По s-мерному векторному сигналу u bs-мерном пространстве можно задать точку Т с координатами, равными компонентам векторного сигнала и . При s —> <ю наблюдается полная адекватность непрерывной функции /(х), точки т и вектора и, заданных в бесконечномерном пространстве. Отсюда следует, что для обработки сигналов с одинаковым конечным результатом, (естественно, с разными затратами и ресурсами) можно применять методы математического анализа, дискретной математики и геометрии.
Сформулирована следующая научная концепция диссертационного исследования: использование упрощенных моделей изображений объектов, не связанных со значительной потерей содержащейся в изображении информации, позволяющих исключить эвристические подходы и использовать для распознавания изображений аппарат теории обработки сигналов. Подход, основанный на этой концепции, заключается в отказе от обработки каждого элемента изображения и переходе к обработке лишь его контуров, концентрирующих содержащую в изображении информацию.
Во второй главе в качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих
сигналов, как меры схожести изображений, выбраны четыре пространства, в которых определены основные арифметических действия - сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство Я, линейное комплексное пространство С и псевдолинейные кватернионное Н и октавное О пространства. В пространстве /? возможно представление и обработка как плоских, так и пространственных (трехмерных) изображений, в пространстве С - только плоских изображений. Псевдолинейность пространства Н обусловлена некоммутативными свойствами операции умножения; в нем возможно представление и обработка трехмерных и четырехмерных изображений.
Пусть О = {я (п)}0 и Р = {р (п)}0 - два одинаковой мощности х подмножества в аффинном пространстве, задающие одноименные векторные сигналы О и Р (рис. ]). Радиус-векторы q(n) и р(л), п = 0,1,..., л — 1, назовем элементарными векторами (ЭВ) или моновекторами. Если с аффинным пространством сопоставляется линейное действительное пространство /?, то ЭВ содержат в качестве своих компонент вещественные числа, равные длинам проекций точек подмножеств на оси системы отсчета: '
2О сигналы: ч(л) = 0?1(л)><?2(л)); ${п) = (р1(п),р2{п)), п = 0,1,...,* -1, 3£> сигналы: д(п) = ((^(и),<?2(п),^3(;г)); р(п) = (р1(п),р2(п),р3(п)).
Рис. 1. 2й и 30 векторные сигналы, заданные подмножествами точек 0 и Р
Для этого случая сигналы <2 и Р - вещественные векторные сигналы. Когда с аффинным пространством сопоставляется линейное комплексное пространство С, то моновекторы сигналов О и Р задаются комплексными числами: q(л) = <7^(rt) + íl72(п); р(п) = рх(л) +1 р2(л), « = 0,1,...,5-1.
Такие сигналы назовем комплекснозначными сигналами. Если же с аффинным пространством сопоставляется псевдолинейное кватернионное пространство Н , то моновекторы представляются векторными кватернионами: {^п)^Чх(п)1 + ц2{п)] + дъ{п)к ; р(л) = р1(п)1 + р2(п)у + ръ(п)к . Подобные сигналы назовем кватернионными сигналами (КТС). Решение задачи распознавания векторных сигналов связано с формированием меры
схожести т)ш распознаваемого сигнала О = {ч (/з)}0 ^ с каждым из эта-
лонных сигналов = > т = 0,1,..., М -1, алфавита классов и
принятием, с теми или иными вариациями, решения в пользу класса, эталонный сигнал которого наиболее близок к распознаваемому сигналу О. Различие между двумя ЭВ ц и р определяется величиной реальной части скалярного произведения нормированных векторов чир.
Векторные сигналы, представленные в пространствах Я,С и И, содержат в качестве своих компонент соответственно двумерные или трехмерные декартовые координаты точек, комплексные числа и кватернионы. Каждая из таких компонент может рассматриваться в качестве вектора. Для подчеркивания этой особенности в ряде случаев векторные сигналы будем называть поливекторными. С целью обоснованного выбора пространства для представления сигналов при решении задачи распознавания изображений исследованы информативные свойства скалярного произведения поливекторных сигналов и их моновекторов в пространстве Л,С и И.
Показано, что скалярное произведение плоских изображений, в виде скалярного произведения нормированных поливекторных сигналов, заданных в пространстве /?, обладает функциональной зависимостью от угла ф между распознаваемым О и эталонным Р изображениями. Поэтому при случайном значении <р скалярное произведение не может быть использовано в качестве меры схожести плоских изображений для их распознавания. Показано, что при проведении дополнительных вычислений, связанных с поворотом изображения, решением системы линейных уравнений и рядом тригонометрических вычислений возможно получение инвариантной к повороту меры схожести. Однако при определении обратных тригонометрических функций, появляются неоднозначные значения этой меры. Для трехмерных изображений, представленных в Я, получение такой инвариантной меры возможно лишь в частных случаях, например, когда изображения расположены в одной гиперплоскости.
Исследованы свойства векторных сигналов, задающих плоские изображения в линейном комплексном пространстве С, и получено выражение для их скалярного произведения. Показано, что это произведение включает в качестве своей составной части скалярное произведение векторных сигналов в пространстве И. Реальная часть скалярного произведения многомерных поливекторных сигналов равна скалярному произведению этих сигналов в пространстве Я: Яег]с Она содержит всю информацию о схожести сигналов О и Р> которая определяется величиной расстояния между поливекторами О и Р Значение этого расстояния зависит как от угла между поливекторами О и Р, так и от различия форм, задаваемых ими изображений. Мнимая часть скалярного произведения,
а--1
равная 1т)]с = -/[</, {п)р2(п)-<7, (//)/?,(/?)] = /^чС'ОИрОфш (р(п), со-
п-О
держит дополнительную информацию о векторных сигналах. Она позволяет однозначно определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве Я, найти инвариантное к вращению изображений значение меры их схожести.
Поскольку процесс линейной фильтрации сигналов связан с последовательным вычислением значений скалярного произведения фильтруемого сигналом с сигналом в виде импульсной характеристики фильтра, то приведенные выше свойства скалярного произведения в пространстве С позволяют получить инвариантные к вращению фильтруемого сигнала результаты фильтрации. Отмечено, что платой за обеспечение подобной инвариантности является ухудшение примерно в два раза отношения сигнал/шум, вызванное необходимостью учитывать влияние шума как по косинусному, так и по синусному каналам.
Получено аналитическое выражение для скалярного произведения векторных сигналов с трехмерными моновекторами в кватернионном пространстве И и исследованы его информативные свойства. Показано, что скалярное произведение таких сигналов в пространстве И является его составной частью, а дополнительная гиперкомплексная часть обеспечивает более высокую информативность меры схожести объемных изображений.
Кватернионный сигнал (КТС) <2 = {ч(я)}0,._| представляет собой упорядоченную совокупность множества точек в аффинном пространстве, радиус-векторы <](п) которых являются элементами псевдолинейного ква-тернионного пространства //Л. и заданы векторными кватернионами. КТС О представляет поливекторный сигнал, а кватернионы ц(и), п = 0,1,...,л -1, являются его моновекторами (элементарными векторами ).
Решены прямая и обратная задачи вращения поливекторного сигнала в трехмерном пространстве. Прямая задача вращения поливекторного сигнала сформулирована следующим образом: определить вид полнвекторно-го сигнала О = то/г(|,Р , полученного в результате поворота ЗГ) векторного
сигнала Р вокруг осн. Повороту на угол ф вокруг оси, задаваемой вектором г, подвергается по отдельности каждый моновектор р;(/?), я = 0,1,...,.?-! вектора Р. Представлена оценка трудоемкость решения прямой задачи вращения в пространствах К и /У.
Получено, что применение матричных методов для поворота вектора на заданный угол ср вокруг оси с направляющим вектором г требует 55 операций сложения, умножения, деления и извлечения корня. Подобная процедура с применением кватернионов требует 43 операции сложения и
умножение, т.е. в 1,3 раза меньше. Число сложений для обоих методов одинаково, а число более сложных операций, таких как умножение, деление и извлечение корня при использовании матричных методов значительно больше. Поэтому реальный выигрыш при решении прямой задачи вращения за счет применения кватернионов может быть намного большим. Приведено количество операций для случая, когда направляющий вектор оси вращения является одновременно нормалью к собственной плоскости, в которой расположены исходный ц(п) и результирующий р(п) моновекторы. Здесь число требуемых операций меньше в 2,4 раза. Если операция вращения с одними и теми же параметрами (риг выполняется для нескольких векторов, то выигрыш в числе требуемого количества операций, обеспечиваемый кватернионами, уменьшается и при большом количестве векторов целесообразно использовать матричные методы. Причина в том, что последние требуют много операций на подготовительном этапе при вычислении элементов матрицы, а кватернионные методы -на этапе вычисления результата вращения. Разработан алгоритм оценки угла поворота распознаваемого кватернионного сигнала по отношению к эталонному сигналу своего класса на основе решения обратной задачи вращения поливекторов в трехмерном пространстве, использующего интерпретацию кватерниона как совокупность значений косинуса угла поворота и направляющего вектора оси вращения.
В третьей главе введено определение понятия формы изображения объекта как аналитического представления контура этого изображения, инвариантного к преобразованиям масштабирования, поворота и смещения начальной точки контура. В качестве понятия «форма изображения» принята следующая трактовка этого термина Т. Павлидисом: «форма Ф изображения {V представляет собой информацию, содержащуюся в его контуре Г ». Данное определение предполагает, что контур Г кроме информации о форме, дополнительно содержит информацию о параметрах его линейных преобразований Т7, или, что форма Ф является инвариан-той к представлению в аналитическом виде контура Г к ряду преобразований, которым может подвергаться изображение (У, а, следовательно, и контур Г, без искажения формы, т.е.: Ф = ¡т\Ус = ¡тТр, где 1т - обозначение инвариантности аналитического описания изображения IV к некоторым функциональным преобразованиям С или к преобразованиям /<\ касающихся аналитического описания контура Г. Минимизация расстояния между двумя контурами Г и IV, задающими соответственно формы Фг и Ф^ , приводит к устранению влияния линейных преобразований на величину этого расстояния. Минимальное значение расстояния будет мерой разности форм, если форму определить как аналитическое представление контура, инвариантное к классу преобразований Г = где ц = |ц|ехр{/Дф}, преобразование масштабирования в (ц|
раз и поворота на угол Д<р, </ - параметр сдвига начальной точки а0 на с/ моновекторов, а А - параметр смещения изображения. Выражение для вектор-формы Фт записывается в виде:
фт = |у(" - А ехр{'(ф("> «О - Аф)}}0,,-1 •
Полученное аналитическое представление для формы позволило конкретизировать наметившийся в последнее время подход к понятию формы изображения как инварианты к заданной группе аналитических преобразований этого изображения. Форма изображения содержит в концентрированном виде информацию о классе объекта, мало меняется при смене вида датчика, формирующего изображения, определяется значениями яркостей пикселей (вокселов) в приграничной части изображения и допускает простое аналитическое описание. Поэтому задание формы в качестве элемента линейного пространства, можно рассматривать как получение упрощенной, но достаточно адекватной модели изображения, допускающей обработку с позиции теории сигналов. Такая модель дает возможность применить для решения задачи распознавания изображений строгие методы оптимальной обработки сигналов и отказаться от эвристических подходов. Следовательно, выбор формы изображения в качестве сигнала соответствует принятой научной концепции диссертационного исследования.
Показано, что для решения задачи распознавания плоских изображений объектов по их форме целесообразно использовать аппарат контурного анализа в линейном комплексном пространстве С. Описаны основные подходы к заданию и преобразованию контуров изображений как зашум-ленных поливекторных сигналов с комплексными компонентами.
Выражение для элемента кода АГ в полигональном представлении имеет вид: у(я)=у1(«)+,у2(и)=|у(и)|ехр{'ф(")}' где у|(и)= Яеу(п); у2(»)= Л»г/("); |у(п)| и ф(я) - модуль и аргумент ЭВ. Достоинством подхода к описанию контуров последовательностью комплексных чисел, задающих их ЭВ, является возможность выполнять преобразования этих контуров аналитическим путем. Интерпретируя обработку полигональных комплекснозначных контуров, обладающих свойствами периодичности и замкнутости, как дискретных сигналов, можно ввести понятие сигнального контура. Этот контур представляет собой исходный (эталонный) контур Г, подвергнутый группе заданных преобразований:
г(с) = {у(с)(«1,-1 = 1Му(« + </)ехр{/[ф(« + </)+ Аф]}}0 г ).
Показано, что для решения задачи распознавания изображений трехмерных объектов по их форме целесообразно использовать аппарат ква-тернионного анализа в псевдолинейном кватернионном пространстве Н. Рассмотрены подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с кватернионными компо-
центами. Получен на базе преобразования Кели-Диксона ортогональный базис в пространстве Н в виде полного семейства элементарных кватерни-онных сигналов и выполнено разложение контура изображения произвольного пространственного объекта в виде линейной комбинации элементарных кватернионных сигналов.
К кватернионным сигналам приводит упорядоченное в трех мерном пространстве множество s точек Е ={£,(/?)}0 v_(, задающее групповой точечный объект (ГТО). Если выбрать в этом пространстве некоторую точку О и принять ее в качестве начала системы отсчета, то можно сформировать с полюсом в этой точке пучок из .v векторов Q = [</(«)}о л._| > соединяющих т. О с точками множества Е, и каждый из этих векторов будем рассматривать как чисто векторный кватернион
(/(„)=(,,) • / + Чг {,,). ¡ + (/з („).*, //= 0,1,...,л -1, где /, / и к - мнимые единицы. В отличие от умножения вещественных и комплексных чисел, операция умножения кватернионов является некоммутативной: (/ = -,//, ¡k ~ -ki, jk = -kj. Кватернионы тесно связаны с комплексными числами и выражаются через них. Их можно представить как сумму двух комплексных чисел, одно из которых берется с весом, равным мнимой единице.
При повороте КТС на угол 2ф вокруг оси, направление которой определяется единичным вектором г, на данный угол поворачиваются все радиус-векторы сигнала вокруг оси: Q(p ;. , где b - вращающий кватернион, имеющий вид
b = />о + b^i + bi j + byk - coscp + rsin ф.
КТС Q со смещенной на величину d нумерацией его кватернионов записываются в виде Q^ = {q{n~d\)s^ . В обшем случае масштабированный в |[л| раз, повернутый на угол 2ф вокруг оси, задаваемой единичным вектором /-, со смещенной на величину d нумерацией кватернионов КТС Q представляется как b {q{n-d)}(i /Г1.
Для получения аналитического представления формы 3D изображения использован такой же подход, как и при получении формы плоского изображения. В качестве тестового изображения выбран пространственный дельтовидный контур
обладающий в классе замкнутых контуров непрерывным спектром. Элементарные векторы d(n), « = 0,1,...,.у-1, задаются векторными кватернионами
■d(n)= d\(n)i + d2(n)j + dj(n)k . Требование равномерности спектра С|)д дельтовидного пространственного контура Од накладывает требование на равномерность спектра составляющих КТС комплексных сигналов ТЛ и
\УД. Получено аналитическое представление формы пространственного изображения при выборе пространственного контура Вд в качестве тестового. Вектор-форма Ф записывается в виде:
Рассмотрен вопрос об аналитическом представлении контуров плоских изображений в виде непрерывной, недискретизированной на сетчатке рс-цепторного поля, линии. Такой контур задан функцией комплексного переменного. Контур Х = {х}о£ в виде непрерывной замкнутой кривой на
комплексной плоскости задан в виде х(/) = Х1(0 + Х2(0 = |х.С)|ехр{'ф(0Ь
где 0</< I -длина контура, |х(/)| = д/х?(0 + Х2(0 и ф(0 = а^х(/) -амплитудное и фазовое представление функции %(1). При многократном обходе вдоль замкнутой кривой контур X можно представить как периодическую функцию с периодом I, т.е. х(0 = + ^Ь), а = 0,±1, ±2,... . Получено выражение для скалярного произведения непрерывных контуров и рассмотрены его свойства. Найдены аналитические выражения для элементарных контуров, полное семейство которых задает ортогональный базис. Рассмотрено преобразование Фурье непрерывной контурной линии и исследованы его свойства.
В четвертой главе рассмотрены вопросы фильтрации К'ГС. Получены аналитические соотношения для согласованной фильтрации КТС и выяснены механизм работы таких фильтров. Показано, что их основная особенность по сравнению с фильтрами для вещественных и комплексно-значных сигналов заключается в расщеплении каждой ш-ой гармоники входного сигнала на две: одна по частоте соответствующей исходной, на частоте т, другая - на зеркальной частоте V - т
Следствием этого является нарушение привычного для линейных систем соответствия между спектрами входного и выходного сигналов, хотя для кватернионных фильтров принцип суперпозиции не нарушается: если НА и Нв - реакции фильтра на входные КТС А и В, а НА+В - на сумму этих КТС, то НА+В=НА+НВ. Такое поведение фильтра обусловлено некоммутативностью операции перемножения кватернионов. В математическом плане эффект расщепления гармоники входного сигнала на исходную и зеркальную вызван следующим отличием алгебры кватернионов от
алгебры комплексных чисел. Если Гт =|ехр|/—шг||
л
ортогональный базис в комплексном линейном пространстве С , то операция сопряжения ЭК Г,„ не приводит к выходу из этого базиса, т.е.
.271
т-\еЩ-1—тп
0,л-|
есть компонента базиса {гт}0 , равная
. Поэтому линейная фильтрация как сигнала Гт , так и сигнала Г,„ ,
характеризуется монохроматичностью выходных сигналов, т.е. Гт и Г*, - это собственные векторы линейного оператора фильтрации, а частотный коэффициент передачи т(т) - характеристическое число этого оператора.
Если же {(?т}0 х_|, Q„г = Г„,(| +7')=|ехр|/у/«я|(1+;)| - ортогональный базис в кватернионном пространстве, то операция сопряжения из-за некоммутативности операции умножения является причиной выхода
кватсрнионного сигнала <}*т = (I - = (1 - у')г,_т за пределы базиса,
т.е. если {(?с,О„,} = 0 при от*е,то ^с'Фш)*0-
В связи с этим операция кватернионного сопряжения, выполняемая в процессе фильтрации, приводит к появлению на выходе фильтра зеркальной частотной компоненты, отсутствующей во входном сигнале. В результате частотный коэффициент фильтра имеет уже не скалярный, а векторный характер. Компоненты этого вектора (оисх и <х>эерк определяют реакцию фильтра на гармонику входного сигнала с частотой т, вызывающую отклик на частотах т и 5- -т. В том случае, когда процесс фильтрации не сопровождается операцией сопряжения, например, у фильтра скользящего среднего, расщепление входной гармоники не происходит.
м„„(0)+
Рис. 2. Влияние систра входного сигнала КвЛФ на образование гармоник спектра выходного сигнала (.? = 4)
0 I 2 3 т
При фильтрации произвольного КТС в образовании / -ой гармоники спектра выходного сигнала принимают участие I -ая и (х-/)-ая гармоники входного сигнала соответственно с коэффициентами передачи о>исх(1) и
(/). Таким образом, КТС Й = {ю(/)}0 частотного коэффициента передачи фильтра состоит из элементов ы(/), каждый из которых пред-
зерк
ставляет собой двухкомпонентный вектор со(/) = (о) „„(/); ш крк (/ )|,
/ = 0,1,...,л'-1. Первая компонента является коэффициентом передачи по частоте исходной гармоники, а второй - по частоте зеркальной гармоники (рис. 2).
Показано, что кватернионный фильтр представляет собой совокупность из двух параллельно работающих звеньев: комплексного и гиперкомплексного (рис. 3). В момент № = ¿--1 реакция кватернионного фильтра на согласованный с ним сигнал, как и у комплекснозначного фильтра, представляет собой вещественный сигнал, равный по величине энергии фильтруемого сигнала. Это максимально возможная по величине реакция фильтра на произвольный нормированный входной сигнал. Следовательно, в момент т = 5-1 на выходе фильтра образуется пиковый по величине сигнал.
1'ис. 3. Струюура кватернионного ' фильтра
Показано, что обнаружение изображений объектов на сложном многоградационном по яркости фоне должно осуществляться на основе пространственного фильтра, учитывающего статистические свойства широкополосного и фонового шумов.. Реальные сцены природных ландшафтов и медико-биологических объектов характеризуются сильной статистической неоднородностью. Модели реальных ландшафтных сцен и сцен медико-биологического содержания имеют аддитивно-мультипликативный характер: /(*,>■)= Яо + 8(х'УЬ(х>у)> гае Яо " постоянная составляющая яркости, обеспечивающая условие /(х,у)> 0.
Одномерные АКФ в сценах природных аэроландшафтов, вещательного телевидения и с изображениями медико-биологических объектов в пределах локально-однородной области хорошо аппроксимируются экспоненциально-косинусной функцией вида: /?(£,)= ехр{-а/^}созрЕ,, где
сгвх - дисперсия фонового шума, а - декремент затухания непериодической, а Р - круговая частота периодической составляющей АКФ. В рамках принятой модели, несмотря на ее значительно более сложный, чем у аддитивной модели вид, ЧКГ1 Н(\чх, оптимального фильтра усложняется незначительно:
н{а>х,0)^)= С • >('„){ 2 ехр{- ¿(шхх0 + <о},у0)},
где *">*((0^,(0^,] - спектр сигнала - спектральная плотность бе-
лого шума, х0,у0 - координаты центра тяжести изображения,
^(шд.,©^ - энергетический спектр функции фона С - норми-
рующий множитель. Согласованное звено оптимального фильтра не изменилось, а ЧКП фоноподавляющего звена стал равен
Задача обнаружения начальной точки контура изображения объекта в рамках принятой модели ставится аналогично задаче обнаружения самого объекта, только вместо функции яркости всего изображения обна-
руживается наличие в смеси функции яркости у(дг,^) только границы Г. Фильтр обнаружителя, начальной точки контура изображения должен содержать два звена: фоноподавляющее и согласованное с формой скачка яркости на границе фон/объект.
Для формирования меры схожести форм изображений принят метод согласованно-избирательной фильтрации, Он основан на том, что спектральная плотность мощности фона в реальных ландшафтных сценах и в сценах с медико-биологическими объектами в области высоких пространственных частот хорошо аппроксимируется функцией квадратичной гиперболы. Учитывая, что при описании спектральных свойств изображений фонов интерес представляет область высоких пространственных частот, а область низких частот содержит избыточную информацию и оказывает мешающее воздействие на процесс опознавания, целесообразно обеспечить согласование фильтра с сигналом не во всем диапазоне его спектра, а лишь в высокочастотной части, для которой функциональная зависимость для спектральной плотности фона известна. В этом случае удается получить в общем виде аналитическое описание оптимального фильтра в составе обеляющего и согласованного звеньев. Согласованно-избирательный фильтр осуществляет корреляцию фильтруемого изображения с контуром, т.е. с формой эталонного и в пространственной области реализуется в виде свертки фильтруемого сигнала с лапласианом эталонного сигнала. Выходной сигнал СИФ с точностью до константы равен второй производной сигнала обычного согласованного фильтра.
Рассмотрены вопросы согласованно-избирательной фильтрации одномерных, 20 и 30 скачков и импульсов яркости с прямоугольными, линейными и параболическими фронтами. Приведены графики зависимостей входного двх(тф) и выходного ¿/вых(тф) отношения сигнал/шум для СИФ
при условии, что дисперсия СрХ(хф) фонового шума на входе равна единице, а параметры АКФ фонового шума выбраны равными а = Р = 0,1. Приведена зависимость выигрыша >(тф) в отношении сигнал/фоновый
шум при фильтрации линейного скачка яркости, как функции длительности фронта Тф . Получено, что выигрыш максимален для фильтра, избирательно согласованного с прямоугольным скачком яркости.
В пятой главе рассмотрены вопросы обработки и распознавания, расположенных на плоскости изображений по их форме. Решена задача обнаружения зашумленного контура N. В отличие от классической постановки задачи обнаружение сигнала на фоне белого шума, здесь имеются следующие особенности. Во-первых, из-за двумерного характера задачи имеются два неинформативных угловых параметра — угол поворота и сдвиг начальной точки сигнального контура. Второй параметр задается не угловыми единицами измерения, а количеством элементарных векторов. Во-вторых, закон распределений вероятностей значений масштаба зависит от способа формирования изображений. При этом часто масштаб является не случайной, а просто неизвестной величиной.
Рассмотрены особенности решения задачи обнаружения, когда в качестве сигнала используется зашумленный контур N = Г^ + Ъ , где Г^ -сигнальный контур. Устройство обнаружения содержит формирователь скалярного произведения ФСП и пороговое устройство Г1У. Получены по методу максимального правдоподобия оценки параметров Аф, ||д| и с1 зашумленного контура N по результатам его фильтрации фильтром согласованного с эталонным контуром Г. Оценки найдены по значению векторного отсчета фильтра с максимальным значением модуля. Оценки угла поворота Аф равна аргументу вектора, оценка растяжения - отношению модуля вектора к квадрату нормы эталонного контура, а оценка сдвига начальной точки контура Г'с) инкрементированному номеру вектора.
л
Рис. 4. Структура устройства оценки параметров зашумленного контура
Устройство оценки параметров зашумленного контура содержит согласованный с контуром Г фильтр КСФ, формирователь ФМ модулей отчетов этого фильтра и экстремальное устройство ЭУ, определяющее параметр да0 отсчета с максимальным модулем (рис. 4). По номеру м0 выделяется соответствующий отсчет и далее определяются оценки , Аф и ¡ц| параметров сигнального контура Г^.
На рис.5 представлен пример решения задачи обнаружения заданного фрагмента береговой линии на изображении участка места. Максимальный на графике модуля нормированного выходного сигнала фильтра отсчет соответствует моменту, когда окно фильтра совместилось с искомым фрагментом. Область, выделенная маркером, соответствует решению, принятому обнаружителем о положении этого фрагмента.
Решена задача оптимального распознавания контуров изображений, заданных поливекторными комплекснозначными сигналами. Показано, что для принятия решения о классе формируется статистика в виде отношения функций правдоподобия зашумленного распознаваемого контура N и контура эталонного изображения проверяемого класса.
б)
С-Ш
В)
Рис. 5. Обнаружение «данного фрагмента береговой линии: а) исходная сцена, 6) контур заданною фрагмента, в) контур протяженного участка береговой линии, г) результат обнаружения фрагмента, д) реакция контурного согласованного фильтра
Важным для принятия методики диссертационного исследования является тот фактор, что эта статистика для случая нормально распределенных шумов сводится к величине расстояния между поливекторами. При переходе к нормированным значениям всех поливекторных сигналов, как распознаваемого, так и эталонных, то такой статистикой будут служить скалярные произведения соответствующих контуров. Если кроме условия нормированное™, потребовать выполнение условий совпадения начальных точек и нулевого значения угла поворота между распознаваемым и эталонным контурами, то задача распознавания плоских зашумленных изображений по их форме сводится к задаче распознавания их контуров.
Исследовано влияние поворота распознаваемого изображения относительно эталонного изображения своего класса и показано при увеличении угла поворота <р эффективность распознавания уменьшается до нулевого значения даже при отсутствии шумов. Показано, что оптимальный алгоритм распознавания контура со случайным углом поворота <р заключается в формировании модуля скалярного произведения распознаваемого контура N с каждым из эталонных контуров и принятия решения в пользу класса, для которого величина этого модуля максимальна.
Рассмотрено применение полученного алгоритма распознавания к алфавиту плоских изображений. Результаты эксперимента по распознаванию незашумленного изображения с контуром N = ехр{/ф]г0 в алфавите переменного объема N1=2,3,4,5 и поворота Г0 на произвольный угол ф приве-
Рис. 6 Зависимости вероятности Рпр для объекта клйссй Ли от уиш ф
График 1 соответствует распознаванию по критерию максимума модуля скалярного произведения (1М,Г,„), 111=1,2,3,4; т-1,2,3; т=1,2 и
Для этого графика вероятность Рпр везде равна единице, т.е. принятый критерий обеспечивает инвариантность результатов распознавания при любом значении угла поворота ср. Графики 2-2', 2-2", 2-2™ соответствуют результатам распознавания незашумленного контура Г() по критерию максимума реальной части скалярного произведения (1\, Г,„) при разных значениях объема алфавита. Как следует из этого семейства графиков, вероятность Р„р принимает либо нулевое, либо единичное значение,
причем зона нулевых значений Рпр расширяется по мере увеличения объема алфавита. Таким образом, подтверждается, что даже при полном отсутствии шумов при задании сигналов в действительном пространстве 7? существует обширный диапазон углов поворота контура Г0, при котором форма изображения класса А0 не может быть распознана. На рис. 6,6 при-
ведены результаты распознавания зашумленных изображений по их форме. Отношение к сигнал/шуму в контуре распознаваемого изображения
класса А0 равно евх = 20,6 . Графики 1 и 2 построены для критерия максимума реальной части скалярного произведения, причем график 1 относится к случаю, когда алфавит имеет объем М=5, а график 2 - для случая А/=2. Из этих графиков видно, что появление шумов в распознаваемом сигнале и рост объема алфавита приводит к расширению зоны с очень низким значением Рпр. Графики 3 и 4 характеризуют процесс распознавания по критерию максимума модуля скалярного произведения. Влияние шумов привело к снижению вероятности Рпр, но зато эта вероятность не меняется при повороте распознаваемого контура. Уменьшение объема алфавита (график 4) способствует росту вероятности Рпр.
На рис. 7,а приведены графики, характеризующие снижение эффективности распознавания в случае, когда решение о распознавании принимается по критерию максимума реальной части скалярного произведения (графики 1 и 3).
Рис. 7. Зависимость Р„р для объекта класса Ag : а - от отношения сигнал/шум е2 в распознаваемом сигнале; б - от количества накопленных значений скалярных произведений
Возможность распознавания при <р = 180° также характеризуется графиком 1, а график 2 указывает на резкое снижение эффективности распознавания по критерию максимума Re(N, Г,„) при повороте распознаваемого изображения на угол <р = 180°. На рис. 7,6 представлены графические зависимости вероятности правильного распознавание от количества накопленных значений п скалярных произведений распознаваемого и эталонных сигнала. Для принятия решения в зависимости от применяемого алгоритма выбирались либо модуль, либо реальная часть нормированного по значению п накопленного комплексного числа. Отношение сигнал/шум в
распознаваемом сигнале равно е -2.
Решена задача о виде алфавита изображений с оптимальными по критерию максимума вероятности правильного распознавания формами. Такой алфавит состоит из М=я классов изображений. Контуры всех классов изображений составляют полное семейство элементарных контуров, образующих « - мерный ортонормированный базис. Высокая помехоустойчивость распознавания, обеспечиваемая таким алфавитом, объясняется нулевым значением меры схожести между эталонами разных классов. На рис. 8 приведены результаты распознавания зашумленного изображения, форма которого задается контуром Г0 = {|, 1,1, |}. Алфавит состоит из полного
семейства элементарных контуров размерности 5 = 4: Г, = {|,/,-!,-/}; Г2 = {1,-1,1,-1}; Г3 = {1,-1,-1,/}.
Рис. 8. Зависимость вероятности правильного распознавания зашумленного -элементарного контура
Го в алфавите {гт}0, от угла
поворота: 1 - по критерию максимума модуля скалярного произведения, 2 - по критерию максимума реачыюй части скалярного произведения
|М) 1X1) 211) 24П :7<| V* т
Решена применительно к ландшафтным сценам и к сценам медико-биологического содержания задача обнаружения контуров изображений объектов на сложных многоградационных по яркости коррелированных фонах. Решение задачи обеспечивается особыми свойствами АКФ фонов в этих сценах. Рассмотренный в данной главе обнаружитель использует для формирования статистики принцип согласованно-избирательной фильтрации. На рис. 9 приведены характеристики обнаружения прямоугольного скачка яркости на фоне силыюкоррелированного шума. л
1
0,8 0,6 0,4 0,2
Л1.М2.
¡■ -02 /
V У ; п ■ ■!— - -
/17
У 7 — — —
_ ______
9«
0,4 0,8 1,2 1,6
Рис. 9. Характеристики обнаружения границы при использовании фильтра, избирательно согласованного с прямоугольным скачком яркости
Существует важный класс объектов, для которых можно принять решение об обнаружении контура их изображений не по одной, а по значительно большему количеству его точек. Таким классом являются объекты антропогенного вида, границы изображений которых содержат протяжен-
ные прямолинейные фрагменты. Если фрагмент такой границы расположить вертикально к направлению строк сцены и сложить яркости строк, через которые проходит этот фрагмент, то возникает скачок яркости, значительно превосходящий по величине значение яркости остальных изображений в других точках суммарной строки. В результате накопления энергии всех пикселов прямолинейного участка контура изображения создаются благоприятные условия его обнаружения. Поскольку ориентация прямолинейного фрагмента контура произвольна, описанную выше процедуру необходимо проводить для целого ряда сцен, получаемых последовательным поворотом исходной на небольшой угол. Решение об обнаружении принимается только для той сцены, в которой эта граница расположена вертикально. На рис.Ю приведены характеристики обнаружения прямолинейной границы при накоплении N=10 и N=100 строк.
В О
а 6
Рис. 10. Характеристики обнаружения прямолинейной границы: а - дня N = 10 ; б-для N = 100 . Фильтр избирательно согласован с прямоугольным скачком яркости
В шестой главе в соответствии с концепцией диссертационного исследования для обработки и распознавания, расположенных в ЗЭ пространстве изображений объектов использованы упрощенные модели, не связанные со значительной потерей информации, но позволяющие привлечь для этого строгие методы теории сигналов. Эти модели задают форму объекта, задаваемую его нормированным вектор-контуром (оболочкой), с фиксированной угловой ориентацией и фиксированной начальной точкой.
Получена базовая процедура обработки 30 поверхностей, заданных зашумленным полем отсчетов (глобальным множеством точек). Процедура основана на принципе МВТ (множества ближайших точек): участок 30 поверхности в пределах 30 окрестности с центром в текущей точке (полюсе) при достаточно малом радиусе сферы имеет плоскую форму. Принцип МВТ является основой для операции планиметрии - кусочно-ломанной аппроксимации произвольной ЗЬ поверхности множеством плоских участков, а также векторного поля с амплитудно-угловой модуляцией, адекватно связанного с формой подстилающей 30 поверхности.
Базовая процедура выполняется для каждой точки глобального множества и содержит следующие операции: низкочастотную фильтрацию точек глобального множества, формирование текущего МБТ, получение средней нормали к плоскости МБТ и уравнения этой плоскости, вычисление контура МБТ, проецирование точек МБТ на плоскость МБТ и оценка погрешности аппроксимации МБТ плоскостью.
Решена задача планиметрии произвольной зашумленной 30 поверхности. На основе принципа МБТ каждой точке генерального множества был поставлен в соответствие участок плоской поверхности, ограниченный контуром МБТ (сегмент). Множество сегментов образует чешуйчатого типа 313 поверхность, покрывающую исходную 30 поверхность. Для получения плоскосегментированной 30 поверхности оставляются лишь непересекающиеся между собой сегменты. На рис. 11 представлена структура алгоритма планиметрии 30 поверхности.
Рис. 11. Структура операции планиметрии произвольной 30 поверхности
Получена векторно-полевая модель произвольной 30 поверхности. Элементом векторного поля служит средняя нормаль к плоскости МБТ. Исследована информативность такого поля и показано, что аргумент вектора определяет ориентацию текущего сегмента, а его длина зависит от степени неровности участка поверхности в пределах соответствующего МБТ. Для возможности разрешения расположенных на 30 поверхности фрагментов с одинаковыми параметрами своих векторных полей введена необходимая классификация исходного точечного поля: инцидентность точек и коммутативность точек генерального множества. При этом, векторным полем ЗО поверхности называется совокупность нормалей -1 к каждой точке генерального множества
В зависимости от формы фрагмента поверхности нормали его векторного поля Л„ будут обладать некоторым общим свойством Е. Оно задает закон амплитудной и фазовой модуляции векторов Если же поверхность содержит несколько фрагментов, обладающих одним и тем же свойством, то такие фрагменты можно разрешить на основе свойств связности точек генерального множества поверхности /\
Решена задача детектирования формы участков 30 поверхности. Получены основанные на результатах анализа векторных полей алгоритмы детектирования фрагментов плоской, цилиндрической, сферической и конической форм. Показано, что детектирование фрагментов с произвольными формами может быть реализовано в общем случае на базе кватернионных согласованных фильтров, импульсные характеристики которых отражают закономерности этих форм. На базе проволочных моделей распознаваемого и эталонных объектов были синтезированы оптимальные алгоритмы распознавания изображений полностью известных 31Э объектов по их форме, задаваемой ассоциированным с ним многогранником. Также были получены алгоритмы распознавания изображений с неизвестным номером начального кватерниона проволочной модели, основанные на применении кватернионных согласованных фильтров, и алгоритмы распознавания объектов при неизвестной величине угла между распознаваемым изображением и эталонным изображением своего класса. На рис. 12 представлен пример многогранника и его проволочная модель.
а)'
б)'
Рис. 12. Многогранник и его проволочная модель
Структура устройства распознавания точно известного КТС приведена на рис. 13.
ФСП 0 (CU»0> MQ,Po»
в
f*
ФСП 1 Re(aPi) ь
о
^
i
^Í-V 1 ё
s
MQ,PM-I)
номер
класса -►
Рис. 13. Структура устройства распознавания полностью известного КТС О
i,- , (аРм-i)
В случае распознавания многогранников с неизвестным номером начальной точки проволочной модели для принятия решения о классе сигнального КТС необходимо сформировать для эталонного сигнала каждого из классов не одно, а s-1 скалярных произведений. Данную процедуру pea-
лизуют кватернионные фильтры, согласованные с каждым из М эталонных сигналов и обрабатывающие один и тот же входной сигнал (рис. 14).
Rea
«вСФ 1 а Re п, ЭУ1.1
п.,
Reo,.,
Рис. 14. Структура распо-класса знающего устройства
-*■ изображений ЗП объектов
с неизвестным номером начального кватерниона проволочной модели
В отличие от контурных согласованных фильтров аналогичные кватернионные фильтры не инвариантны к углу поворота фильтруемого КТС. Это следует из неинвариантности модуля скалярного произведения двух КТС при вращении одного из них. В связи с этим появляется зависимость принимаемого решения от угла поворота распознаваемого многогранника С относительно эталонного многогранника класса /, к которому принадлежит р. Поэтому при формировании мер схожести перед получением скалярных произведений (О, Р,„), т-0, 1,...,а-1, необходимо оценить угол поворота <рт многогранника О относительно эталонного многогранника Р„,. Поскольку класс распознаваемого КТС <2 неизвестен, необходимо оценить значение <р для эталонных многогранников всех з классов. Далее при сравнении распознаваемого КТС <2 с эталонным сигналом Р,„, /а = 0,1,...,5-1, КТС О поворачивается на угол -ф„,, т = 0,1,...,5-1. В результате исходная задача сводится к задаче распознавания полностью известного сигнала. Структура распознающего устройства для данного случая приведена на рис. 15. По сравнению со структурой устройства для полностью известного сигнала здесь в каждом канале состоит корректор угла поворота (КУП), решающий обратную задачу вращения кватернион-ного сигнала.
РоХ—--1
<Ро
ФСПО
J-
ФСП 1
Re
КУП М-1 <рм. ФСП М-1
Re
I
Mjp
Рис. 15. Структура устройства распознавания КТС с неизвестным углом поворота
Неинвариантность модуля скалярного произведения КТС к величине угла их взаимного поворота в значительной степени, по сравнению со случаем комплекснозначных сигналов, усложняет процедуру распознавания. В связи с этим значительный интерес представляют подходы к распознаванию КТС, свободные от дополнительных по сравнению с комплексно-значными сигналами операций. Один из таких подходов базируется на задании квагернионного сигнала в собственной системе отсчета. В этом случае все амплитудные и фазовые данные для текущего кватерниона задаются относительно кватерниона с предыдущим номером либо по отношению к интегральной характеристике всего КТС. Рассмотрен один из подходов к заданию КТС в собственной системе отсчета. Такое представление может быть получено при использовании свойства конформности (сохранения углов между кватернионами) операции вращения векторного КТС, т.е. угол между двумя кватернионами ц{п) и ^(и + 1), сохраняется при любых вращениях КТС <2 в пространстве.
Сложность обработки изображения компактно расположенной в пространстве группы точечных объектов по сравнению с изображением сплошного объекта заключается в проблеме однозначного восстановления непрерывной функции по ее дискретным отсчетам. Однозначность достигается при переходе от изображения группы точек к полигональной, пространственно расположенной линии, проходящей через эти точки. Такую линию можно получить, если пронумеровать точки объекта и соединить их в порядке нарастания номеров. Если теперь задать в аналитическом виде каждое звено этой линии ("проволоки"), то получим аналитическое представление пространственного группового точечного объекта (проволочную модель ПГТО). На основании этой модели можно вычислить значение мер схожести распознаваемого ПГТО с эталонными ПГТО каждого класса алфавита и обоснованно отнести его к одному из классов. Проблема такого подхода состоит в обеспечении устойчивого аналитического описания ПГТО в виде проволочной модели к масштабированию и вращению ПГТО в условиях действия координатных шумов. Для получения аналитической модели ПГТО ему ставится в соответствие (ассоциируется) непрерывный пространственный объект - выпуклый многогранник, в который в качестве его вершин встроены граничные точки ПГТО. На базе подмножества оставшихся точек ПГТО строится следующий выпуклый многогранник, вершинами которого служат граничные точки этого подмножества и т.д. Доказаны теорема существования таких многогранников и теорема единственности получения одного и того же многогранника независимо от выбора начальной точки ПГТО, с которой начинается процесс построения. Теоремы существования й единственности обуславливают получение одного и того же, с точностью до параметров поворота и масштабирования, ассоциированного с ПГТО многогранника.
Разработана методика нумерации граней ассоциированного с ПГТО выпуклого многогранника и упорядочения (нумерации) его вершин. Результатом данной процедуры является проволочная модель ПГТО, являю-
щаяся его аналитическим представлением в виде кватернионного сигнала. Оценена устойчивость проволочной модели и отмечена тесная связь этого параметра с устойчивостью формы ПГТО. Приведены результаты эксперимента по распознаванию зашумленных ПГТО в зависимости от их размерности ^ и объема алфавита М. Как видно из графиков на рис. 16, для выбранного алфавита ПГТО, как рост размерности объекта, так и увеличение дисперсии координатного шума снижают вероятность правильного распознавания.
Разработана аналитическая модель ПГТО, учитывающая не только пространственные координаты его точек, но и их яркость. Основой модели является полный кватернион, векторная часть которого задает положение точки в пространстве, а вещественная - уровень излучаемой ею энергии -яркость, цвет и др. Показано, что использование яркостного портрета ПГТО повышает устойчивость проволочной модели ПГТО для случаев, когда грани ассоциированного многогранника слабо отличаются друг от друга по форме.
1. В качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих сигналов, как меры схожести изображений, выбраны четыре пространства, единственные, в которых определены четыре арифметических действия - сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство Я, линейное комплексное пространство С и псевдолинейные кватернионное Н пространства. В пространстве Я возможно представление и обработка как плоских, так и пространственных изображений, в пространстве С - только плоских изображений, в пространстве Н -представление и обработка трехмерных и четырехмерных изображений.
2. Показано, что для решения задачи распознавания плоских изображений объектов по их форме целесообразно использовать аппарат контурного анализа в линейном комплексном пространстве С. Описаны основные подходы к заданию и преобразованию контуров изображений как зашум-
Рпс. 16. Зависимости вероятностей правильного распознавания зашумленного ПГТО класса А\ от СКО координатного шума для трех значений размерности объекта
ОСНОВНЫЕ РЕЗУЛЬТАТЫ
ленных поливекторных сигналов с комплексными компонентами. Исследованы свойства векторных сигналов, задающих плоские изображения в линейном комплексном пространстве С. Показано, что для решения задачи распознавания изображений трехмерных объектов по их форме целесообразно использовать аппарат кватернионного анализа в псевдолинейном кватернионном пространстве Н. Рассмотрены подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с кватернионными компонентами.
Исследованы информативности скалярных произведений векторных сигналов в пространствах Я, С, и Н, задающих плоские и объемные изображения. Показано, что это скалярные произведения векторных сигналов в линейном комплексном пространстве Сив кватернионном пространстве И включают в качестве своей составной части скалярное произведение векторных сигналов в пространстве Я. Дополнительная информация о степени схожести сигналов содержится в комплексной и гиперкомплексной частях скалярных произведений. Она позволяет определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве Я, найти инвариантное к вращению изображений значение меры их схожести.
; 3. Разработан метод аналитического представления формы изображения (плоского и объемного) как аналитическое представление контура этого изображения, инвариантного к преобразованиям масштабирования, поворота и смещения начальной точки контура. Различие между формами двух изображений выражается расстоянием между векторами, задающими эти формы. Форма изображения содержит в концентрированном виде информацию о классе объекта, мало меняется при смене вида датчика, формирующего изображения, определяется значениями яркостей пикселей (вокселов) в приграничной части изображения и допускает простое аналитическое описание. Задание формы в качестве элемента линейного пространства, можно рассматривать как получение упрощенной, но достаточно адекватной модели изображения, допускающей обработку с позиции теории сигналов. Такая модель дает возможность применить для решения задачи распознавания изображений строгие методы оптимальной обработки сигналов и отказаться от эвристических подходов.
4. Разработаны методы фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений. Показано, что в отличие от согласованных фильтров для вещественных сигналов, согласованный фильтр для комплекснозначных сигналов обладает свойством инвариантности модуля пикового отсчета к преобразованию поворота. При нормировании входного сигнала модуль пикового отсчета такого фильтра инвариантен также к преобразованиям масштабирования и сдвига начальной точки контура изображения. Благодаря этим свойствам контурный согласованный фильтр целесообразно использовать для нахождения количественного значения меры схожести двух плоских форм. Получены аналитические соотношения для кватернионного согласованного фильтра. Работа
такого фильтра во многом аналогична работе контурного согласованного фильтра, но имеет особенности, связанные с некоммутативным характером операции перемножения кватернионов. Исследован механизм работы ква-тернионного фильтра при обработке согласованного и несогласованного с ним кватернионного сигнала. Доказан аналог неравенства Коши-Буняковского для кватернионных сигналов.
Разработан метод согласованно-избирательной фильтрации изображений объектов на сложном многоградационном по яркости фоне для решения задач их распознавания. Метод согласованно-избирательной фильтрации основан на том, что спектральная плотность мощности фона в реальных ландшафтных сценах и в сценах с медико-биологическими объектами в области высоких пространственных частот хорошо аппроксимируется функцией квадратичной гиперболы.
5. Разработан метод оптимального распознавания контуров изображений, заданных поливекторными комплекснозначными сигналами. Показано, что для принятия решения о классе формируется статистика в виде отношения функций правдоподобия зашумленного распознаваемого контура N и контура эталонного изображения проверяемого класса. Важным для принятия методики диссертационного исследования является тот фактор, что эта статистика для случая нормально распределенных шумов сводится к величине расстояния между поливекторами. При переходе к нормированным значениям всех поливекторных сигналов, как распознаваемого, так и эталонных, то такой статистикой будут служить скалярные произведения соответствующих контуров. Если кроме условия нормированное™, потребовать выполнение условий совпадения начальных точек и нулевого значения угла поворота между распознаваемым и эталонным контурами, то задача распознавания плоских зашумленных изображений по их форме сводится к задаче распознавания их контуров.
6. Получена базовая процедура обработки 30 поверхностей, заданных зашумленным полем отсчетов. Процедура основана на принципе множества ближайших точек. Принцип МБТ является основой для операции планиметрии - кусочно-ломанной аппроксимации произвольной 30 поверхности множеством плоских участков, а также векторного поля с амплитудно-угловой модуляцией, адекватно связанного с формой подстилающей 30 поверхности. Решена задача планиметрии произвольной зашумленной 30 поверхности. На основе принципа МБТ каждой точке генерального множества был поставлен в соответствие участок плоской поверхности, ограниченный контуром МБТ. Разработана векторно-полевая модель произвольной 30 поверхности. Элементом векторного поля служит средняя нормаль к плоскости. Исследована информативность такого поля и показано, что аргумент вектора определяет ориентацию текущего сегмента, а его длина зависит от степени неровности участка поверхности в пределах соответствующего МБТ. Разработан метод детектирования формы участков 30 поверхности. Показано, что детектирование фрагментов с произвольными формами может быть реализовано в общем случае на базе ква-
тернионных согласованных фильтров, импульсные характеристики которых отражают закономерности этих форм.
7. Разработан метод распознавания изображений расположенных на ЗО поверхности объектов по форме, задаваемой совокупностью пересекающихся между собой плоских фрагментов. Единое правило упорядочения вершин многогранника дает возможность получить ЗГ) контур (проволочной моделью многогранника), элементарные векторы которого соединяют в установленном порядке, как вершины многогранника эталонного объекта, так и соответствующие вершины многогранника распознаваемого объекта, инвариантно его угловому положению, масштабу и смещению (в определенных пределах) положения вершин из-за действия координатных шумов. Такая модель была получена на основе операции объективного упорядочения граней многогранника, задающего форму объекта. Она представляет кватерни-онный сигнал, каждый кватернион которого задает вектор, соединяющий две вершины с соседними номерами. На базе проволочных моделей распознаваемого и эталонных объектов синтезированы оптимальные методы распознавания изображений полностью известных ЗБ объектов по их форме, задаваемой ассоциированным с ним многогранником. Показано, что форма пространственного группового точечного объекта задается выпуклым многогранником, вершинами которого служат граничные точки объекта. Доказаны теорема существования таких многогранников и теорема единственности получения одного и того же многогранника независимо от выбора начальной точки пространственного группового точечного объекта, с которой начинается процесс построения. Разработана аналитическая модель пространственного группового точечного объекта, учитывающая не только пространственные координаты его точек, но и их яркость.
СПИСОК ОСНОВНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ Монографии
1. Введение в контурный анализ и его приложения к обработке изображений и сигналов / Фурман Я. А., Кревецкий А. В., Передреев А. К., Роженцов А. А., Хафи-зов Р. Г. и др.; под ред. Я. А. Фурмана. - М.: Физматлит, 2002.
2. Комплекснозначные и гиперкомплексные системы в задачах обработки многомерных сигналов / Фурман Я. А., Кревецкий А. А., Роженцов А. А., Хафи-зов Р. Г. и др.; под ред. Я. А. Фурмана. - М.: Физматлит, 2004.
Статьи в периодических изданиях, рекомендованных ВАК
3. Хафизов, Р. Г. Обнаружение и оценка параметров плоских изображений / Р. Г. Хафизов // Известие Вузов. Приборостроение. - 2006. - № 4. - С. 36-45.
4. Хафизов, Р. Г. Распознавание плоских зашумленных изображений по их форме / Р. Г. Хафизов, И. Л. Егошина // Известие Вузов. Приборостроение. -2006. -№4.-С. 46-51.
5. Хафизов, Р. Г. Фильтрация кватернионных сигналов I Р. Г. Хафизов, Я: А. Фурман, А. А. Роженцов // Радиотехника и электроника. - 2007. - Т. 52. -№ 1. - С. 42-50.
6. Фурман, Я. А. Дискретно-кодированные сигналы на базе композиционных контуров / Я. А. Фурман, А. А. Роженцов, Р. Г. Хафизов // Автометрия. - 1996. -№ 1.-С.72-79.
7. Фурман, Я. А. Согласованно-избирательная фильтрация изображений протяженной формы в реальных ландшафтных сценах / Я. А. Фурман, Р. Г. Хафизов // Автометрия. - 1999. - № 2. - С. 12-27.
8. Furman, Ya. A. Detection of Extended Objcct Images in Optical Scenes У Ya. A. Furman, R. G. Khafizov // Pattern Recognition and Image Analysis. ~ 1998. -№ 2. - P. 267-268.
9. Хафизов, P. Г. Анализ сопряженных пространственных статических и динамических сцен при проведении трансуретралыюй резекции предстательной железы в режиме предварительного осмотра / Р. Г. Хафизов, В. II. Дубровин, Ю. Е. Третьякова // Биомедицинские технологии и радиоэлектроника. - 2009. -№3.-С. 14-20
10. Хафизов, Р. Г. Анализ непрерывных комплекснозначных сигналов, задающих контуры изображений плоских объектов / Р. Г. Хафизов // Вестник Казанского государственного технического университета им. А.Н. Туполева. - 2006. - № 4. -С. 24-27.
11. Хафизов, Р. Г. Нейронная система обнаружения 3D изображений объектов рентгеновской томографии / Р. Г. Хафизов, Д. М. Ворожцов // Биомедицинскне технологии и радиоэлектроника. - 2006. - № 1-2. - С. 89-95.
12. Furman, Y. A. Detection of Images of Extended-Shape Object Among the Scenes of Underlying Surface / Y. A. Furman, R. G. Khafizov U Pattern Recognition and Image Analysis. - 1998,-Vol. 8.-№4.-P. 612-640.
13. Khafizov, R. G. Image Recognition of Spatial Objects on the Basis of Their Quaternion Models / R. G. Khafizov, Ya. A. Furman, D. G. Khafizov // Pattern Recognition and Image Analysis.-2003.-Vol. 13.-№ l.-P. 101-102.
14. Хафизов, P. Г. Распознавание групповых точечных объектов на основе представления в собственной системе отсчета / Р. Г. Хафизов, Д. Г. Хафизов // Автометрия. - 2005. - №3. - С. 19-30.
15. Detection and Recognition of Three-Dimensional Man-Made Objects / A. V. Krevetskii, R. G. Khafizov, I. L. Egoshina, A. N. Leukhin, D. M. Vorozhtsov// Pattern Recognition and Image Analysis. - 2005. - Vol. 15. - № 3. - P. 112-114.
Свидетельство об официальной регистрации программы
16. Хафизов, Р. Г. Расчет характеристик распознавания гиперкомплексных сигналов / Р. Г. Хафизов, Д. Г. Хафизов, Я. А. Фурман и др. // Свидетельство об официальной регистрации программы для ЭВМ №2003611694, РОСПАТЕНТ, 16.07.2003.
17. Хафизов, Р. Г. Программный комплекс по исследованию статистических характеристик изображений / Р. Г. Хафизов, Д. М. Ворожцов, Д. С. Чернов // Свидетельство об официальной регистрации программы для ЭВМ № 2005610655, РОСПАТЕНТ, 17.03.2005.
18. Фурман, Я. А. Программный комплекс для построения контурных сцен «POCOS» / Я. А. Фурман, Ю. Ю. Мальгин, Р. Г. Хафизов и др. II Свидетельство об официальной регистрации программы для ЭВМ № 2005612227, РОСПАТЕНТ, 5.07.2005.
19. Хафизов, Д. Г. Программы для ввода пространственных групповых точечных объектов «Сфера» / Д. Г. Хафизов, Р. Г. Хафизов // Свидетельство об официальной регистрации программы для ЭВМ № 2006612542, РОСПАТЕНТ, 19.07.06.
20. Хафизов, Д. Г. Распознавание изображений пространственных групповых точечных объектов на основе их амплитудно-фазовых моделей / Д. Г. Хафизов, Р. Г. Хафизов // Свидетельство об официальной регистрации программы для ЭВМ № 2006613053, РОСПАТЕНТ, 01.09.06.
21. Программа для решения обратной задачи вращения поливекторных сигналов / Р. Г. Хафизов, И. Л. Егошина, Я. А. Фурман и др. // Свидетельство о государственной регистрации программы для ЭВМ № 2009610894 от 09.02.2009.
Публикации в других изданиях
22. Furman, Ya. A. Matched-Selective Filtering of Stretched Images in Real Landscape Scenes / Ya. A. Furman, R. G. Khafizov // Optoelectronics, Instrumentation and Data Processing. - 1999. -№. 2. - P. 10-23.
23. Furman, Ya. A. Filtering of quaternion signais / Ya. A. Funnan, R. G. Khafizov,
A. A. Rozhentsov // Journal of Communications Technology and Electronics. - 2007. -№ 1. - P. 42-50.
24. Хафизов, P. Г. Согласованно-избирательная фильтрация изображений / P. Г. Хафизов. - Йошкар-Ола: МарГТУ, 2000.
25. Фурман, Я. А. Изображения ориентиров оптимальной формы / Я. А. Фурман, А. В. Кревецкий, Р. Г. Хафизов II Вестник ВВО АТН РФ. Серия «Высокие технологии в радиоэлектронике, информатике и связи». - 2000. - С. 19-28.
26. Фурман, Я. А. Обнаружение изображений объектов протяженной формы в оптических сценах / Я. А. Фурман, Р. Г. Хафизов // Материалы Всероссийской конференции «Распознавание образов и анализ изображений». - Нижний Новгород. -1997. - 4.1.-С. 283-285.
27. Хафизов, Р. Г. Распознавание изображений объектов, заданных в пространстве, на основе анализа их формы / Р. Г. Хафизов, Д. Г. Хафизов // Материалы 5-й Всероссийской научно-технической конференции «Динамика нелинейных дискретных электротехнических и электронных систем». - Чебоксары. - 2003. -С. 239-240.
28. Хафизов, Р. Г. Повышение качества обработки и анализа изображений рентгенограмм за счет учета шумовых свойств фона / Р. Г. Хафизов // Сборник материалов 5-ой международной конференции «Распознавание-2001». - Курск. - 2001. -С. 248-250.
29. Фурман, Я. А. Распознавание изображений пространственных объектов на базе их кватернионных моделей / Я. А. Фурман, Д. Г. Хафизов, Р. Г. Хафизов // Труды 6-й Международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» РОАИ-6-2002. - Великий Новгород. - 2002. - С. 586-589.
30. Хафизов, Р. Г. Распознавание кватернионных сигналов на основе их представления в собственной системе отсчета / Р. Г. Хафизов // Труды 11-й Всероссийской конференции «Математические методы распознавания образов». - М. - 2003. -С. 471-473.
31. Хафизов, Р. Г. Аналитическое представление формы кватернионных сигналов, инвариантное к преобразованиям масштабирования и вращения / Р. Г. Хафизов, Д. Г. Хафизов // Труды международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей
B. А. Котельникова». - М. 2003. - С. 134-135.
32. Détection and Récognition of Three-Dimensiona! Anthropogenous Objects / A. V. Krevetskii, R. G. Khafizov, I. L. Egoshina, A. N. Leukhin, D. M. Vorozhtsov //
7,h International Conference on "Pattern Recognition and Image Analysis". - St. Peterburg. - 2004. - P. 756-759.
33. Хафизов, P. Г. Автоматизация обработки и анализа 3D рентгеновских изображений на базе согласованно-избирательной фильтрации / Р. Г. Хафизов, Д. М. Ворожцов // Вестник Вятского научного центра Верхне-Волжского отделения Академии технологических наук РФ. - 2004. - № 1(5). - С. 73-79.
34. Хафизов, Р. Г. Информационная технология визуализации и многоцелевого анализа пространственных динамических изображений предстательной железы для подготовки и проведения трансуретральной операции / Р. Г. Хафизов, Ю. Е. Третьякова // Вестник МарГ'ГУ. - 2008. - №2. - С. 27-34.
35. Khafizov, R. G. For Problems of Creation of the Unity Theory of Group Point Object Image Processing / R. G. Khafizov // Proceedings of Fourth International Conference "Information and Telecommunication Technologies in Intelligent Systems". - Ka-tania. - 2006. - P. 79-81.
36. Хафизов, P. Г. Распознавание 2D и 3D изображений по их форме в системах навигации летательных аппаратов / Р. Г. Хафизов // Материалы Международной научно-практической конференции «Авиакосмические технологии и оборудование. Казань-2006». - Казань. - 2006. - С. 201-202.
37. Khafizov, R. G. Recognition of spatial image by means of form / R. G. Khafizov // 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007).- Yoshkar-Ola. - 2007. P. 146-149.
38. Furman, Ya. A. The detection of the three-dimensional objects surfaces / Ya. A. Furman, R. G. Khafizov II 8lh International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007).- Yoshkar-Ola. - 2007. - P. 89-93.
39. Khafizov, R. G. Models of flat and spatial images contours on the basis of the theory of a complex variable function / R. G. Khafizov, A. Nefyodov П 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007).-Yoshkar-Ola. -2007. - P. 150-152.
40. Хафизов, P. Г. Синтез формы с метрическими свойствами плоских и пространственных изображений / Р. Г. Хафизов // Сборник материалов VIII Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации». - Курск. -2008.-С. 149-150.
41. Furman, Ya. A. Unitary space as a basic one for signal representation at solving the problems of flat images recognition / Ya. A. Furman, R. G. Khafizov, D. G. Khafizov // 9 International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). - Nizhniy Novgorod. - 2008. - P. 150-153.
42. Dubrovin, V. N. Development of a surgeon information support system for conducting transurethral surgery on prostate gland / V. N. Dubrovin, V. V. Sevastyanov, R. G. Khafizov II 9th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). - Nizhniy Novgorod. - 2008. - P. 104-107.
43. Khafizov, R. G. Modeling point fields on 3D objects surfaces / R. G. Khafizov // 9lh International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-9-2008). - Nizhniy Novgorod. - 2008. - P. 284-286.
Усл. п. л. 2,0. Печать офсетная. Тираж 100 экз. Заказ № 4276.
Отпечатано в редакционно-издательском центре МарГТУ 424006 Йошкар-Ола, ул. Панфилова, 17.
Оглавление автор диссертации — доктора технических наук Хафизов, Ринат Гафиятуллович
ВВЕДЕНИЕ
1. СОВРЕМЕННОЕ СОСТОЯНИЕ И ПРОБЛЕМЫ ТЕОРИИ ОБРАБОТКИ И РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ
1.1. Проблема распознавания образов
1.2. Обзор математических теорий распознавания образов
1.3. Распознавание изображений
1.4. Анализ состояния проблемы распознавания изображений с позиции достижения цели диссертационного исследования
1.5. Обоснование выбора научной концепции диссертационного исследования
2. ВЫБОР ПРОСТРАНСТВА ДЛЯ ПРЕДСТАВЛЕНИЯ СИГНАЛОВ ПРИ РЕШЕНИИ ЗАДАЧИ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ
2.1. Введение
2.2. Информативные свойства скалярного произведения сигналов в линейном действительном пространстве
2.2.1. Задание скалярного произведения нормированных вещественных поливекторных сигналов
2.2.2. Зависимость информативности СП от величины угла между поливекторными сигналами
2.3. Информативные свойства скалярного произведения векторных сигналов в комплексном пространстве С
2.3.1. Задание СП нормированных комплекснозначных поливен- 51 торных сигналов
2.3.2. Обоснование более высокой информативности СП векторных сигналов в пространстве С по сравнению с пространством /?
2.4. Информативные свойства скалярного произведения векторных сигналов в кватернионном пространстве Н
2.4.1. Общие сведения о псевдолинейном пространстве Н
2.4.2. Скалярное произведение векторов в пространстве Нх
2.4.3. Многомерный случай. Скалярное произведение кватернионных сигналов
2.4.4. Ортогональность кватернионных сигналов
2.4.5. О причинах неинвариантности модуля СП кватернионных сигналов к повороту
2.5. Прямая и обратная задачи вращения поливекторного сигнала в трехмерном пространстве
2.5.1. Прямая задача вращения поливенторного сигнала
2.5.2. Обратная задача вращения поливенторного сигнала
2.6. Выводы
3. ФОРМА ИЗОБРАЖЕНИЯ И МЕТОДЫ ЕЕ АНАЛИТИЧЕСКОГО ПРЕДСТАВЛЕНИЯ
3.1. Введение
3.2. Форма изображения объекта как информационная компонента его контура
3.3. Контурный анализ как математический аппарат для решения задач распознавания 2D изображений по их форме
3.4. Основные положения кватернионного анализа. Кватернионные сигналы для представления формы 3D изображений
3.5. Аналитическое представление формы пространственного изображения
3.5.1. Тестовый пространственный контур
3.5.2. Форма пространственного изображения
3.6. Аналитическое представление непрерывной контурной линии
3.6.1. Модель непрерывной контурной линии плоского изображения
3.6.2. Спектральный анализ линий непрерывных контуров
3.7. Выводы
4. ФИЛЬТРАЦИЯ ПОЛИВЕКТОРНЫХ СИГНАЛОВ, ЗАДАЮЩИХ КОНТУРЫ ИЗОБРАЖЕНИЙ П
4.1. Фильтрация контурных сигналов как средство получения меры схожести изображений по их форме
4.2. Фильтрация контуров плоских изображений
4.2.1. Основные положения линейной фильтрации дискретных комплекснозначных сигналов
4.2.2. Согласованная фильтрация контуров плоских изображений
4.3. Основы теории линейной фильтрации кватернионных сигналов
4.3.1.Фильтрация элементарного кватернионного сигнала
4.3.2. Фильтрация произвольного КТС
4.3.3. Связь между частотным коэффициентом передачи и импульсной характеристикой кватернионного фильтра
4.3.4. О собственных элементах кватернионного фильтра
4.4. Согласованная фильтрация кватернионных сигналов
4.4.1. Общие соотношения для кватернионного согласованного фильтра
4.4.2. Механизм работы кватернионного согласованного фильтра
4.4.3. Механизм работы кватернионного фильтра при фильтрации несогласованного сигнала
4.5. Согласованно-избирательная фильтрация изображений
4.5.1. Принцип согласованно-избирательной фильтрации
4.5.2. Сопоставление свойств согласованного и согласованно-избирательного фильтров
4.5.3. Одномерные СИФ для цифровых сигналов
4.5.4. Фильтрация одномерного скачка яркости
4.5.5. Фильтрация одномерных импульсов яркости
4.5.6. Согласованно-избирательная фильтрация 30 изображений
4.5.7. Согласованно-избирательная фильтрация изображений (частотный аспект)
4.5.8. Прохождение фоновых шумов через СИФ
4.5.9. Энергетические соотношения при согласованно-избирательной фильтрации зашумленных скачков яркости
4.6. Обсуждение результатов
5. ОБРАБОТКА И РАСПОЗНАВАНИЕ РАСПОЛОЖЕННЫХ НА ПЛОСКОСТИ
ИЗОБРАЖЕНИЙ ПО ИХ ФОРМЕ
5.1. Введение
5.2. Обнаружение и оценка параметров зашумленных контуров изображений
5.3. Распознавание зашумленных контуров изображений как статистическая задача
5.3.1. Постановка задачи распознавания зашумленных контуров
5.3.2. Распознавание полностью известных контуров
5.3.3. Распознавание контуров со случайными углами поворотов и сдвигами начальных точек \
5.3.4. Тестовый пример
5.4. Реализация преимуществ представления формы плоских изображений в унитарном пространстве при решении задачи распознавания
5.4.1. Общие замечания
5.4.2. Векторные диаграммы при распознавании изображений с неизвестным углом поворота 17s
5.4.3. Оптимальный алгоритм распознавания изображений по форме при случайных углах поворота их контуров
5.5. Оптимизация алфавита эталонных форм
5.6. Обработка изображений ландшафтов и медико-биологических объектов
5.6.1. Обнаружение границы фон/объект
5.6.2. Выделение контуров изображений антропогенных объектов в ландшафтных сценах
5.6.3. Прослеживание изображений коммуникационных объектов
5.7. Прикладные задачи, связанные с распознаванием 2D изображений по их форме
5.8. Выводы
6. ОБРАБОТКА И РАСПОЗНАВАНИЕ РАСПОЛОЖЕННЫХ В 3D
ПРОСТРАНСТВЕ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ ПО ИХ ФОРМЕ
6.1. Введение
6.2. Базовая процедура предварительной обработки 3D поверхностей
6.2.1. Задачи обработкиЗО поверхности и подходы к их решению
6.2.2. Планиметрия 3D поверхности на базе кватернионного анализа и принципа МБТ
6.2.3. Низкочастотная фильтрация нерегулярного точечного
6.2.4. Средняя нормаль к поверхности, заданной МБТ
6.2.5. Методика получения средней нормали МБТ
6.2.6. Последние этапы базовой операции
6.3. Планиметрия и образование элементарных областей на произвольной зашумленной 3D поверхности
6.3.1. Планиметрия 3D поверхности
6.3.2. Формирование элементарных областей на зашумленной
3D поверхности
6.4. Обработка и распознавание объектов по результатам анализа векторных полей 3D поверхности
6.4.1. Векторно-полевая модель 3D поверхности
6.4.2. Задачи обработки векторных полей
6.4.3. Детектирование плоских фрагментов
6.4.4. Детектирование фрагментов поверхностей с криволинейными формами
6.5. Распознавание изображений расположенных на 3D поверхности объектов по их форме
6.5.1. Общие замечания
6.5.2. Проволочная модель многогранника
6.5.3. Распознавание изображений полностью известных 3D объектов по их форме
6.5.4. Распознавание многогранников с неизвестным номером начальной точки проволочной модели
6.5.5. Распознавание изображений 3D объектов с неизвестными значениями углов поворота
6.6. Обработка и распознавание изображений пространственных групповых точечных объектов
6.6.1. Общие замечания
6.6.2. Форма пространственного группового точечного объекта
6.6.3. Обоснование единого правила нумерации точек ПГТО
6.6.4. Синтез выпуклого многогранника, задающего форму ПГТО
6.6.5. Результаты исследования эффективности распознавания ПГТО по его проволочной модели
6.6.6. Влияние яркостной информации точек ПГТО на результаты распознавания
6.7. Выводы
Введение 2009 год, диссертация по радиотехнике и связи, Хафизов, Ринат Гафиятуллович
Актуальность темы. Современный этап развития радиотехнических информационных систем характеризуется одной общей тенденцией. Она заключается в том, что объектом их обработки являются различного рода изображения, достаточно сложные по структуре и с неоднородными статистическими свойствами. Примером могут служить телевизионные, диагностические и охранные системы, системы наблюдения за земной и водной поверхностями, ближним космическим пространством и др. Задачей таких систем является не только такая пассивная функция, как формирование самих изображений, но, в первую очередь, понимание изображений - обнаружение на сложном статистически неоднородном и многоградационном по яркости фоном представляющих интерес объектов, распознавание и оценка их параметров.
Аэрокосмические сцены поверхности Земли и сцены с изображениями медико-биологических объектов относятся к наиболее сложным для обработки изображениям. Чаще всего изображения содержащихся в них объектов весьма несовершенны, обладают недостаточной по отношению к фону контрастностью, четкостью, искажены помехами и шумами. По этим сигналам оператору затруднительно принимать необходимые решения в темпе поступления изображения, т.е. в реальном масштабе времени. Особенно остро стоит эта проблема в полностью автоматизированных системах. Требуемая для решения поставленных задач производительность цифрового процессора составляет 108-1014 и более элементарных операций в секунду, что затрудняет, а в целом ряде случаев, исключает получение результатов обработки в реальном или близком к нему масштабах времени.
В последние годы задача значительно осложнилась в связи с необходимостью обработки не только плоских, 20 изображений, но и пространственных, 30 изображений. Как показывает обзор достигнутых результатов в этой области, решение этих задач, как с теоретических, так и с практических позиций, далеко от завершения.
Существует немало причин для подобного вывода, но необходимо отметить, что такая часто приводимая причина как недостаточная степень развития вычислительной техники, является, на наш взгляд, второстепенной. Отсутствие результатов обработки изображений, сопоставимых по своей эффективности с возможностями человека, объясняется, в первую очередь, недостаточно развитыми теоретическими подходами. В большинстве публикаций по вопросам обработки изображений рассматриваются различные эвристические подходы и даются рекомендации в пользу слабо проверенных и сильно ограниченных методов.
Особенностью данной диссертационной работы является компромисс, состоящий в выборе упрощенной, но достаточно адекватной модели изображения, и применение на базе такой модели строгих теоретических подходов для обработки реальных изображений, основанных на теории сигналов. Рассматриваемая в диссертации упрощенная модель изображения, представляет в аналитическом виде форму этого изображения, задаваемую ее контуром. Форма изображения является концентратором информации, содержащейся в изображении. Она интерпретируется как заданный в аналитическом виде сигнал, для обработки которого используются разработанные в диссертации методы контурного и кватернионного анализа сигналов. Понятие формы изображения является важнейшей предпосылкой как для понимания процесса визуального восприятия человеком визуального мира, так и для применения аналитических методов обработки изображений.
В экспериментальных исследованиях по психологии оператора радиолокационной станции обзора земной поверхности было показано, что процесс предварительного формирования у него зрительного образа состоит из следующих этапов: грубое различение общих пропорций изображения объекта и его положения на экране индикатора, мерцание формы, различение резких перепадов яркости, выделение отдельных деталей, восприятие формы и контура изображения объекта [5].
В работе [81] приводится гипотеза о формировании зрительного образа в сознании человека. Предполагается, что при восприятии глаз осуществляет отслеживание границы изображения объекта. В результате в сознании человека отличаются характерные особенности формы объекта. В работе [82] высказывается мнение о том, что при восприятии в сознании человека вырабатываются два образа: образ формы и образ внутренней части изображения объекта. Вместе с тем, общепринятое определение формы объекта отсутствует. В большинстве работ, где определение этого термина является важным моментом, указывается на сложность данного вопроса.
Важнейшие результаты в области анализа сцен и распознавания образов получены отечественными учеными в рамках НТС РАН по проблеме «Кибернетика» под руководством академика РАН Ю.И. Журавлева. Особо следует отметить Самарскую школу под руководством член корр. РАН В.А. Сойфе-ра, Новосибирскую школу под руководством д.т.н., профессора B.C. Киричу-ка, Нижегородскую школу под руководством д.ф.-м.н., профессора Ю.Г. Васина, Курскую школу под руководством B.C. Титова и другими учеными, входящими в Российскую общественную организацию «Ассоциация распознавания образов и анализа изображений».
Научная проблема, на решение которой направлена диссертационная работа, заключается в разработке методов распознавания изображений, инвариантных к преобразованиям переноса, масштабирования и вращения этих изображений при условии сохранении их формы. Выбор в качестве адекватной модели изображения аналитического представления формы этого изображения, задаваемую ее контуром, позволяет с единых позиций теории сигналов подходить к обработке реальных изображений. Интерпретация формы изображения как заданный в аналитическом виде сигнал, для обработки которого используются разработанные в диссертации методы контурного и кватернионного представления сигналов, должно послужить основой для применения аналитических методов обработки изображений при создании новых, более совершенных, систем.
Цель диссертационной работы заключается в разработке методов распознавания плоских и объемных изображений по их форме, заданной в аналитическом виде на основе контурного и кватернионного анализа. Для достижения этой цели в диссертационной работе решаются следующие задачи:
1) выбор пространства для представления сигналов при решении задачи распознавания изображений;
2) формирование адекватных моделей изображений плоских и объемных изображений на основе контурного и кватернионного анализа;
3) разработка аналитического представления формы плоских и объемных изображений на основе контурного и кватернионного анализа;
4) разработка методов фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений;
5) разработка методов обработки и распознавания, расположенных на плоскости и в 30 пространстве изображений по их форме;
6) реализация разработанных методов обработки и распознавания 20 и Зй изображений по их форме и оценка их эффективности.
Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, контурного и кватернионного анализа, цифровой обработки сигналов и изображений, теории вероятностей, теории функции комплексного переменного, алгебры гиперкомплексных чисел, численные методы и методы математического моделирования.
Научная новизна определяется результатами, полученными в диссертации впервые, и заключается в следующем.
1. Разработаны методы распознавания двумерных и трехмерных изображений по их форме, инвариантные к преобразованиям переноса, масштабирования и вращения этих изображений.
2. Исследованы методы фильтрации комплекснозначных и кватернион-ных сигналов, задающих контуры плоских и объемных изображений. Получены аналитические соотношения для согласованной фильтрации поливекторных сигналов и выяснены механизмы работы таких фильтров. Обнаружен эффект расщепления кватернионным фильтром гармоник спектра фильтруемого сигнала.
3. Разработан метод обработки изображений на основе согласованно-избирательной фильтрации для решения задачи обнаружения изображений объектов на сложном многоградационном и статистически неоднородном фоне.
4. Разработан на базе анализа векторных полей метод детектирования формы участков 30 поверхности. Синтезированы кватернионные согласованные фильтры для детектирования фрагментов поверхности с произвольными формами.
Практическая значимость работы.
1. Полученные методы распознавания изображений по их форме, задаваемой контуром в комплекснозначном (для 20 изображений) или в кватер-нионном (для 30 изображений) виде, применены для решения задач распознавания плоских и объемных изображений биомедицинских объектов при создании информационных автоматизированных систем поддержки хирурга.
2. Разработанный метод согласованно-избирательной фильтрации изображений позволил решить задачу обнаружения изображений объектов на сложным нестационарном фоне в ландшафтных сценах и в сценах с изображениями медико-биологических объектов.
3. На базе фильтров, согласованных с комплекснозначными и кватерни-онными сигналами, решены инвариантно к преобразованиям переноса, масштабирования, вращения и сдвига начальной точки задачи распознавания плоских и объемных изображений по их форме.
4. Разработанный метод детектирования формы участков 30 поверхности использован для решения задач визуализации пространственных изображений.
Реализация результатов работы. Теоретические и практические результаты диссертационной работы использованы в НИР «Притирка-1К» и «Эксперт» при разработке распределенных информационных систем специального назначения ФГУП «Курский НИИ» МО РФ, а также при проведении НИР № 200/01709 («Статуэтка-УПКБ») в ОАО «УПКБ «Деталь». Теоретические и практические результаты диссертационной работы использованы в следующих НИР, выполняемых автором в качестве исполнителя по грантам.
1. Грант РФФИ «Новые оптимальные сигналы для задач разрешения/распознавания», проект №97-01-00906,1997-1998гг.
2. Грант Министерства общего и профессионального образования РФ «Интеллектуальные системы ориентации летательных аппаратов на базе систем обработки изображений ориентиров оптимальной формы, расположенных на подстилающей поверхности или небесной сфере», 1997-1998гг.
3. Грант Миннауки и технологий «Распознавание изображений дорог и других нитевидных объектов в сценах с аэроландшафтами», №0201.05.021, 1998г.
4. Грант РФФИ «Оптимальные сигналы в виде форм точечных изображений. Поиск уникальных звездных образований для ориентации летательных аппаратов», проект 99-01-00186, 1999-2000гг.
5. Грант Минобразования РФ «Робототехническая производственная технология дефектоскопии корпусов интегральных схем на базе контурного анализа их изображений», проект 03.01.06.001, 2000г.
6. Грант РФФИ, проект № 01-01-14029, Издание монографии «Введение в контурный анализ и его приложения к обработке изображений и сигналов», 2001.
7. Грант РФФИ, проект № 01-01-00298, «Новые подходы к решению класса задач обработки изображений и сигналов, связанного с фиксацией максимума взаимнокорреляционной функции и подавлением корреляционных шумов», 2002-2003.
8. Грант РФФИ, проект N9 03-01-14065д, Издание монографии «Ком-плекснозначные и гиперкомплексные системы в задачах обработки многомерных сигналов», 2003.
9. Грант РФФИ, проект №04-01-00243, «Определение потенциальной эффективности распознавания образов, задаваемых векторными сигналами», 2004.
10. Грант РФФИ «Решение проблемы распознавания и оценки параметров 20 и ЗЭ изображений при неизвестной нумерации отсчетов их контуров на базе теории функции комплексного и гиперкомплексного переменного», 2008-2009.
11. Грант РФФИ «К решению проблемы визуализации и анализа 30 сцен, распознавания пространственных образов методами кватернионного исчисления». 2007-2009.
12. Грант РФФИ «Методы обработки изображений групповых точечных объектов для систем дефектоскопии на предприятиях радиоэлектронной промышленности», проект №05-01-96510рповолжьеа, 2005.
13. Грант Министерства образования и науки РФ по программе «Проведение фундаментальных исследований естественных, гуманитарных и технических наук. Научно-методическое обеспечение развития инфраструктуры вузовской науки» проект «Фундаментальные исследования проблемы навигации и управления транспортными средствами по 30 изображениям окружающего пространства на базе методов кватернионного пространства». 2009.
Теоретические и практические результаты работы использованы в следующих НИР, выполняемых автором в качестве руководителя:
1) г/б НИР в рамках Государственного контракта от «28» февраля 2006 г. № 02.442.11.7328 в рамках ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники» на 2002-2006 годы» «Единая теория обработки изображений групповых точечных объектов» (шифр 2006-РИ-19.0/001/348), 2006;
2) грант РФФИ «Разработка методов и создание информационной технологии визуализации и сравнительного анализа сопряженных пространственных статических и динамических сцен», проект 08-01-12000-офи. 20082009;
3) грант Президента Республики Марий Эл «Разработка алгоритмов обнаружения плоских и объемных коммуникационных объектов естественного и антропогенного характера в системах понимания изображений для задач мониторинга за лесными массивами», 2002;
4) грант Марийского государственного технического университета для молодых ученых «Обнаружение и прослеживание контурной линии изображений объектов с прямолинейными границами в сценах аэроландшафтов», 1999; а также внедрены в учебный процесс по направлениям подготовки «Радиотехника», «Телекоммуникации» и «Биомедицинская инженерия».
Апробация работы. Результаты работы обсуждались на Всероссийской межвузовской научно-технической конференции «Информационные технологии в электротехнике и электроэнергетике» (Чебоксары, 1996); на Всероссийской научной конференции «Цифровая обработка многомерных сигналов» (Йошкар-Ола, 1996); на Всероссийской конференции "Распознавание образов и анализ изображений: новые информационные технологии" РОАИ-3-97 (Нижний Новгород, 1997); Всероссийской междисциплинарной научной конференции «Вавиловские чтения» (Йошкар-Ола, 1997); на Всероссийской научно-технической конференции «Компьютерные технологии в науке, проектировании и производстве» (Нижний Новгород, 1999); на Всероссийской научно-технической конференции «Динамика нелинейных дискретных электротехнических и электронных систем» (Чебоксары, 1999); на 5-й международной конференции «Распознавание-2001» (Курск, 2001); на 6-ой международной конференции «Распознавание образов и анализ изображений» (Великий Новгород, 2002); на 11-й Всероссийской конференции «Математические методы распознавания образов» (Москва, 2003); на 5-й Всероссийской научно-технической конференции «Динамика нелинейных дискретных электротехнических и электронных систем» (Чебоксары, 2003); на международной научной конференции к 95-летию академика В.А. Котельникова «Современная радиоэлектроника в ретроспективе идей В.А. Котельникова» (Москва, 2003); на научной практической конференции «Использование информационно-коммуникационных технологий в образовании» (Йошкар-Ола, 2000); на региональной научно-технической конференции (Казань, 2004); на 7-й международной конференции «Распознавание образов и анализ изображений» (Санкт-Петербург, 2004); на 7-й международной конференции «Распо-знавание-2005» (Курск, 2005); на 12-й Всероссийской конференции «Математические методы распознавания образов» (Москва, 2005); на международной научно-практической конференции «Авиакосмические технологии и оборудование» (Казань, 2006); на 8-й международной конференции «Распознавание образов и анализ изображений» (Йошкар-Ола, 2007); на 8-й международной конференции «Распознавание-2008» (Курск, 2008); на 9-й международной конференции «Распознавание образов и анализ изображений» (Нижний Новгород, 2008); на ежегодных научных конференциях по итогам НИР МарГТУ и научных семинарах кафедры Радиотехнических и медико-биологических систем.
Публикации. Всего по теме диссертации опубликовано 67 работ: из них 2 монографии (издательство «Физматлит», Москва); 14-в центральных научных журналах из Перечня ВАК; 26 - материалы конференций; 18 — в других научных изданиях и депонированные в ВИНИТИ; б - свидетельств об официальной регистрации программ в Роспатент.
Структура и объем работы. Диссертация состоит из Введение, 6 глав, Заключения и содержит 140 рисунков, 8 таблиц. Список литературы включает 179 наименования. Основная часть работы изложена на 322 страницах.
Заключение диссертация на тему "Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа"
6.7. Выводы
1. Получена базовая процедура обработки ЗР поверхностей, заданных зашумленным полем отсчетов (глобальным множеством точек). Процедура основана на принципе МВТ (множества ближайших точек): участок ЗР поверхности в пределах ЗР окрестности с центром в текущей точке (полюсе) при достаточно малом радиусе сферы имеет плоскую форму. Принцип МВТ является основой для операции планиметрии - кусочно-ломанной аппроксимации произвольной ЗР поверхности множеством плоских участков, а также векторного поля с амплитудно-угловой модуляцией, адекватно связанного с формой подстилающей ЗР поверхности.
2. Решена задача планиметрии произвольной зашумленной ЗР поверхности. На основе принципа МВТ каждой точке генерального множества был поставлен в соответствие участок плоской поверхности, ограниченный контуром МБТ (сегмент). Множество сегментов образует чешуйчатого типа 30 поверхность, покрывающую исходную 30 поверхность. Для получения плоскосегментированной 30 поверхности оставляются лишь непересекающиеся между собой сегменты.
3. Получена векторно-полевая модель произвольной 30 поверхности. Элементом векторного поля служит средняя нормаль к плоскости МБТ. Исследована информативность такого поля и показано, что аргумент вектора определяет ориентацию текущего сегмента, а его длина зависит от степени неровности участка поверхности в пределах соответствующего МБТ. Для возможности разрешения расположенных на 30 поверхности фрагментов с одинаковыми параметрами своих векторных полей введена необходимая классификация исходного точечного поля: инцидентность точек и коммутативность точек генерального множества.
4. Решена задача детектирования формы участков 30 поверхности. Получены основанные на результатах анализа векторных полей методы детектирования фрагментов плоской, цилиндрической, сферической и конической форм. Показано, что детектирование фрагментов с произвольными формами может быть реализовано в общем случае на базе кватернионных согласованных фильтров, импульсные характеристики которых отражают закономерности этих форм.
5. Решена задача распознавания изображений расположенных на 30 поверхности объектов по форме, задаваемой совокупностью пересекающихся между собой плоских фрагментов. На базе проволочных моделей распознаваемого и эталонных объектов были синтезированы оптимальные методы распознавания изображений полностью известных 30 объектов по их форме, задаваемой ассоциированным с ним многогранником. Получены метолы распознавания изображений с неизвестным номером начального кватерниона проволочной модели, основанные на применении кватернионных согласованных фильтров, и алгоритмы распознавания объектов при неизвестной величине угла между распознаваемым изображением и эталонным изображением своего класса.
6. Доказаны теорема существования таких многогранников и теорема единственности получения одного и того же многогранника независимо от выбора начальной точки ПГТО, с которой начинается процесс построения. Теоремы существования и единственности обуславливают получение одного и того же, с точностью до параметров поворота и масштабирования, ассоциированного с ПГТО многогранника. Показано, что форма ПГТО задается выпуклым многогранником, вершинами которого служат граничные точки объекта. Данный многогранник служит также эффективным визуализированным представлением ПГТО.
7. Разработана методика нумерации граней ассоциированного с ПГТО выпуклого многогранника и упорядочения (нумерации) его вершин. Результатом данной процедуры является проволочная модель ПГТО, являющаяся его аналитическим представлением в виде кватернионного сигнала. Синтезированы методы распознавания ПГТО в условиях воздействия координатных шумов. Для оценки эффективности распознавания ПГТО по их проволочным моделям получены выражения для расчета вероятностей правильного и ложного распознавания и вероятности отказа от распознавания. Оценена устойчивость проволочной модели и отмечена тесная связь этого параметра с устойчивостью формы ПГТО.
8. Разработана аналитическая модель ПГТО, учитывающая не только пространственные координаты его точек, но и их яркость. Основой модели является полный кватернион, векторная часть которого задает положение точки в пространстве, а вещественная - уровень излучаемой ею энергии -яркость, цвет и др. Показано, что использование яркостного портрета ПГТО повышает устойчивость проволочной модели ПГТО для случаев, когда грани ассоциированного многогранника слабо отличаются друг от друга по форме. Кроме того, яркостной портрет ПГТО дает дополнительную информацию о сходстве/различии распознаваемого и эталонных ПГТО, что увеличивает эффективность распознавания.
ЗАКЛЮЧЕНИЕ
В результате диссертационного исследования получено следующее.
1. В качестве линейных пространств для представления изображений в виде сигналов и вычисления скалярного произведение этих сигналов, как меры схожести изображений, выбраны четыре пространства, единственные, в которых определены четыре арифметических действия - сложение, вычитание, умножение и деление. Это следующие пространства: линейное действительно пространство Я, линейное комплексное пространство С и псевдолинейные кватернионное Н пространства. В пространстве Я возможно представление и обработка как плоских, так и пространственных (трехмерных) изображений, в пространстве С-только плоских изображений, в пространстве Н -представление и обработка трехмерных и четырехмерных изображений.
2. Показано, что для решения задачи распознавания плоских изображений объектов по их форме целесообразно использовать аппарат контурного анализа в линейном комплексном пространстве С. Описаны основные подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с комплексными компонентами. Исследованы свойства векторных сигналов, задающих плоские изображения в линейном комплексном пространстве С.
Показано, что для решения задачи распознавания изображений трехмерных объектов по их форме целесообразно использовать аппарат кватернионного анализа в псевдолинейном кватернионном пространстве Н. Рассмотрены подходы к заданию и преобразованию контуров изображений как зашумленных поливекторных сигналов с кватернионными компонентами. Получен на базе преобразования Кели-Диксона ортогональный базис в пространстве Н в виде полного семейства.
Исследованы информативности скалярных произведений векторных сигналов в пространствах Я, С, и Н, задающих плоские и объемные изображения. Показано, что это скалярные произведения векторных сигналов в линейном комплексном пространстве Сив кватернионном пространстве Н включают в качестве своей составной части скалярное произведение векторных сигналов в пространстве Я. Дополнительная информация о степени схожести сигналов содержится в комплексной и гиперкомплексной частях скалярных произведений. Она позволяет определить величину угла поворота векторного сигнала и значительно проще, чем в случае представление сигналов в пространстве Я, найти инвариантное к вращению изображений значение меры их схожести.
3. Разработан метод аналитического представления формы изображения (плоского и объемного) как аналитическое представление контура этого изображения, инвариантного к преобразованиям масштабирования, поворота и смещения начальной точки контура. Различие между формами двух изображений выражается расстоянием между векторами, задающими эти формы. Форма изображения содержит в концентрированном виде информацию о классе объекта, мало меняется при смене вида датчика, формирующего изображения, определяется значениями яркостей пикселей (вокселов) в приграничной части изображения и допускает простое аналитическое описание. Задание формы в качестве элемента линейного пространства, можно рассматривать как получение упрощенной, но достаточно адекватной модели изображения, допускающей обработку с позиции теории сигналов. Такая модель дает возможность применить для решения задачи распознавания изображений строгие методы оптимальной обработки сигналов и отказаться от эвристических подходов.
4. Разработаны методы фильтрации поливекторных сигналов, задающих контуры плоских и объемных изображений. Показано, что в отличие от согласованных фильтров для вещественных сигналов, согласованный фильтр для комплекснозначных сигналов обладает свойством инвариантности модуля пикового отсчета к преобразованию поворота. При нормировании входного сигнала модуль пикового отсчета такого фильтра инвариантен также к преобразованиям масштабирования и сдвига начальной точки контура изображения. Благодаря этим свойствам контурный согласованный фильтр целесообразно использовать для нахождения количественного значения меры схожести двух плоских форм.
Получены аналитические соотношения для кватернионного согласованного фильтра. Работа такого фильтра во многом аналогична работе контурного согласованного фильтра, но имеет особенности, связанные с некоммутативным характером операции перемножения кватернионов. Исследован механизм работы кватернионного фильтра при обработке согласованного и несогласованного с ним кватернионного сигнала. Доказан аналог неравенства Коши-Буняковского для кватернионных сигналов.
Разработан метод согласованно-избирательной фильтрации изображений объектов на сложном многоградационном по яркости фоне для решения задач их распознавания. Метод согласованно-избирательной фильтрации основан на том, что спектральная плотность мощности фона в реальных ландшафтных сценах и в сценах с медико-биологическими объектами в области высоких пространственных частот хорошо аппроксимируется функцией квадратичной гиперболы.
5. Разработан метод оптимального распознавания контуров изображений, заданных поливекторными комплекснозначными сигналами. Показано, что для принятия решения о классе формируется статистика в виде отношения функций правдоподобия зашумленного распознаваемого контура N и контура эталонного изображения проверяемого класса. Важным для принятия методики диссертационного исследования является тот фактор, что эта статистика для случая нормально распределенных шумов сводится к величине расстояния между поливекторами. При переходе к нормированным значениям всех поливекторных сигналов, как распознаваемого, так и эталонных, то такой статистикой будут служить скалярные произведения соответствующих контуров. Если кроме условия нормированности, потребовать выполнение условий совпадения начальных точек и нулевого значения угла поворота между распознаваемым и эталонным контурами, то задача распознавания плоских зашумленных изображений по их форме сводится к задаче распознавания их контуров.
6. Получена базовая процедура обработки 30 поверхностей, заданных зашумленным полем отсчетов. Процедура основана на принципе множества ближайших точек. Принцип МВТ является основой для операции планиметрии - кусочно-ломанной аппроксимации произвольной 30 поверхности множеством плоских участков, а также векторного поля с амплитудно-угловой модуляцией, адекватно связанного с формой подстилающей ЗР поверхности. Решена задача планиметрии произвольной зашумленной 30 поверхности. На основе принципа МБТ каждой точке генерального множества был поставлен в соответствие участок плоской поверхности, ограниченный контуром МБТ.
Разработана векторно-полевая модель произвольной 30 поверхности. Элементом векторного поля служит средняя нормаль к плоскости МБТ. Исследована информативность такого поля и показано, что аргумент вектора определяет ориентацию текущего сегмента, а его длина зависит от степени неровности участка поверхности в пределах соответствующего МБТ. Разработан метод детектирования формы участков 30 поверхности. Показано, что детектирование фрагментов с произвольными формами может быть реализовано в общем случае на базе кватернионных согласованных фильтров, импульсные характеристики которых отражают закономерности этих форм.
7. Разработан метод распознавания изображений расположенных на ЗР поверхности объектов по форме, задаваемой совокупностью пересекающихся между собой плоских фрагментов. Единое правило упорядочения вершин многогранника дает возможность получить 30 контур (проволочной моделью многогранника), элементарные векторы которого соединяют в установленном порядке, как вершины многогранника эталонного объекта, так и соответствующие вершины многогранника распознаваемого объекта, инвариантно его угловому положению, масштабу и смещению (в определенных пределах) положения вершин из-за действия координатных шумов. Такая модель была получена на основе операции объективного упорядочения граней многогранника, задающего форму объекта. Она представляет кватернионный сигнал, каждый кватернион которого задает вектор, соединяющий две вершины с соседними номерами. На базе проволочных моделей распознаваемого и эталонных объектов синтезированы оптимальные методы распознавания изображений полностью известных ЗР объектов по их форме, задаваемой ассоциированным с ним многогранником.
Показано, что форма пространственного группового точечного объекта задается выпуклым многогранником, вершинами которого служат граничные точки объекта. Доказаны теорема существования таких многогранников и теорема единственности получения одного и того же многогранника независимо от выбора начальной точки пространственного группового точечного объекта, с которой начинается процесс построения.
Разработана аналитическая модель пространственного группового точечного объекта, учитывающая не только пространственные координаты его точек, но и их яркость. Основой модели является полный кватернион, векторная часть которого задает положение точки в пространстве, а вещественная - уровень излучаемой ею энергии - яркость, цвет и др. Показано, что использование яркостного портрета пространственного группового точечного объекта повышает устойчивость проволочной модели пространственного группового точечного объекта для случаев, когда грани ассоциированного многогранника слабо отличаются друг от друга по форме.
Библиография Хафизов, Ринат Гафиятуллович, диссертация по теме Радиотехника, в том числе системы и устройства телевидения
1. Ю.И. Журавлев, И.Б. Гуревич. Распознавание образов и анализ изображений /Искусственный интеллект. Кн.2. // Под.ред. Д.А. Поспелова -М.: Радио и связь. 1990. С. 142-191.
2. К. Фу. Структурные методы в распознавании образов: Пер. с англ. -М. Мир, 1977.
3. Розенфельд А. Распознавание и обработка изображений М.: Мир. 1972.
4. Василенко Г.И. Голографическое опознавание образов М.: Сов. радио, 1977.
5. Дуда Р., Харт П. Распознавание образов и анализ сцен М.: Мир1977.
6. Горелик A.A., Скрипкин В.А. Методы распознавания. М.: Высш. шк., 1984.
7. Павлидис Т. Алгоритмы машинной графики и обработки изображений: Пер. с англ. М: Радио и связь, 1986.
8. Ту Д., Гонсалес Р. Принципы распознавания образов.- М.: Мир,1978.- 411с
9. Айзерман М.А., Браверман Э.М., Розаноэр Л.И. Метод потенциальных функций в теории обучения машин.- М.: Наука, 1970.- 384с.
10. Прэтт У. Цифровая обработка изображений. Кн. 1-2. М.: Мир, 1982.
11. Фу К., Гонсалес Р., Ли К. Робототехника: Пер. с англ. М.: Мир, 1989.
12. Барабаш Ю.л., Варский Б.В., Зиновьев В.Т., Кириченков B.C., Сапегин В.Ф. Вопросы статистической теории распознавания/ Под ред. Барского Б.В. М.: Сов. радио, 1977.
13. Фомин Я.А. Т Тарловский Г.Р. Статистическая теория распознавания образов -М.: Радио и связь 1986,-С.264.
14. Фукунага А. Введение в статистическую теорию распознавание образов: пер. с англ. /Под ред A.A. Дородона .М.: Наука ,1979, С.367.
15. Введение в контурный анализ и его приложения к обработке изображений и сигналов: /Я.А. Фурман, A.B. Кревецкий, А.К. Передреев, A.A. Роженцов, Р.Г. Хафизов, И.Л. Егошина, А.Н. Леухин; -2-е изд., испр.-М.: ФИЗМАТЛИТ, 2003.-592 с.
16. Тюктин B.C. Теория автоматического опознавания и гносеология. М: наука,1975. - 192с.
17. Журавлев Ю.И. Об алгебраическом подходе к решению задач распознавания и классификации //Проблемы кибернетики. М: Наука, 1978, Вып ЗЗ.С.5-68.
18. Гренандер У. Лекции по теории распознавания образов: Пер. с англ. М.: Мир, 1979-1983. В 3-х томах.
19. Журавлев Ю.И. Никифоров В.В. Алгоритмы распознавания, основанные на вычислении оценок // Кибернетика. 1971, №3, С.1-11.
20. Гуревич И.Б., Журавлев Ю.И. Минимизация булевых функций и эффективные алгоритмы распознавания// Кибернетика. 1974. №3. С.16-20.
21. Препарата Ф., Шеймос М. Вычислительная геометрия: Введение: Пер. с англ. М.:Мир,1989,478с.
22. Горелик А.Л., Гуревич И.С., Скрипкин В.А. Современное состояние проблемы распознавания. Некоторые аспекты. М.: Радио и связь, 1985. -162 С.
23. Дмитриев А.Н., Журавлев Ю.И., Кренделев Ф.П. О математических принципах классификации предметов и явлений//Дискретный анализ. Новосибирск: Ин-т математики СР АН СССР, 1966 — Вып.7. — С.13-15.
24. Журавлев Ю.И. Экстремальные задачи, возникающие при обобщении эвристических процедур// Проблемы прикладной математики и механики. М.: Наука -1971. С.67-75.
25. Журавлев Ю.И. Корректные алгебры над множествами некорректных (эвристических) алгоритмов// Кибернетика. 1978. №.2. С.35-43.
26. Comment on Ignorance, Myopia and Naivete in Computer Vision Systems by M.A. Snuder / Jain Ramech C., Binford Thomas O. // CVGIP: Image Understand -1991, vol.53, №1, p.112-117.
27. Jain R.C., Binford Т.О. Revolutions and experimental computer vision / Bowyer Kevin W., Jons Judson P. // CVGIP: Image Understand 1991, - vol.53, №1, p. 127-128.
28. Психология машинного зрения. Под редакцией П. Уинстоуна: Пер. с англ. Под ред. В.Л. Стефанюка. М.: Мир, 1978. С.346.
29. Фор А. Восприятие и распознавание образов/ Пер. с фр. А.В. Серединского; под ред. Г.П. Катыся. М.-.Машиностроение,1989. С.272.
30. R.C. Dorf et Nezamber A robot ultrasonic sensor for object recognition// Robots 8, Conf. Proc. Detroit, 1984. P.21-44.
31. M. Oshima et Y. Shiral. A sceue description method usinq 3D information// Pattern Recoq., Vol. 11,1979.P.9-17.
32. ZuckerS.W., Hummel R.A. A Three Dimensional Edge Operator// IEEE Trans. Patter Anal. Mach. Intel, PAMI-3,№3., 1981.pp.324-331.
33. Y. Shiral et M. Suwa. Recoqnition of polyhedrons with a range finder// Proc.2 and Int. Joint. Conf. on Artificial Intelligence, 1971. P.80-87.
34. Y. Shiral Three Dimensional Computer Vision, in Computer Vision and Sensor Based Robots (G.G/ Dodd and L. Rossol, eds), Plenum N.Y.,1979.
35. Person E., Fu K. Shape discrimination Using Fourier Descriptors // IEEE Transactions, Man and Cybernetics. -1977, vol. SMC-7, №3, - p.p. 170-179.
36. Richard C.W., Hemani H. Identification of Three-Dimentio-nall Objects Using Fourier Descriptions of the Boundary Curve. // IEEE Transactions on Systems, Vfn and Cybernetics. -1974, vol. SMC-4, №4, p.p. 371-378.
37. Grandlund G.h. Fourier Preprocessing For Hand Print Character Recognition // IEEE Transactions on Computers. 1972, - vol.C-21, №2, p. 195201.
38. Zahn C.T., Roskies R.Z. Fourier Descriptors For Plane Closed Curves // IEEE Transactions on Computers. 1972, - vol.C.-21, №3, - p.269-281.
39. R.C. Dorf et A.Nezamfar. A robot ultrasonic sensor for object recognition// Robots 8, Conf. Proc, Detroit, 1984.p.p. 21-44.
40. Комплекснозначные и гиперкомплексные системы в задачах обработки многомерных сигналов / Я.А. Фурман, A.B. Кревецкий, A.A. Роженцов, Р.Г. Хафизов, А.Н. Леухин, ИЛ. Егошина; Под. ред. Я.А. Фурмана. -М.:ФИЗМАТЛИТ, 2004. -456 .с.
41. Фурман Я.А., Рябинин К.Б. Нахождение параметров вращения пространственного группового точечного объекта по результатам его фильтрации//Радиоэлектроника, т.53, №1, 2008. С.86-97.
42. Зинченко В.П., Ломов В.Ф. О функциях движения руки и глаза в процессе восприятия изображения // Вопросы психологии. 1960, N1. С. 29-41.
43. Распознавание образов. Исследование живых и автоматических решающих систем. М.: Мир, 1970.
44. Математическая энциклопедия. М.: Сов. энциклопедия, 1977.т.5.
45. Фурман Я.А. О понятии формы плоского изображения // Автометрия, 1992. №5. С. 113-120.
46. Ковязин С.А. О понятии средней формы случайного измеримого множества // Динамика химических и биологических систем: Сб. науч. тр. / Под ред. В.И. Быкова. Новосибирск: Наука, 1989.
47. Бакут П.А., Колмогоров Г.С., Ворновицкий И.Э. Сегментация изображений: Методы пороговой обработки // Зарубежная радиоэлектроника. 1987. N10. С.6-24.
48. Бакут П.А., Колмогоров Г.С. Сегментация изображений: Методы выделения границ областей // Зарубежная радиоэлектроника. 1987. N10. С.25-47.
49. Анисимов Б.В., Курганов В.Ф., Злобин В.К. Распознавание и цифровая обработка изображений. М.: Высшая школа, 1983.
50. Денисов Д.А., Низовкин В.А. Сегментация изображений на ЭВМ// Зарубежная радиоэлектроника. 1985. N10. С.5-30.
51. Бутаков Е.А., Островский В.И., Фадеев И.Л. Обработка изображений на ЭВМ. М.: Радио и связь, 1987.
52. А.Л. Горелик, ЮЛ. Барабаш, О.В. Кривошеев, С.С. Эпштейн. Селекция и распознавание на основе локационной информации. Под ред. А.Л. Горелика. М.: Радио и связь, 1990.
53. Ярославский Л.П. Введение в цифровую обработку изображений. М.: Сов. радио, 1979.
54. Семенков О.И., Абламейко C.B., Берейщик В.И., Старовойтов И.И. Обработка и отображение информации в растровых графических системах. -Минск: Наука и техника, 1989.
55. Применение цифровой обработки сигналов. Под ред. Э. Оппенгейма. М.: Мир, 1980.
56. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1979.
57. Системы технического зрения (принципиальные основы, аппаратное и математическое обеспечение) / А.Н. Писаревский, А.Ф. Чернявский, Г.К. Афанасьев и др.; Под общ. ред. А.Н. Писаревского, А.Ф. Чернявского. Л.: Машиностроение. Ленингр. отд-ние, 1988.
58. Техническое зрение роботов / Под ред. А. Пью; Пер. с англ. Д.Ф. Миронова; Под ред. Г.П. Катыса. М.: Машиностроение, 1987.
59. Техническое зрение роботов / В.И. Мошкин, А.А. Петров, B.C. Титов, Ю.Г. Якушенков; Под общ. ред. Ю.Г. Якушенкова. М.: Машиностроение, 1990.
60. Распознавание образов. Исследование живых и автоматических решающих систем. М.: Мир, 1970.
61. Грановская P.M., Березная И.Я. Запоминание и узнавание фигур. -М.: ЛГУ, 1974.
62. Интегральные роботы: Сб. ст. / Пер. с англ.; Под ред. Г.Е. Поздняка. М.: Мир, 1973.
63. Интегральные роботы: Сб. ст. / Пер. с англ. и яп.; Под ред. Г.Е. Поздняка. Вып. 2. М.:
64. Надь Г. Цифровая обработка изображений, получаемых при дистанционном зондировании природных ресурсов // Распознавание образов при помощи вычислительных машин / Под ред. Л. Хармона. М.: Мир, 1972.
65. Чукин Ю.В. Структуры данных для представления изображений // Зарубежная радиоэлектроника. 1983. N1. С. 85-107.
66. Небабин В.Г., Сергеев В.В. Методы и техника радиолокационного распознавания. М.: Радио и связь, 1984.
67. Методы компьютерной обработки изображений/ Под ред В.А. Сойфера М.: Физматлит. 2001. 784 с.
68. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера. 2005.1072С.
69. Баскаков С.И. Радиотехнические цепи и сигналы. М.: Высш. шк., 1983.
70. Сосулин Ю.Г. Разрешение и распознавание радиосигналов: Уч. пособие.-М.: Изд-во МАИ.
71. Сосулин Ю.Г. Теория обнаружения и оценивания стохастических сигналов. М.: Сов радио, 1978.
72. Лезин Ю.С. Оптимальные фильтры и накопители импульсных сигналов. М.: Сов. радио. 1969.
73. Радиотехнические системы: Учебн. для вузов по спец. "Радиотехника" / Ю.П.Гришин, В.П. Ипатов, Ю.М. Казаринов и др.: Под. ред. Ю.М. Казаринова. М.: Высш. шк. 1990.
74. Харкевич A.A. Борьба с помехами. М.: Сов. радио, 1965.
75. Ефимов Н.В., Розендорн Э.Р. Линейная алгебра и многомерная геометрия. М.: Главная редакция физико-математической литературы "Наука", 1974.
76. Кантор И.Л., Солодовников A.C. Гиперкомплексные числа. М.: Наука, 1973. 144 с.
77. Шашкин Ю.А. Эйлерова характеристика -М.: Наука, 1984.
78. Pyt'ev Yu.P. Morphological Image Analysis// Pattern Recognition and Image Analysis, v. 3, № 1,1993, pp. 19-28.
79. Пытьев Ю.П., Чуличков А.И. Морфологический и нечеткий анализ изображений групп точечных объектов// Материалы научно-технической конференции «Математические методы распознавания образов», Звенигород, 1993.
80. Пытьев Ю.П. Морфологический анализ изображений// Докл. АН СССР, т. 269, №5,1983.
81. Пытьев Ю.П. Задачи морфологического анализа изображений// В сб. Математические методы исследования природных ресурсов Земли из космоса. Под ред. В.Г. Золотухина. М.: Наука, 1984.
82. Пытьев Ю.П., Чуличков А.И. ЭВМ анализирует форму изображений. -М.: Знание, 1988.
83. Чуличков А.И. Анализ и распознавание формы сигнала, искаженного линейным преобразованием// Материалы научно-технической конференции «Математические методы распознавания образов», Рига, 1989.
84. Фурман Я.А. Спектральный анализ замкнутых полигональных контуров плоских изображений// Радиотехника, 1994. N2 12. С.41-44.
85. Егошина И.Л., Михайлов А.И., Фурман Я.А. Оценка степени сходства двух плоских форм//Автометрия, 1995. № 4. С.19-26.
86. Фурман Я.А. Основы теории обработки контуров изображений: Учебное пособие для вузов. Йошкар-Ола: МарГТУ, 1997.
87. Кревецкий A.B. Распознавание трехмерных объектов по форме пространственных контуров//Автометрия, 2001. № 2. С. 21-31.
88. Васин Ю.Г., Жерздев C.B., Егоров A.A. Мобильная морская навигационная система на КПК// Материалы Всероссийской конференции «Распознавание образов и анализ изображений: новые информационные технологии РОАИ-9-2008» Нижний Новгород, 2008 - ч.2. С.180-182.
89. Gosgriff R.L. Identification of Shape, Ohio State University Re search Foundation, Cjlumbus, Ohio, Report 820-11, ASTIA AD-25-4792, Dezember,1960.
90. Иванов B.A. и др. Математические основы теории автоматического регулирования/ Под ред. Б.К. Чемоданова. М.: Высшая школа, 1971.
91. Тихонов В.И. Статистическая радиотехника.- М.: Сов. радио, 1966.-678с.
92. Сергеев Г.А., Януты Д.А. Статистические методы исследования природных объектов.-Л.: Гидрометеоиздат, 1973.
93. Левшин В.Л. Пространственная фильтрация в оптических системах навигации. М.: Сов. радио, 1971.
94. Фурман Я.А, Егошина И.Л. Обработка контуров изображений с протяженными прямолинейными границами//Автометрия, 1999. № 6. С. 93104.
95. Пугачев B.C., Синицын И.H. Стохастические дифференциальные системы. Анализ и фильтрация. М.: Наука. - гл. ред. физ.-мат лит., 1990.
96. Фурман Я.А., Хафизов Р.Г. Согласованно-избирательная фильтрация изображений протяженной формы в реальных ландшафтных сценах// Автометрия, 1999. № 2. С. 12-27.
97. Хафизов Р.Г. Синтез и анализ системы обнаружения изображений коммуникационных объектов на фоне подстилающей поверхности. Диссертация на соискание ученой степени кандидата технических наук// КГТУ им. А.Н. Туполева, Казань. 1998.
98. Роженцов A.A. Потенциальная эффективность распознавания комплекснозначных и кватернионных сигналов/ Приборостроение. 2006. №4. С.26-35.
99. Коростелев С. Метод распознавания объектов на основе трехмерных эталонов// Материалы Всероссийской конференции «Распознавание образов и анализ изображений: новые информационные технологии РОАИ-9-2008» Нижний Новгород, 2008-ч.2. С. 293-330.
100. Хафизов Р.Г. Обнаружение и оценка параметров плоских изображений// Известие Вузов. Приборостроение. 2006, № 4. С. 36-45.
101. Гарднер М. Математические головоломки развлечения. Пер. с англ. -М.: Мир, 1971.
102. Фурман Я.А., Горинов C.B. Параллельное распознавание образов разных классов//// Материалы Всероссийской конференции «Распознавание образов и анализ изображений: новые информационные технологии РОАИ-9-2008»-Нижний Новгород, 2008-ч.1. С. 329-332.
103. Furman Ya.A., Khafizov R.G. Detection of Extended Object Images in Optical Scenes// Pattern Recognition and Image Analysis, N2 2, 1998, pp. 267268.
104. Бакулев П.А., Сосновский A.A. Радиолокационные и радионавигационные системы: Учеб. Пособие для вузов. М.: Радио и связь, 1994.
105. Клочко В.К., Шейнина И.В. Сравнительный анализ алгоритмов распознавания изображений объектов бортовыми РЛС// Радиотехника, 2003, № 12. С. 3-9.
106. Самарин О.Ф., Курилка В.В. Концепция выполнения маловысотного полета летательными аппаратами с помощью автономных БРЛС// Радиотехника, №4,1998.
107. Баклицкий В.К., Бочкарев A.M., Мусьянов М.П. Методы фильтрации сигналов в корреляционно-экстремальных системах навигации/ Под ред. В.К. Баклицкого. М.: Радио и связь, 1986.
108. Клочко В.К., Ермаков А.А. Алгоритм фильтрации и сегментации трехмерных радиолокационных изображений поверхности// Изв. СО РОАН. Сер. Автометрия, № 1,1993.
109. Клочко В.К. Выделение меняющихся изображений в условиях неопределенности// Изв. СО РОАН. Сер. Автометрия, N° 2, 1996.
110. Khafizov R.G. Modeling point fields on 3D objects surfaces// 9th International Conference "Pattern Recognition and Image Analysis: New1.formation Technologies" (PRIA-9-2008). Conference Proceedings. — Nizhni Novgorod, 2008. Pp. 284-286.
111. Фурман Я.А., Хафизов, P.Г., Роженцов A.A. Фильтрация кватернионных сигналов// Радиотехника и электроника, 2007, т. 52, № 1.
112. Khafizov R.G. Recognition of spatial image by means of form// 8th International Conference "Pattern Recognition and Image Analysis: New Information Technologies" (PRIA-8-2007). Conference Proceedings. Yoshkar-Ola, 2007. Pp. 146-149.
113. Хафизов P.Г. Анализ непрерывных комплекснозначных сигналов, задающих контуры изображений плоских изображений// Вестник Казанского государственного технического университета им. А.Н. Туполева. 2006, №4.
114. Хафизов Р.Г., Ворожцов Д.М. Нейронная система обнаружения 3D изображений объектов рентгеновской томографии// Биомедицинские технологии и радиоэлектроника. 2006, № 1-2. С. 89-95.
115. Хафизов Р.Г. Распознавание 2D и 3D изображений по их форме в системах навигации летательных аппаратов// Материалы Международной научно-практической конференции «Авиакосмические технологии и оборудование. Казань-2006». Казань, 2006.
116. Фурман Я.А., Роженцов A.A. О потенциальной эффективности распознавания k-мерного группового точечного объекта// Радиотехнические тетради, № 2, 2004.
117. Попечителев Е. П. Методы медико-биологических исследований. Системный аспект. Житомир: ЖИТИ, 1997.
118. Физика визуализации изображений в медицине: в 2-т.: Пер. с англ. /Под. ред. С. Уэбба. М.: Мир, 1991.
119. Поммерт А., Пфлессер Б., Риемер М. и др. Визуализация объема в медицине// Открытые системы, 1996, N5, стр. 56-61.
120. Laur D., Hanrahan P. Hierarchical splatting: A progressive refinement algorithm for volume rendering//Comput. Graphics 25, 4 (1991), 285-288.
121. Chen L. S., Herman G. Т., Reynolds R. A., Udupa J. K. Surface sh ding in the cuberille environment// IEEE Comput. Graphics Appl. 5,12 (1985), 33-43.
122. Lorensen W. E., Cline H. E. Marching cubes: A high resolution 3D surface construction algorithm// Comput. Graphics 21, 4 (1987), 163-169.
123. Drebin R. A., Carpenter L., Hanrahan p. Volume rendering//Comput. Graphics 22, 4 (1988), 65-74.
124. Levoy M. A hybrid ray tracer for rendering polygon and volume datcy// IEEE Comput. Graphics Appl. 10, 2 (1990), 33-40.
125. Левшин В.Л. Пространственная фильтрация в оптических системах навигации. М.: Сов. радио, 1971.
126. Аркадьев А.Г., Браверман В.Н. Обучение машин классификации объектов. -М: Наука, 1971.192 с.
127. Witman R.L., О. Rear R.L. Automating clustering of syntheting aperture radar (SAR) targete// IEEE. NAECON. 1980. № 3. P. 717-724.
128. Хафизов P.Г. Распознавание кватернионных сигналов на основе их представления в собственной системе отсчета// Труды 11-й Всероссийской конференции «Математические методы распознавания образов». Москва. 2003. С. 471-473.
129. Krevetskii A.V., Khafizov R.G, Egoshina I.L., Leukhin A.N., Vorozhtsov
130. D.M. Detection and Recognition of Three-Dimensional Anthropogenous Objects// 7th International Conference on "Pattern Recognition and Image Analysis". St. Peterburg. 2004. Pp. 756-759.
131. Furman Ya.A., Khafizov R.G. Detection of Extended Object Images in Optical Scenes// Pattern Recognition and Image Analysis, № 2, 1998, pp. 267268.
132. Фурман Я.А., Хафизов Д.Г. Распознавание групповых точеченых объектов в трехмерном пространстве// Автометрия, 2003, №1. С.3-18
133. Кревецкий A.B. Распознавание образов, заданных множеством характерных точек на плоскости изображения// Автометрия, 1999. № 2. С. 28-36.
134. Зиман Я.Л., Красиков В.А., Алексешина Г.А. Алгоритм опознавания звезд на снимках.-В кн.: Аэрокосмические исследования Земли: Обработка видеоиформации на ЭВМ.-М.: Наука, 1978. С.79-86.
135. Фурман Я.А., Роженцов A.A., Хафизов Р.Г. Дискретно-кодированные сигналы на базе композиционных контуров// Автометрия, 1996. № 1. С.72-79.
136. Furman Ya. A. Processing of Quaternion Signals Specifying Spatially Located Group Point Objects// Pattern Recognition and Image Analysis, Vol. 12. № 2, 2002. pp. 175-193.
137. Кревецкий A.B. Обработка изображений в системах ориентации летательных аппаратов. Йошкар-Ола: Изд-во МарГТУ, 1998. -149 с.
138. К решению проблемы визуализации и анализа 3D сцен, распознавания пространственных образов методами кватернионного исчисления// Отчет по гранту РФФИ, проект 07-01-00058-а, 2007.
139. К решению проблемы визуализации и анализа 3D сцен, распознавания пространственных образов методами кватернионного исчисления// Отчет по гранту РФФИ, проект 07-01-00058-а, 2008.
140. Хафизов Р.Г., Фурман Я.А. Математические основы распознавания изображений по их форме на базе контурного и кватернионного анализа// Марийск. гос. техн. ун-т Йошкар-Ола, 2009. Деп. в ВИНИТИ № 375 В2009.
141. Фурман Я.А., Хафизов Р.Г. Методы и алгоритмы обработки и распознавания плоских и объемных изображений по их форме// Марийск. гос. техн. ун-т Йошкар-Ола, 2009. Деп. в ВИНИТИ № 376 В2009.
142. Рябинин К.Б. Обработка и распознавание трехмерных изображений групповых точечных объектов и точечных полей на базе их кватернионныхмоделей. Диссертация на соискание ученой степени кандидата технических наук// УГТУ, Ульяновск. 2008.
143. Ворожцов Д.М. Синтез и анализ нейросетевой системы обнаружения 3D изображений объектов рентгеновской томографии. Диссертация на соискание ученой степени кандидата технических наук// МарГТУ, Йошкар-Ола. 2006.
144. Хафизов Р.Г., Егошина И .Л. Распознавание плоских зашумленных изображений по их форме// Известие Вузов. Приборостроение. 2006, № 4. С. 46-51.
145. Хафизов, Р.Г., Григорьевых Е.А. Применение комплекснозначных сигналов в системах асинхронной передачи данных// Телекоммуникации. 2007, № 10.
146. Furman Ya.A., Khafizov R.G., Rozhentsov A.A. Filtering of quaternion signals//Journal of Communications Technology and Electronics. 2007.
147. Хафизов, P.Г., Третьякова Ю.Е. Информационная технология визуализации и многоцелевого анализа пространственных динамическихизображений предстательной железы для подготовки и проведения трансуретральной операции // Вестник МарГТУ, 2008, №2.
148. Хафизов Р. Г., Егошина И. Л., Фурман Я. А., Хафизов Д. Г. Программа для решения обратной задачи вращения поливекторных сигналов // Свидетельство о государственной регистрации программы для ЭВМ № 2009610894 от 09.02.2009.
149. Хафизов Р.Г., Хафизов Д.Г. Распознавание групповых точечных объектов на основе представления в собственной системе отсчета// Автометрия, № 3. 2005 г. С. 19-30.
150. Furman Ya.A., Khafizov R.G. Matched-Selective Filtering of Stretched Images in Real Landscape Scenes// Optoelectronics, Instrumentation and Data Processing. No. 2, pp. 10-23,1999.
151. Furman Y.A., Khafizov R.G. Detection of Images of Extended-Shape Object Among the Scenes of Underlying Surface// Pattern Recognition and Image Analysis, Vol. 8, No 4, 1998, pp. 612-640.
152. Khafizov R.G., Furman Ya.A., Khafizov D.G. Image Recognition of Spatial Objects on the Basis of Their Quaternion Models// Pattern Recognition and Image Analysis, Vol. 13, No. 1, 2003, pp. 101-102.
153. Фурман Я.А., Кревецкий A.B., Хафизов P.Г. Изображения ориентиров оптимальной формы// Вестник ВВО АТН РФ. Серия «Высокие технологии в радиоэлектронике, информатике и связи», 2000. С. 19-28.
154. Хафизов Р.Г., Ворожцов Д.М., Чернов Д.С. Программный комплекс по исследованию статистических характеристик изображений. Свидетельство об официальной регистрации программы для ЭВМ N2 2005610655, РОСПАТЕНТ, 17.03.2005.
155. Хафизов Р.Г., Хафизов Д.Г., Фурман Я.А., Лапин C.B. Расчет характеристик распознавания гиперкомплексных сигналов// Свидетельство об официальной регистрации программы для ЭВМ №2003611694, РОСПАТЕНТ, 16.07.2003.
156. Фурман Я .А., Хафизов Р.Г., Ворожцов Д.М., Мальгин Ю.Ю., Кириллов Д.В. Программный комплекс для построения контурных сцен «POCOS» // Свидетельство об официальной регистрации программы для ЭВМ № 2005612227, РОСПАТЕНТ, 1.09.2005.
157. Фурман Я.А., Хафизов Р.Г. Обнаружение изображений объектов протяженной формы в оптических сценах// Материалы Всероссийской конференции «Распознавание образов и анализ изображений». Нижний Новгород, 1997. 4.1. С. 283-285.
158. Леухин А.Н., Хафизов Р.Г. Прослеживание протяженных объектов на многоградационном изображении// Материалы Всероссийской научно-технической конференции «Компьютерные технологии в науке, проектировании и производстве». Нижний Новгород. 1999.
159. Хафизов Р.Г. Повышение качества обработки и анализа изображений рентгенограмм за счет учета шумовых свойств фона// Сборник материалов 5-ой международной конференции «Распознавание-2001». Курск. 2001.
160. Хафизов Р.Г. Анализ процесса прослеживания протяженного объекта на многоградационном изображении на основе t- критерия// Вестник ВВО АТН РФ. Серия "Высокие технологии в радиоэлектронике", 1997. С. 63-66.bL)ция «Тактическое ракетное вооружение»
161. Научно-техническая комиссия из представителей открытого акционерного общества «Уральское проектно-конструкторское бюро «Деталь», созданная в соответствии с указанием директора предприятия, в составе:
162. Председатель начальник НИО-200 Нестеров Ю. Г.;
163. Материалы диссертации использованы при выборе набора информативных признаков и методов распознавания целевой обстановки.
164. Полученные в диссертационной работе Хафизова Р.Г. результаты будут использованы для составления технических заданий на разработку новых перспективных информационных и технических систем специального назначения.
165. Председатель комиссии: д.т.н., снс1. А.Кониченко
166. Члены комиссии: д.т.н., профессор1. А.Сизовк.т.н., доцент1. А.Миргалеев
-
Похожие работы
- Многомерный гиперкомплексный контурный анализ и его приложения к обработке изображений и сигналов
- Разработка эвристических и квазитопологических алгоритмов контурной сегментации изображений в автоматизированных производственных системах
- Инвариантное представление изображений для распознавания космических объектов
- Разработка, исследование и практическое применение алгоритмов описания объектов для их распознавания
- Разработка и исследование методов анализа и обработки графической информации в условиях неопределенности
-
- Теоретические основы радиотехники
- Системы и устройства передачи информации по каналам связи
- Радиотехника, в том числе системы и устройства телевидения
- Антенны, СВЧ устройства и их технологии
- Вакуумная и газоразрядная электроника, включая материалы, технологию и специальное оборудование
- Системы, сети и устройства телекоммуникаций
- Радиолокация и радионавигация
- Механизация и автоматизация предприятий и средств связи (по отраслям)
- Радиотехнические и телевизионные системы и устройства
- Оптические системы локации, связи и обработки информации
- Радиотехнические системы специального назначения, включая технику СВЧ и технологию их производства