автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Методы распознавания 3D изображений на основе их кватернионных моделей

кандидата технических наук
Баев, Алексей Александрович
город
Нижний Новгород
год
2011
специальность ВАК РФ
05.13.17
Диссертация по информатике, вычислительной технике и управлению на тему «Методы распознавания 3D изображений на основе их кватернионных моделей»

Автореферат диссертации по теме "Методы распознавания 3D изображений на основе их кватернионных моделей"

ОО&ииии—

На правах рукописи

БАЕВ АЛЕКСЕИ АЛЕКСАНДРОВИЧ

МЕТОДЫ РАСПОЗНАВАНИЯ ЗБ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ИХ КВАТЕРНИОННЫХ МОДЕЛЕЙ

Специальность 05.13.17-Теоретические основы информатики

1 7 НОЯ 2011

Автореферат диссертации на соискание ученой степени кандидата технических наук

Нижний Новгород - 2011

005000845

Работа выполнена на кафедре радиотехнических и медико-биологических систем в Марийском государственном техническом университете (г. Йошкар-Ола)

Научный руководитель: доктор технических наук, доцент

Роженцов Алексей Аркадьевич

Официальные оппоненты: доктор технических наук, профессор

Утробин Владимир Александрович

доктор физико-математических наук Леухин Анатолий Николаевич

Ведущая организация: НИИ ПМК ННГУ им Н.И. Лобачевского,

г. Нижний Новгород

Защита диссертации состоится « 8 » декабря 2011 года в 15 часов в ауд. 1258 на заседании диссертационного совета Д212.165.05 при Нижегородском государственном техническом университете им. P.E. Алексеева по адресу: 603600, г. Нижний Новгород, ул. Минина, 24

С диссертацией можно ознакомиться в библиотеке Нижегородского государственного технического университета им. P.E. Алексеева

Автореферат разослан « 3 » ноября 2011 года.

Ученый секретарь диссертационного совета ¡л/ A.C. Суркова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время широко ведутся разработки систем распознавания образов для применения в автономных транспортных средствах различных операционных сред: для города и бездорожья (мобильное патрулирование), для подводных работ (поисковые и исследовательские), дистанционно пилотируемые летательные аппараты. Одной из ключевых систем автономных транспортных средств является система технического зрения. Ее задачами являются сбор, обработка и преобразование сенсорной информации в сигналы, удобные для использования в системе управления. Данные с входящих в систему технического зрения ультразвуковых сенсоров, лазерных дальномеров могут быть искажены помехами и шумами (например, в зоне задымления или запыленности), в этом случае, принятие необходимых решений системой распознавания образов затрудняется. Обработка данных в реальном времени усложняется ввиду высоких требований к производительности цифрового процессора.

Важнейшие результаты в области обработки изображений и распознавания образов получены отечественными научными школами Ю.И. Журавлева, В.А. Сойфера, B.C. Киричука, Ю.Г. Васина, В.А. Ут-робина, В.В. Кондратьева, B.C. Титова, К.К. Васильева и E.JI. Столова, а также зарубежными школами, в частности школой Принстонского университета. Ряд сложившихся к настоящему времени подходов к обработке 3D изображений базируется на вексельных моделях и связан с трудоемкими процедурами вычисления трехмерного градиента для выделения плоских фрагментов. Методы, базирующиеся на сферическом гармоническом анализе, нашли применение при решении задач биометрический идентификации, астроориентации и т.п. В последнее время получили развитие методы, основанные на представлении 3D изображений и точечных полей в виде кватернионных сигналов, предполагающие переход к формированию описания объекта в виде контура многогранника. Контурные методы обработки обладают высокой эффективностью в условиях, когда известна нумерация векторов, образующих контур данного изображения. В этом случае возможно формирование меры схожести плоских или 3D изображений на основе согласованной фильтрации их контуров, а при обработке плоских изображений - получать и оценки параметров линейных преобразований. Данный подход приемлем как в отношении сплошных изображений, так и в отношении групповых точечных объектов, однако его применение в этом случае требует знания нумерации векторов контура или отметок в составе группового точечного объекта, поскольку в противном случае

формирование импульсной характеристики фильтра, согласованного с контурным описанием данного объекта, невозможно. В случае контуров плоских сплошных изображений нумерация векторов в контуре обеспечивается естественным образом при прослеживании контура объекта. Однако для 30 изображений и изображений групповых точечных объектов приходится вводить определенные правила нумерации. При этом возможно возникновение ошибок в аналитическом описании в условиях воздействия координатных шумов, появления ложных отметок или пропуска сигнальных, что затрудняет использование контурной согласованной фильтрации.

Таким образом, актуальной задачей является разработка методов и алгоритмов обработки 30 изображений, обладающих высоким быстродействием, помехоустойчивостью, инвариантностью к нумерации отсчетов и преобразованиям масштаба и вращения.

Объектом исследования является система распознавания образов информационных систем, а предметом исследования - методы распознавания ЗО изображений, заданных неупорядоченными отсчетами.

Цель и задачи исследования. Целью исследования является разработка методов распознавания ЗО изображений на основе их кватерни-онных моделей в системах технического зрения.

Для достижения поставленной цели требуется решение следующих задач:

1. Обзор и сравнительный анализ методов распознавания 30 изображений в информационных системах.

2. Разработка метода распознавания 30 изображений с неупорядоченными отсчетами в виде функции кватернионного переменного.

3. Оценка эффективности метода распознавания и обработки 30 изображений для решения задач распознавания и измерения параметров в условиях воздействия координатных шумов.

4. Оценка вычислительной трудоемкости предложенного метода обработки ЗО изображений. Повышение его быстродействия за счет применения параллельных вычислений.

5. Разработка устройства распознавания на базе предложенного метода обработки 30 изображений и его реализация на программируемой логической интегральной схеме (ПЛИС).

Методы исследования. При проведении диссертационного исследования использованы методы теории функции гиперкомплексного переменного, контурного анализа изображений пространственных объектов, теории вероятностей и математической статистики, методы математического моделирования.

Научная новизна:

1. Разработан метод описания 30 изображений в виде полиномиальной функции кватернионного переменного, проецирующей отсчеты с поверхности объекта на единичную сферу. На его основе разработаны алгоритмы распознавания и измерения параметров ЗО изображений.

2. Разработана методика повышения быстродействия путем распараллеливания вычислений с использованием технологии многопоточного программированияна графическом и центральном процессорах при обработке ЗБ изображений на базе проецирующей функции.

3. Разработано устройство распознавания на базе предложенного метода, реализованное на ПЛИС.

Практическая ценность. Разработанные методы обработкии распознавания трехмерных изображений позволяют синтезировать эффективные системы их обработки, применяемые в локационных системах, системах биометрической идентификации, системах навигации и управления автономными транспортными средствами.

Защищаемые положения:

1. Модель представления трехмерных объектов в виде проецирующей полиномиальной функции кватернионного переменного инвариантная к нумерации отсчетов на их поверхности, сохраняющая информацию о параметрах вращения и масштабирования и обеспечивающая возможность их определения.

2. Методы оценки параметров вращения и масштабирования и распознавания 30 изображений пространственных объектов на основе полиномиальной функции кватернионного переменного, обеспечивающие возможность обработки 30 изображений пространственных объектов в условиях воздействия координатных шумов.

3. Методы аппаратной и программной реализации устройства распознавания 30 изображений пространственных объектов системы технического зрения автономного транспортного средства.

Публикация результатов. По теме диссертации опубликованы 22 печатные работы, в том числе 3 статьи в журналах, рекомендованных ВАК РФ для публикации основных результатов диссертаций, 12 работ в журналах и трудах конференций. Получено 7 свидетельств Роспатента о регистрации программ для ЭВМ.

Практическая значимость. Научные и практические результаты диссертационной работы внедрены в разработкиОАО «Марийский машиностроительный завод» концерна «Алмаз-Антей», ООО «НИЦ Кибернетики и Автоматики», а также использованы при выполнении грантов РФФИ «Решение проблемы распознавания и оценки параметров 20

и 3D изображений при неизвестной нумерации отсчетов их контуров на базе теории функции комплексного и гиперкомплексного переменного», проект №08-01-00854-3, «Решение проблемы распознавания и оценки параметров многоградационных и цветных 3D изображений сложной формы при неизвестной нумерации их отсчетов на базе методов теории функции гиперкомплексного переменного», проект №10-01-00445-а, по программе «Развитие научного потенциала высшей школы», проекты 2.1.2/2204 и 2.1.2/10218, использованы в учебном процессе на радиотехническом факультете Марийского государственного технического университета по дисциплинам «Радиотехнические системы», «Цифровая обработка радиотехнических сигналов», «Цифровые устройства и микропроцессоры», «Научно-исследовательская работа в семестре», в курсовом и дипломном проектировании. Акты о внедрении приведены в приложении к диссертации.

Достоверность и обоснованность полученных результатов обусловливается корректным использованием адекватного математического аппарата, методов математического моделирования и логической обоснованностью выводов, согласованностью с известными научными положениями, актами о внедрении.

Апробация полученных результатов. Основные результаты диссертационной работы обсуждались на 10-й Международной научно-технической конференции и выставке «Цифровая обработка сигналов и ее применение» (г. Москва, 2008 г.), Ш-й молодежной научной конференции «Тинчуринские чтения» (г. Казань, 2008г.), Всероссийской конференции «Математические методы распознавания образов» (ММРО -14 г. Суздаль, 2009г. и ММРО - 15 г. Петрозаводск, 2011 г.), научной школе для молодых ученых «Компьютерная графика и математическое моделирование (Visual Computing)» (г. Москва, 2009 г.), IX Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание-2010» (г. Курск, 2010 г.), 4-й международной конференции «Распределенные вычисления и грид-технологии в науке и образовании» (г. Дубна, 2010 г.), а также на IX и X международных конференциях «Распознавание образов и обработка изображений» (г. Н.Новгород, 2008 г. и г. Санкт-Петербург, 2010 г.).

Личный вклад автора заключается в участии в постановке целей и задач исследования, получении, обработке и анализе основных результатов, интерпретации и обобщении полученных данных, формулировке выводов и основных научных положений.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованной литературы из 84 наименований. Общий объем диссертации 131 страниц машинописного текста, содержит 51 рисунок и 4 таблицы.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

В главе 1 рассмотрены методы обработки 3D изображений в системах технического зрения. Показано, что решение проблемы отсутствия информации о нумерации отсчетов может заключаться в использовании методов, основанных на отображении из пространства модели в некоторое N-мерное векторное пространство, с последующим определением меры схожести по коэффициентам, описывающим объект. При этом сравнение выполняется между коэффициентами искомой модели и эталонными. Хотя такое представление моделей позволяет ускорить процесс распознавания, большинство методов требуют значительных временных затрат для вычисления коэффициентов искомой модели, что неприемлемо для систем реального времени. С другой стороны, эти подходы могут обладать высокими показателями качества распознавания. Для сравнения между собой различных методов распознавания разработано большое количество тестов и баз данных 3D моделей, по которым выполняется проверка их эффективности. В последнее время признание получил эталонный тест Princeton Shape Benchmark (PSB), содержащий базу данных классифицированных 3D моделей и инструментальные средства для сравнения методов распознавания.

Методы, представленные в первой главе, обладают высокими показателями качества распознавания на моделях базы данных эталонного теста Princeton Shape Benchmark, однако многие из них нецелесообразно применять в системах распознавания, используемых в сложных условиях, ввиду низкого быстродействия или высокой чувствительности к координатным шумам. Показано, что наиболее подходящим для большинства приложений методом является Shape Distribution D2, представляющий модель в виде гистограммы распределения расстояний между ее точками. Метод Shape Distribution D2 отличается высокой скоростью сравнения коэффициентов, малым объемом требуемой памяти, инвариантностью к повороту и смещению, но обладает низким быстродействием при формировании описания. Этот метод используется для сравнительного анализа с разработанным в диссертации.

Таким образом, среди рассмотренных отсутствуют методы, одновременно обладающие инвариантностью к нумерации отметок, пара-

метрам масштабирования и вращения, высоким быстродействием, помехоустойчивостью, и обеспечивающие возможность оценки этих параметров на основе компактного описания.

Во второй главе разработан метод обработки ЗО изображений, не требующий упорядочивания их отсчетов. Метод основан на формировании описания объекта в виде параметров функции кватернионного переменного, проецирующей отсчеты с его поверхности на единичную сферу.

В качестве функции, отображающей отсчеты 30 изображения на поверхность сферы, выбрано преобразования на базе полиномиальной функции кватернионного переменного:

м-1

т=0

где М-1- степень полинома, ат - коэффициенты полинома, также являющиеся кватернионами, цп - кватернионы, соединяющие точки поверхности объекта с началом координат, рп - кватернионы с единичными модулями, проведенные к поверхности сферы из начала координат в направлении точек поверхности объекта.

Рис. 1. Представление 30 изображения набором векторных кватернионов: а) 30 изображение, описываемое кватернионным сиг налом О; б) 30 изображение и проекция на сферу Р

Согласно формуле (1) требуется найти коэффициенты полинома а, связывающего поверхность исследуемого объекта с поверхностью сферы. Вычисление коэффициентов полинома сводится к решению системы линейных кватернионных уравнений, полученных на основе метода наименьших квадратов. Для решения системы используется метод Гаусса, модифицированный с учетом некоммутативности операции умноже-

ния кватернионов, что позволяет найти значения коэффициентов ат

полиномиальной функции, выполняющей отображение 30 изображения на сферу.

Коэффициенты отображающей функции однозначно связаны с масштабом ЗГ) изображения, и его оценка может быть получена из выражения:

где а''" - коэффициенты масштабированного объекта.

Вращение кватернионов, задающих 30 изображения, приводит к умножению коэффициентов отображающей функции на соответствующий вращающий кватернион Ь:

Ь^Ъ = ат, (3)

где а1Ь1 - коэффициенты изображения.

Решение задачи нахождения компонент вращающего кватерниона по значениям коэффициентов исходного и повернутого изображений может быть сведено к решению системы однородных линейных уравнений.

Как показалирезультать! исследования качества совмещения объемных изображений в зависимости от среднеквадратичного отклонения (СКО) координатного шума, предложенный метод проигрывает матричному в требуемом отношении среднего квадратичного отклонения координатного шума от 1,5 до 2 раз (рис. 2), однако, при этом не требуется знания нумерации отсчетов ЗО изображения.

О 0.086 0.099 0.115 0.171 а

Рис. 2. Графики зависимости оценки величины расстояния между эталонным и совмещенным изображениями от СКО координатного шума по результатам оценки параметров вращений

Для распознавания полностью известных ЗЭ изображений по коэффициентам отображающей функции используется устройство, которого структура изображенная на рис. 3.

Рис. 3. Структура распознающего устройства полностью известных 30 изображений

На вход вычислителя коэффициентов (ВК) поступают отсчеты входного 31) изображения, затем на входах вычислителей скалярного произведения (ВСП) вычисляется мера схожести между коэффициентами входного и эталонных изображений:

У 1 ат-а^тшш-''т)

Л ~-ца||.||а(«ш)|-' где М - 1 - степень полинома

Результат скалярного произведения поступает на экстремальное устройство ЭУ, где определяется номер эталона с максимальной действительной частью скалярного произведения.

Таким образом, в главе рассмотрен алгоритм вычисления коэффициентов отображающей функции, а также разработан метод решения кватернионных линейных уравнений на основе метода Гаусса. Показано, что коэффициенты отображающей функции однозначно связаны с масштабом и параметрами вращения кватернионов, задающих 30 изображение. Получены соотношения, необходимые для вычисления оценок параметров преобразований. Экспериментально показана возможность совмещения объемных изображений на основе найденных оценок. Рассмотрены структурные схемы устройств распознавания пространственных объектов по полиномиальным коэффициентам их отображающей функции. Приведенные в главе материалы подтверждают положение 1.

В третьей главе предложены подходы к программной и аппаратной реализации метода проецирования на сферу, разработаны методы по-

вышения быстродействия за счет применения параллельных вычислений, разработано устройство распознавания 3D изображений пространственных объектов на основе метода проецирования на сферу.

Применение параллельных вычислений для метода проецирования на сферусредствами центрального и графического процессора заключается в разделении вычислений в процедуре формирования элементов системы линейных кватернионных уравнений, элементы которой определяется из соотношений:

/1=0 л=>0

где г = 0...Л/-1, т = 0...М-1, М-1 - степень полинома, N - количество отсчетов исходного изображения.

Исходя из того, что отсчеты объекта при суммировании взаимно независимы, суммы (4) раскладываются на несколько независимых друг от друга подсумм с последующим объединением результатов. Применение параллельный вычислений позволило сократить время вычислений до 4 раз на центральном процессоре Intel Core i7 и до 12 раз на графическом процессоре NVIDIA GTX480.

Для оценки трудоемкости вычислено количество необходимых математических операций при описании 3D изображений для метода проецирования на сферу и метода Shape Distribution D2. Проведенный анализ трудоемкости показал значительное преимущество метода проецирования на сферу перед методом Shape Distribution D2. Так, для Shape Distribution D2 отмечена квадратичная зависимость времени вычисления от размера сигнала, в то время как для метода проецирования на сферу она линейная. Для объекта размерностью 100000 отсчетов время вычисления коэффициентов для метода проецирования на сферу меньше почти в 15000 раз по сравнению с методом Shape Distribution D2.

Также в третьей главе разработано устройство распознавания на базе метода проецирования на сферу, представляющее собой специализированный процессор, содержащий блоки работы с математическими функциями, блоками постоянной и разделяемой памяти.

На рис. 4 изображена функциональная схема процессора. В его состав входят: умножитель (MULT), сумматор (SUM), делитель (DIV), блок извлечения корня (SQRT), компаратор (CMPR), память команд (CMD), банк эталонных коэффициентов (COEFF) и блок управления (Controller).

Рис. 4. Функциональная схема процессора

Блоки арифметико-логических устройств используют встроенный в ПЛИС цифровой сигнальный процессор. Блоки памяти команд и банк эталонов построены на основе распределенной памяти. Внутренняя память контроллера основана на регистрах.

Процессор'содержит ряд выводов, где: elk - тактовый синхроимпульс; newData - флаг, используемый при формировании системы линейных кватё]энионных уравнений (СЛКУ), указывающий на то, что на входе присутствует новый набор данных; solve - флаг начала вычисления СЛКУ, выставляемый источником сигнала, когда все данные переданы 8 процессор; Ql, Q2, Q3 - шины данных, соответствуют компонентам i, j, к входного кватерниона; readyForData - флаг готовности

принять новый набор данных; DO - выходная шина, содержащая индекс распознанного эталона.

Управление блоками математических функций производится при помощи набора команд. Каждая команда представляет собой 32-х битное слово, где первый байт содержит индекс математической операции, последующие два - индексы ячеек памяти, соответствующие исходным данным, последний - индекс ячейки памяти в которую необходимо поместить результат.

Дальнейшая оптимизация основана на применении параллельных вычислений. В этом случае, устройство делится на два функциональных блока: блок формирования СЛКУ и блок решения СЛКУ и распознавания. Снижение времени вычисления пропорционально количеству блоков формирования СЛКУ. Также требуются дополнительные блоки синхронизации. Альтернативным подходом служит применение большего количества арифметико-логических устройств и схемы управления на жесткой логике. На каждом из восьми шагов выполняется несколько математических операций, а так как не требуется чтение команды из памяти, на выполнение шага требуется один такт. Количество тактов при этом в 20 раз меньше, чем в предыдущей реализации.

Таким образом, показана возможность реализации метода проецирования на сферу на ПЛИС. Прототип данного устройства реализован на базе ПЛИС Spartan3E-1200.

В четвертой главе выполнено исследование эффективности методов распознавания 3D изображений с неупорядоченными отметками. Полученные результаты для случайных объектов показывают, что вероятность правильного распознавания зависит от степени полинома, а также от количества и размерности эталонов. Результаты для моделей реальных объектов показывают устойчивость к координатным шумам, в случае, когда сигнальный объект отличается от остальных объектов алфавита эталонов.

Результаты распознавания для метода Shape Distribution D2 и метода проецирования на сферу при использовании базовой классификации PSB показали, что метод Shape Distribution D2 превосходит метод проецирования на сферу по характеристикам распознавания. Проведенные исследования по влиянию координатного шума на качество распознавания показали, что для метода проецирования на сферу координатный шум с С КО менее 0,173 не влияет на качество распознавания, для Shape Distribution D2 - с СКО менее 0,07.

Таким образом, описание формы 3D изображений в виде проецирующей полиномиальной функции кватернионного переменного обес-

печивает возможность обработки пространственных объектов в условиях воздействия координатных шумов. Приведенные в главе, материалы подтверждают положение 2.

В заключении сформулированы основные результаты работы и рекомендации по их использованию. Обозначены возможные направления дальнейших исследований.

ОСНОВНЫЕ ВЫВОДЫ ПО РАБОТЕ

1. Выполнен обзор и анализ методов распознавания и обработки 3D изображений. Показано, что среди рассмотренных отсутствуют методы, обладающие одновременно инвариантностью к нумерации, преобразованиям масштабирования, вращения и переноса, низкой трудоемкостью и помехоустойчивостью. Для сравнительного анализа с разработанными в диссертации методами выбран метод Shape Distribution D2, обладающий высокой скоростью сравнения, малым объемом требуемой памяти, инвариантностью к повороту и смещению.

2. Разработан метод описания 3D изображений в виде полиномиальной функции кватернионного переменного, проецирующей отсчеты с поверхности объекта на единичную сферу. Рассмотрен алгоритм вычисления коэффициентов отображающей функции, а также разработан алгоритм решения кватернионных линейных уравнений методом Гаусса. Показано, что коэффициенты отображающей функции однозначно связаны с масштабом 3D изображения, который может быть найден аналитически. Найдено, что вращение кватернионов, задающих 3D изображение, приводит к умножению коэффициентов отображающей функции на соответствующие вращающие кватернионы. Разработаны методы и структурные схемы распознавания 3D изображений по полиномиальным коэффициентам их проецирующих функции. Разработаны методы решения задачи оценки параметров объемных изображений, заданных неупорядоченными отсчетами по коэффициентам проецирующих функций. Получены соотношения, необходимые для вычисления оценок параметров преобразований. Экспериментально показана возможность совмещения объемных изображений на основе полученных оценок в условиях воздействия координатного шума.

3. Разработан алгоритм повышения быстродействия предложенного метода и метода Shape Distribution D2 путем распараллеливания вычислений с использованием технологии многопоточного программирования на центральном и графическом процессорах при обработке 3D изображений. Показано преимущество метода проецирования на сферу перед методом Shape Distribution D2 по вычислительной сложности.

Разработано устройство распознавания 3D изображений с неупорядоченными отсчетами на базе проецирующей полиномиальной функции кватернионного переменного, реализованное на программируемой логической интегральной схеме.

4. Выполнена оценка помехоустойчивости предложенных методов распознавания 3D изображений. Результаты распознавания моделей реальных объектов показали устойчивость к координатным шумам для объектов разных классов. Результаты распознавания для метода Shape Distribution D2 и метода проецирования на сферу при использовании базовой классификации PSB показали, что метод проецирования на сферу превосходит метод Shape Distribution D2 по характеристикам распознавания в условиях воздействия координатных шумов.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Научные труды в журналах из перечня ВАК РФ:

1. Роженцов, A.A. Оценка параметров и распознавание изображений трехмерных объектов с неупорядоченными отсчетами / A.A. Роженцов, A.A. Баев, A.C. Наумов // Автометрия. - Т.46. - Новосибирск, 2010.-№ 1.-С. 57-69.

2. Баев, A.A. Устройство распознавания изображений пространственных объектов с неупорядоченными отсчетами / A.A. Баев, A.A. Роженцов // Вестник Марийского государственного технического университета. Радиотехнические и инфокоммуникационные системы. - Йошкар-Ола, 2011. - № 1. - С. 69-74.

3. Роженцов, A.A. Решение задачи распараллеливания вычислений при обработке кватернионных сигналов / A.A. Роженцов, A.A. Баев, Е.В. Ерусланов // Вестник Марийского государственного технического университета. Радиотехнические и инфокоммуникационные системы. -Йошкар-Ола, 2010. -№ 3. - С. 34-46.

Статьи в журналах и грудах научных конференций:

4. Баев, A.A. Программный комплекс для имитации работы системы технического зрения автономного транспортного средства // САПР и графика. - М., 2009. - № 12. - С. 114-116.

5. Роженцов, A.A. Обработка 3D изображений на базе кватернионного преобразования Фурье / A.A. Роженцов, A.A. Баев, К.В. Морозов-: ский // Вестник Марийского государственного технического университета. Радиотехнические и инфокоммуникационные системы. - Йошкар-Ола, 2009. - № 3. - С. 28-35.

6. Роженцов, A.A. Распознавание плоских изображений групповых точечных объектов с неупорядоченными отметками / A.A. Роженцов, С.Н. Крылов, A.A. Баев// Вестник Марийского государственного технического университета. Радиотехнические и инфокоммуникационные системы. - Йошкар-Ола, 2008. - № 2. - С. 48-55.

7.' Роженцов, A.A. Применение методов кватернионного анализа для выделения Изображений дорог в 3D сценах / A.A. Роженцов, A.A. Баев, A.C. Наумов // Вестник Марийского государственного технического университета. Радиотехнические и инфокоммуникационные системы. -Йошкар-Ола, 2009.-№ 1. - С. 41-47.

8. Роженцов, A.A. Распознавание и оценка параметров многоградационных пространственных изображений с неупорядоченными отсчетами / A.A. Роженцов, A.A. Баев, A.C. Наумов // Вестник Марийского государственного технического университета. Радиотехнические и инфокоммуникационные системы. - Йошкар-Ола, 2009. -№ 2. - С. 43-49.

9. Rozhencov, A.A. Estimation of 3D Images Parameters Set By Disordered Readouts / A.A. Rozhencov, A.A. Baev // 9th Internationa] Conference on Pattern Recognition and Image Analysis: New Information Technologies -N.Novgorod, 2008. - Vol. 2. - P. 133-135.

10. Роженцов, A.A. Решение проблемы распознавания и оценки параметров 3D изображений при неизвестной нумерации отсчетов их контуров / A.A. Роженцов, Е.И. Мазанов, A.A. Баев // Цифровая обработка сигналов и ее применение: доклады 10-й Международной конференции - М., 2008. -тХ-2. - С. 432-434.

11. Роженцов, A.A. Распознавание и оценка параметров 3D изображений, при неизвестной нумерации их отсчетов / A.A. Роженцов, Е.И„Мазанов, A.A. Баев // Материалы докладов Ш-й молодежной научной конференции Тинчуринские чтения. - Т.1. - Казань, 2008. - С. 63-64.

12. Роженцов, A.A. Обработка многоградационных пространственных изображений с неупорядоченными отсчетами / A.A. Роженцов, A.A. Баев, A.C. Наумов // Математические методы распознавания образов - 14(ММРО - 14): сборник докладов XIV Всероссийской конференции. - Суздаль, 2009. - С. 433-436.

13. Баев, A.A. Применение параллельных вычислений для обработки 3D изображений, представленных кватернионными моделями // Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание-2010; сб. материалов IX Международной конференции - Курск 2010 -С. 51-53.

14. Баев, A.A. Программный комплекс для имитации работы системы технического зрения автономного транспортного средства // Научная школа для молодых ученых «Компьютерная графика и математическое моделирование (Visual Computing)»: тезисы и доклады. - М 2009 -С. 22-29.

15.Роженцов, A.A. Параллельные вычисления при обработке ква-тернионых сигналов / A.A. Роженцов, A.A. Баев И Распределенные вычисления и грид-технологии в науке и образовании: труды 4-й между-нар. конф. (Дубна, 28 июня - 3 июля 2010 г.). - Дубна: ОИЯИ 2010 -С. 399-405.

Свидетельства о регистрации программ для ЭВМ:

16. Баев, A.A. Программа ввода и визуализации 3D изображений / A.A. Баев, A.A. Роженцов, A.C. Наумов // Свидетельство о государственной регистрации программы для ЭВМ №2009615026 Роспатент 14.09.2009.

17. Баев, A.A. Программа оценки параметров вращения 3D изображений, заданных кватернионными сигналами с неупорядоченными отсчетами / A.A. Баев, A.A. Роженцов, A.C. Наумов // Свидетельство о государственной регистрации программы для ЭВМ №2009615027, Роспатент, 14.09.2009.

18. Баев, A.A. Программа распознавания 3D изображений с неупорядоченными отсчетами/ A.A. Баев, A.A. Роженцов, A.C. Наумов // Свидетельство о государственной регистрации программы для ЭВМ №2009615028, Роспатент, 14.09.2009.

19. Баев, A.A. Программное обеспечение для 3D сканера / A.A. Баев, A.A. Роженцов, М.И. Красильников // Свидетельство о государственной регистрации программы для ЭВМ №2009615029, Роспатент, 14.09.2009.

20. Баев, A.A. Программа вывода псевдообъемных изображений на 3D монитор / A.A. Баев, A.A. Роженцов, A.C. Наумов, М.И. Красильников // Свидетельство о государственной регистрации программы для ЭВМ №2009615030, Роспатент, 14.09.2009.

21. Роженцов, A.A. Программа для эмуляции автономной навигации транспортного средства по данным систем технического зрения / A.A. Роженцов, A.A. Баев, Г.Р. Сазанов И Свидетельство о государственной регистрации программы для ЭВМ №2011611780, Роспатент 28.02.2011.

22. Роженцов, A.A. Программа обработки 3D изображений на графическом процессоре / A.A. Роженцов, A.A. Баев, Г.Р. Сазанов / Свидетельство о государственной регистрации программы для ЭВМ №2011611779, Роспатент, 28.02.2011.

Подписано в печать 31.10.2011. Усл. печ. л. 1,0. Заказ № 4717. Тираж 100 экз.

Редакционно-издательский центр Марийского государственного технического университета 424006 Йошкар-Ола, ул. Панфилова, 17

Оглавление автор диссертации — кандидата технических наук Баев, Алексей Александрович

Введение.

Глава 1. Методы обработки 3D изображений в информационных системах.

1.1. Система управления автономного транспортного средства.

1.2. Обзор существующих методов описания 3D моделей.

1.2.1. Расширенное Гауссово изображение (Extended Gaussian Image (EGI)).

1.2.2. Комплексное расширенное Гауссово изображение (Complex Extended Gaussian Image (CEGI)).

1.2.3. Гистограммы формы (Shape Histograms).

1.2.4. Распределение формы (Shape Distribution D2).

1.2.5. Функция сферических расстояний (Spherical Extent Function).

1.2.6. Радиальная функция сферических расстояний (Radial Spherical Extent Function).

1.2.7. Описатель световых полей (Light Field Descriptor (LFD)).

1.2.8. Сферические гармоники.

1.2.9. Анализ представленных алгоритмов.

1.3. Введение в кватернионный анализ.

1.3.1. Кватернионы.

1.3.2. Скалярные произведения кватернионов.

1.3.4. Скалярное произведение кватернионных сигналов.

1.4. Вывод.

Глава 2. Проецирование изображения пространственного объекта на сферу.

2.1. Введение.

2.2. Метод проецирования 3D изображения на сферу.

2.3. Решение системы линейных кватернионных уравнений методом Гаусса.

2.4. Обработка изображений пространственных объектов с неизвестным масштабом.

2.5. Обработка изображений пространственных объектов с неизвестными параметрами вращений.

2.6. Определение параметров вращающего кватерниона по полиномиальным коэффициентам.

2.7. Обработка пространственных объектов с неизвестными параметрами масштабирования и вращения.

2.8. Распознавание пространственных объектов

2.9. Выводы.

Глава 3. Программная и аппаратная реализация методов обработки 3D изображений.

3.1. Введение.

3.2. Оценка трудоемкости.

3.3. Вычислительная оптимизация метода проецирования на сферу.

3.4. Параллельная реализация метода проецирования на сферу.

3.5. Параллельная реализация метода Shape Distribution (D2).

3.6. Сравнительный анализ быстродействия параллельных реализаций методов проецирования на сферу и D2 на CPU и GPU.

3.7. Аппаратная реализация метода проецирования на сферу на ПЛИС.

3.8. Выводы.

Глава 4. Исследование эффективности методов распознавания и оценки параметров линейных преобразований изображений пространственных объектов с неупорядоченными отметками.

4.1. Алгоритм проведение эксперимента распознавания пространственных объектов.

4.2. Характеристики распознавания случайных объектов.

4.3. Методика формирования тестовых моделей.

4.4. Исследование зависимости вероятности правильного распознавания моделей реальных объектов от величины СКО координатного шума.

4.5. Анализ влияния координатного шума на коэффициенты отображающей функции.

4.6. Анализ эффективности распознавания при использовании Princeton Benchmark.

4.7. Исследование помехоустойчивости методов оценки параметров объемных изображений.

4.8. Выводы.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Баев, Алексей Александрович

Актуальность темы. В настоящее время широко ведутся разработки систем распознавания образов для применения в автономных транспортных средствах различных операционных сред: для города и бездорожья (мобильное патрулирование), для подводных работ (поисковые и исследовательские), дистанционно пилотируемые летательные аппараты. Одной из ключевых систем автономных транспортных средств является система технического зрения. Ее задачами являются сбор, обработка и преобразование сенсорной информации в сигналы, удобные для использования в системе управления. Данные с входящих в систему технического зрения ультразвуковых сенсоров, лазерных дальномеров могут быть искажены помехами и шумами (например, в зоне задымления или запыленности), в этом случае, принятие необходимых решений системой распознавания образов затрудняется. Обработка данных в реальном времени усложняется ввиду высоких требований к производительности цифрового процессора.

Важнейшие результаты в области обработки изображений и распознавания образов получены отечественными научными школами Ю.И. Журавлева, В.А. Сойфера, B.C. Киричука, Ю.Г. Васина, В.А. Утробина, В.В. Кондратьева, B.C. Титова, К.К. Васильева и Е.Л. Столова, а также зарубежными школами, в частности школой Принстонского университета. Ряд сложившихся к настоящему времени подходов к обработке 3D изображений базируется на вексельных моделях и связан с трудоемкими процедурами вычисления трехмерного градиента для выделения плоских фрагментов. Методы, базирующиеся на сферическом гармоническом анализе, нашли применение при решении задач биометрический идентификации, астроориентации и т.п. В последнее время получили развитие методы, основанные на представлении 3D изображений и точечных полей в виде кватернионных сигналов, предполагающие переход к формированию описания объекта в виде контура многогранника. Контурные методы обработки обладают высокой эффективностью в условиях, когда известна нумерация векторов, образующих контур данного изображения. В этом случае возможно формирование меры схожести плоских или ЗБ изображений на основе согласованной фильтрации их контуров, а при обработке плоских изображений -получать и оценки параметров линейных преобразований. Данный подход приемлем как в отношении сплошных изображений, так и в отношении групповых точечных объектов, однако его применение в этом случае требует знания нумерации векторов контура или отметок в составе группового точечного объекта, поскольку в противном случае формирование импульсной характеристики фильтра, согласованного с контурным описанием данного объекта, невозможно. В случае контуров плоских сплошных изображений нумерация векторов в контуре обеспечивается естественным образом при прослеживании контура объекта. Однако для ЗБ изображений и изображений групповых точечных объектов приходится вводить определенные правила нумерации. При этом возможно возникновение ошибок в аналитическом описании в условиях воздействия координатных шумов, появления ложных отметок или пропуска сигнальных, что затрудняет использование контурной согласованной фильтрации.

Таким образом, актуальной задачей является разработка методов и алгоритмов обработки ЗБ изображений, обладающих высоким быстродействием, помехоустойчивостью, инвариантностью к нумерации отсчетов и преобразованиям масштаба и вращения.

Объектом исследования является система распознавания образов информационных систем, а предметом исследования - методы распознавания ЗБ изображений, заданных неупорядоченными отсчетами.

Цель и задачи исследования. Целью исследования является разработка методов распознавания ЗБ изображений на основе их кватернионных моделей в системах технического зрения.

Для достижения поставленной цели требуется решение следующих задач:

1. Обзор и сравнительный анализ методов распознавания ЗО изображений в информационных системах.

2. Разработка метода распознавания ЗБ изображений с неупорядоченными отсчетами в виде функции кватернионного переменного.

3. Оценка эффективности метода распознавания и обработки ЗБ изображений для решения задач распознавания и измерения параметров в условиях воздействия координатных шумов.

4. Оценка вычислительной трудоемкости предложенного метода обработки ЗБ изображений. Повышение его быстродействия за счет применения параллельных вычислений.

5. Разработка устройства распознавания на базе предложенного метода обработки ЗБ изображений и его реализация на программируемой логической интегральной схеме (ПЛИС).

Методы исследования. При проведении диссертационного исследования использованы методы теории функции гиперкомплексного переменного, контурного анализа изображений пространственных объектов, теории вероятностей и математической статистики, методы математического моделирования.

Научная новизна:

1. Разработан метод описания ЗБ изображений в виде полиномиальной функции кватернионного переменного, проецирующей отсчеты с поверхности объекта на единичную сферу. На его основе разработаны алгоритмы распознавания и измерения параметров ЗБ изображений.

2. Разработана методика повышения быстродействия путем распараллеливания вычислений с использованием технологии многопоточного программированияна графическом и центральном процессорах при обработке ЗБ изображений на базе проецирующей функции.

3. Разработано устройство распознавания на базе предложенного метода, реализованное на ПЛИС.

Практическая ценность. Разработанные методы обработкии распознавания трехмерных изображений позволяют синтезировать эффективные системы их обработки, применяемые в локационных системах, системах биометрической 6 Г 1 идентификации, системах навигации и управления автономными транспортными средствами.

Защищаемые положения:

1. Модель представления трехмерных объектов в виде проецирующей полиномиальной функции кватернионного переменного инвариантная к нумерации отсчетов на их поверхности, сохраняющая информацию о параметрах вращения и масштабирования и обеспечивающая возможность их определения.

2. Методы оценки параметров вращения и масштабирования и распознавания ЗЭ изображений пространственных объектов на основе полиномиальной функции кватернионного переменного, обеспечивающие возможность обработки ЗЭ изображений пространственных объектов в условиях воздействия координатных шумов.

3. Методы аппаратной и программной реализации устройства распознавания ЗЭ изображений пространственных объектов системы технического зрения автономного транспортного средства.

Публикация результатов. По теме диссертации опубликованы 22 печатные работы, в том числе 3 статьи в журналах, рекомендованных ВАК РФ для публикации основных результатов диссертаций, 12 работ в журналах и трудах конференций. Получено 7 свидетельств Роспатента о регистрации программ для ЭВМ.

Практическая значимость. Научные и практические результаты диссертационной работы внедрены в разработкиОАО «Марийский машиностроительный завод» концерна «Алмаз-Антей», ООО «НИЦ Кибернетики и Автоматики», а также использованы при выполнении грантов РФФИ «Решение проблемы распознавания и оценки параметров 2Т> и ЗЭ изображений при неизвестной нумерации отсчетов их контуров на базе теории функции комплексного и гиперкомплексного переменного», проект №08-01-00854-а,

Решение проблемы распознавания и оценки параметров многоградационных и цветных ЗБ изображений сложной формы при неизвестной нумерации их отсчетов на базе методов теории функции гиперкомплексного переменного», 7 проект №10-01-00445-а, по программе «Развитие научного потенциала высшей школы», проекты 2.1.2/2204 и 2.1.2/10218, использованы в учебном процессе на радиотехническом факультете Марийского государственного технического университета по дисциплинам «Радиотехнические системы», «Цифровая обработка радиотехнических сигналов», «Цифровые устройства и микропроцессоры», «Научно-исследовательская работа в семестре», в курсовом и дипломном проектировании. Акты о внедрении приведены в приложении к диссертации.

Достоверность и обоснованность полученных результатов обусловливается корректным использованием адекватного математического аппарата, методов математического моделирования и логической обоснованностью выводов, согласованностью с известными научными положениями, актами о внедрении.

Апробация полученных результатов. Основные результаты диссертационной работы обсуждались на 10-й Международной научно-технической конференции и выставке «Цифровая обработка сигналов и ее применение» (г. Москва, 2008 г.), Ш-й молодежной научной конференции «Тинчуринские чтения» (г. Казань, 2008г.), Всероссийской конференции «Математические методы распознавания образов» (ММРО - 14 г. Суздаль, 2009г. и ММРО - 15 г. Петрозаводск, 2011 г.), научной школе для молодых ученых «Компьютерная графика и математическое моделирование (Visual Computing)» (г. Москва, 2009 г.), IX Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание-2010» (г. Курск, 2010 г.), 4-й международной конференции «Распределенные вычисления и грид-технологии в науке и образовании» (г. Дубна, 2010 г.), а также на IX и X международных конференциях «Распознавание образов и обработка изображений» (г. Н.Новгород, 2008 г. и г. Санкт-Петербург, 2010 г.).

Личный вклад автора заключается в участии в постановке целей и задач исследования, получении, обработке и анализе основных результатов, интерпретации и обобщении полученных данных, формулировке выводов и основных научных положений.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и списка использованной литературы из 84 наименований. Общий объем диссертации 131 страниц машинописного текста, содержит 51 рисунок и 4 таблицы.

Заключение диссертация на тему "Методы распознавания 3D изображений на основе их кватернионных моделей"

4.8. Выводы

В данном разделе исследовались характеристики эффективности методов распознавания. Полученные результаты для случайных объектов показывают, что вероятность правильного распознавания зависит от количества эталонов и от степени полинома отображающей функции.

При пороге правильного распознавания равным 0,9 получены следующие результаты: при количестве эталонов 10 и степени полинома 2, хорошие показатели достигаются уже при величине СКО координатного шума «0,025, при степени полинома 3 - СКО координатного шума «0,018, при степени полинома 4 - СКО координатного шума «0,018; при количестве эталонов 20 и степени полинома 2 - СКО координатного шума «0,022, при степени полинома 3 - СКО координатного шума «0,016, при степени полинома 4 -СКО координатного шума «0,016; при количестве эталонов 30 и степени полинома 2 - СКО координатного шума «0,018, при степени полинома 3 -СКО координатного шума «0,015, при степени полинома 4 - СКО

113 координатного шума ~ 0,013. Это показывает, что при увеличении количества эталонов пороговый уровень достигается при более высоких значениях СКО координатного шума.

Таким образом, для случайных сигналов вероятность правильного распознавания зависит от степени полинома, а также от количества эталонов, и практически не зависит от размерности эталонов.

Результаты для моделей реальных объектов показывают устойчивость к координатным шумам с относительным СКО равным 0,268 для объектов разных классов. Результаты распознавания для метода 02 и метода проецирования на сферу при использовании базовой классификации Р8В показали, что метод Т)2 превосходит метод проецирования на сферу по характеристикам распознавания. Однако в условиях воздействия координатных шумов метод проецирования на сферу продемонстрировал помехоустойчивость к координатным шумам с СКО равном 0,173, в то время как метод D2 только для координатного шума с СКО равном 0,07.

Заключение

В представленной научно-квалификационной работе изложены научно-обоснованные подходы к разработке методов и устройств обработки и распознавания 3D изображений пространственных объектов в составе радиотехнических систем, имеющие существенное значение для обеспечения обороноспособности страны.

Выполнен обзор и анализ методов распознавания и обработки 3D объектов. Показано, что среди них отсутствуют методы, обладающие одновременно инвариантностью к нумерации, преобразованиям масштабирования, вращения и переноса, низкой трудоемкостью и помехоустойчивостью. Для сравнительного анализа с разработанными в диссертации подходами выбран метод Shape Distribution D2, обладающий высокой скоростью сравнения, малым объемом требуемой памяти, инвариантностью к повороту и смещению.

Разработан алгоритм формирования вторичного описания трехмерных объектов в виде полиномиальной функции гиперкомплексного переменного, проецирующей отсчеты с поверхности объекта на единичную сферу. Представлен метод проецирования пространственного объекта на сферу. Рассмотрен алгоритм вычисления коэффициентов отображающей функции, а также разработана методика решения кватернионных линейных уравнений методом Гаусса. Показано, что коэффициенты отображающей функции однозначно связаны с масштабом пространственного объекта, который может быть найден аналитически. Найдено, что вращение кватернионов, задающих пространственный объект, приводит к умножению коэффициентов отображающей функции на соответствующие вращающие кватернионы. Разработаны методы и структурные схемы распознавания пространственных объектов по полиномиальным коэффициентам их отображающей функции. Разработаны подходы к решению задачи оценки параметров объемных изображений, заданных неупорядоченными отсчетами по коэффициентам проецирующих функций. Получены соотношения, необходимые для вычисления оценок параметров преобразований.

Разработана методика повышения быстродействия предложенного метода и метода D2 путем распараллеливания вычислений с использованием технологии NVIDIA CUDA при обработке 3D объектов. Показано преимущество метода проецирования на сферу перед методом D2 по вычислительной сложности. Из полученных результатов сравнения быстродействия при использовании параллельных вычислений следует, что для метода проецирования на сферу, применение параллельный вычислений на графическом процессоре позволило сократить время вычислений в 12 раз. Для метода D2 применение параллельных вычислений на графическом процессоре позволило снизить время расчета в 57 раз. В ходе проведения эксперимента по распознаванию на эталонном тесте Princeton Benchmark, отмечено, что при формировании алфавита коэффициентов для 907 объектов, время вычислений для метода проецирования на сферу при использовании только одного ядра центрального процессора, составило 10 секунд, в то время как для D2 потребовалось около 25 секунд, причем вычисления производились на графическом процессоре.

Разработано устройство распознавания изображений пространственных объектов с неупорядоченными отсчетами на базе проецирующей полиномиальной функции гиперкомплексного переменного, реализованное на программируемой логической интегральной схеме.

4. Выполнено измерение помехоустойчивости предложенных методов распознавания трехмерных объектов. Результаты для моделей реальных объектов показывают устойчивость к координатным шумам с относительным СКО равным 0,268 для объектов разных классов. Результаты распознавания для метода D2 и метода проецирования на сферу при использовании базовой классификации PSB показали, что метод D2 превосходит метод проецирования на сферу по характеристикам распознавания. Однако в условиях воздействия координатных шумов метод проецирования на сферу продемонстрировал помехоустойчивость к координатным шумам с СКО равном 0,173, в то время как метод Т>2 только для координатного шума с СКО равном 0,07.

Экспериментально показана возможность совмещения объемных изображений на основе полученных оценок. Как показали результаты исследования качества совмещения объемных изображений в зависимости от СКО координатного шума при норме сигнала равной 130. Предложенный метод проигрывает матричному в требуемом отношении СКО координатного шума от 1,5 до 2 раз, однако, при этом не требуется знания нумерации отсчетов ЗБ изображения.

Библиография Баев, Алексей Александрович, диссертация по теме Теоретические основы информатики

1. Zucker SW, Hummel RA. A three-dimensional edge operator//IEEE PAMI, 1981, №3(3), p. 324-331.

2. Комплекснозначные и гиперкомплексные системы в задачах обработки многомерных сигналов / Я.А. Фурман, А.В. Кревецкий, Роженцов А.А. и др. Под ред. Я.А.Фурмана. - М.: Наука, 2004. - 456 с.

3. Фурман Я.А. Сегментация и описание трехмерных структур на базе кватернионных моделей // Наукоемкие технологии, 2007, т.8., № 9, с. 37-49

4. Введение в контурный анализ и его приложения к обработке изображений и сигналов/ Я.А. Фурман, А.К. Передреев, А.В. Кревецкий, и др. Под ред. Я.А.Фурмана. - М.: Наука, 2002. - 592 с.

5. Роженцов А.А. Оценка параметров и распознавание изображений трехмерных объектов с неупорядоченными отсчетами / 1>аев А.А., Наумов А.С.//Автометрия, 2010, 46, №1, С. 57-69.

6. R. Osada, Т. Funkhouser, В. Chazelle, and D. Dobkin. Matching 3D models with shape distributions. Shape Modeling International, pages 154-166, May 2001.

7. M. Kazhdan, T. Funkhouser, and S. Rusinkiewicz. Rotation invariant spherical harmonic representation of 3D shape descriptors. In Symposium on Geometry Processing, June 2003.

8. B. Horn. Extended gaussian images. In Proceedings of the IEEE, volume 72, pages 1656— 1678,1984.

9. S. Kang and K. Ikeuchi. Determining 3-d object pose using the complex extended guassian image. CVPR, pages 580-585, June 1991.

10. D. Vranic and D. Saupe. 3d model retrieval with spherical harmonics and moments. Proceedings of the DAGM, pages 392-397,2001.

11. D. Vranic. An improvement of rotation invariant 3d shape descriptor based on functions on concentric spheres. In IEEE International Conference on Image Processing, September 2003.

12. Shilane, P., Min, P., Kazhdan, M., Funkhouser, Т.: The Princeton Shape Benchmark, to appear in Shape Modeling International, Genova, Italy, June 2005.

13. G. Burel and H. Henocq. Three-dimensional invariants and their application to object recognition. Signal Processing, 45(l):l-22,1995.

14. D.-Y. Chen,M. Ouhyoung, X.-P. Tian, and Y.-T. Shen. On visual similarity based 3D model retrieval. Computer Graphics Forum, pages 223-232, 2003.

15. Фурман Я.А. Визуализация изображений в трехмерных сценах: Учебное пособие. -Йошкар-Ола: МарГТУ, 2007.

16. Фурса М.В. Реконструкция сложных трехмерных объектов методом структурированного освещения // Автометрия, 2008, No.l, Т.44. С.118-126.

17. Анисимов, Б.В. Распознавание и цифровая обработка изображений / Б.В. Анисимов, В.Ф. Курганов, В.К. Злобин. -М.: Высшая школа, 1983. 295 с.

18. Хафизов, Д.Г. Упорядочение точек пространственного изображения группового точечного объекта на базе амплитудно-фазового представления / Д.Г. Хафизов // Автометрия, 2007, №1. С. 10-23.

19. Прэтт, У. Цифровая обработка изображений / У. Прэтт. М.: Мир, 1982. - 310 с.

20. Фурман Я.А., Рябинин К.Б., Красильников М.И. Проволочная модель пространственного группового точечного объекта//Автометрия, 2008, №3. С. 3-16.

21. Выгодский М.Я. Справочник по высшей математике, Москва.: Физматлит, 1958.

22. Кантор И.А., Солодовников А.С. Гиперкомплексные числа. М.: Наука, 1973. - 145 с

23. Ф. Препарата, М. Шеймос, Вычислительная геометрия: Введение. М.: Мир, 1979. -478 с.

24. Тихонов А.Н., Арсеньев В.Я. Методы решения некорректных задач. М.: Наука. Главная редакция физико-математической литературы, 1979.

25. Ильин В.А., Линейная алгебра / В.А. Ильин, Э.Г. Позняк. — М.: ФИЗМАТЛИТ, 2004. — 280 с.

26. А.В. Боресков, А.А. Харламов. Основы технологии CUDA.- М:ДМК Пресс, 2010. -232с.

27. Баев А.А. Программный комплекс для имитации работы системы технического зрения автономного транспортного средства // САПР и графика, Москва, 2009, №12, с. 114116.

28. Искусственный интеллект: В 3-х кН. Кн. 2. Модели и методы: Справочник/ Под ред. Д.А. Поспелова.— М.: Радио и связь, 1990.—304 с.

29. Комарцова Л.Г., Максимов A.B. Нейрокомпьютеры: Учебное пособие для вузов.— М.: Изд-во МГТУ им. Н.Э. Баумана, 2002.—320 с.

30. Bayro-Corrochano Е., Buchholz S., Sommer G. A new Selforganizing Neural Network using Clifford Algebra // Computer Science Institute, Christian Albrechts University "— Kiel, Gemany, 1996."— 5 p.

31. Buchholz S., Sommer G. Quaternionic Spinor MPL // Computer Science Institute, Christian Albrechts University "— Kiel, Gemany, 1997.6 p.

32. Bulow Т., Sommer G. Algebraically Extended Representations of Multi-Dimensional Signals // Computer Science Institute, Christian Albrechts University ~ Kiel, Gemany, 1997.8 p.

33. Bulow Т., Sommer G. Multi-Dimensional Signal Processing Using an Algebraically Extended Signal Representation // Computer Science Institute, Christian Albrechts University "— Kiel, Gemany, 1997."— 16 p.

34. Danescu Radu. Stereovision-Based Side Lane and Guardrail Detection / Radu Danescu, Stefan Sobol, Sergiu Nedevschi, Thorsten Graf

35. Felsberg M., Bulov Th., Sommer G., ChernovV.M. Fast Algorithms of Hypercomplex Fourier Transforms. // G.Sommer (Eds) Geometric Computing with Clifford Algebras. -Springer Verlag, 2000."— P.231-254.

36. Frome A., Huber D., Kolluri R., Bulow Т., Malik J. Recognizing Objects in Range Data Using Regional Point Descriptors // DARPA E3D program, 2004."— 14 p.

37. Fursa. M. V. Reconstructing Complex 3D Objects by a Structured Illumination Method / M. V. Fursa. // ISSN 8756-6990, Optoelectronics, Instrumentation and Data Processing, 2008, Vol. 44, No. 1, pp. 88-94

38. Johnson A. Spin-Images: A Representation for 3-D Surface Matching // Carnegie Mellon University"— Pittsburgh, Pennsylvania, 1997.308 p.

39. Nedevschi Sergiu. 3D Lane Detection System Based on Stereovision / Sergiu Nedevschi, Rolf. Schmidt, Thorsten Graf etc. // 2004 IEEE Intelligent Transportation Systems Conference, Washington, D.C., USA, October 3-6,2004, pp. 161 166

40. Nedevschi Sergiu. A Sensor for Urban Driving Assistance Systems Based on Dense Stereovision / Sergiu Nedevschi, Radu Danescu, Tiberiu Marita, Florin Oniga etc. // Technical University of Cluj-Napoca, ROMANIA

41. Nedevschi Sergiu. Increased Accuracy Stereo Approach for 3D Lane Detection / Sergiu Nedevschi, Florin Oniga, Radu Danescu // Intelligent Vehicles Symposium 2006, Tokyo, Japan, pp. 42 29

42. Nedevschi Sergiu. On-Line Calibration Method for Stereovision Systems Used in Vehicle Applications / Sergiu Nedevschi, Cristian Vancea, Tiberiu Marita, Thorsten Graf

43. Nedevschi Sergiu. Real-Time 3D Environment Reconstruction Using High Precision Trinocular Stereovision / Sergiu Nedevschi, Silviu Bota, Tiberiu Marita, Florin Oniga, Ciprian Pocol // Technical University of Cluj-Napoca, 2006

44. Salvi J., Pagns J., Batlle J. Pattern codification strategies in structured light systems //Pattern Recognition. 2004. V.37, N.4. P. 827-849.

45. Stanley: The Robot that Won the DARPA Grand Challenge/ Sebastian Thrun, Mike Montemerlo, Hendrik Dahlkamp, e.g//Journal of Field Robotics 23(9), 661-692 (2006)

46. Todd A. Ell, Stephen ;J. Sangwine Hypercomplex Fourier Transforms of Color Image // IEEE Transactions On Image Processing, Vol.16, No.l, January 2007 P.22-35.

47. Бурый A.C., Михайлов C.H. Методы идентификации астроориентиров в задачах ориентации и навигации космического аппарата по изображениям звездного неба// Зарубежная радиоэлектроника, 1994. № 7-8- С. 44-52.

48. Жигалов, К. Сканирование крупных объектов / К. Жигалов // Render Magazine. 2006.

49. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1968.

50. Лысенко О.Н. Использование лазерных сканеров SICK AG для навигации мобильных роботов // Автоматизация в промышленности, 2006, №8, с. 22-24

51. Макарова, О. Сканирование в третьем измерении / О. Макарова // Computerworld. -1997.-№40.

52. Перевалов Д.С. О возможности распознавания формы объекта с помощью микрочастиц// Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2005: Часть 1. М.: МИФИ. С. 175-182

53. Фурман Я.А., Роженцов A.A. О предельно достижимых вероятностях правильного распознавания многомерных сигналов// Автометрия. 2004. - №3. - С.31-45.

54. Чернов В.М. Арифметические методы синтеза быстрых алгоритмов дискретных ортогональных преобразований— М.:~Физматлит, 2007.

55. Фор А., Восприятие и распознавание образов / А. Фор М.: Машиностроение, 1989. -272 с.

56. Фу, К. Робототехника: пер. с англ./ К. Фу, Р. Гонсалес, К. Ли; под ред. В.Г. Градецкого. М.: Мир, 1989. - 624 с.

57. Роженцов, A.A. Синтез помехоустойчивых сигналов при объемах алфавита несовпадающих с размерностью сигнала // Автометрия. 2006. - №4. - С.36-47.

58. A.A.Rozhencov, A.A.Baev Estimation of 3D Images Parameters Set By Disordered Readouts// 9th International Conference on Pattern Recognition And Image Analysis: New Information Technologies, N.Novgorod, September, 14-20,2008, Vol.2.-P.133-135

59. A.A. Роженцов, Е.И. Мазанов, A.A. Баев. Распознавание и оценка параметров 3D изображений при неизвестной нумерации их отсчетов// Материалы докладов Ш-й молодежной научной конференции Тинчуринские чтения, Казань, 2008, т.1, с 63-64.

60. Баев A.A. Разработка программного обеспечения для 3D сканера// Материалы 16-й

61. Междунар. конференции и выставки: "Туполевские чтения". Казань, 2008.

62. Н.В. Рябова, A.A. Баев, С.А. Охотников. Разработка дифференциальной системы контроля за транспортными средствами на базе ГЛОНАСС// XV международная молодежная научная конференция «Туполевские чтения», 2007

63. A.A. Роженцов, A.A. Баев, A.C. Наумов. Формирование проволочных моделей изображений пространственных объектов на основе решения задачи коммивояжера// Вестник МарГТУ, 2010. №1, с.54-59.

64. A.A. Роженцов, A.A. Баев. Параллельные вычисления при обработке кватернионых сигналов// Распределенные вычисления и грид-технологии в науке и образовании: Тез. докл. 4-й междунар. конф. (Дубна, 28 июня 3 июля 2010 г.). - Дубна:ОИЯИ, 2010,стр. 165

65. Баев A.A., Роженцов A.A., Наумов A.C. // Программа ввода и визуализации 3D изображений. Свидетельство о государственной регистрации программы для ЭВМ №2009615026

66. Баев A.A., Роженцов A.A., Наумов A.C. // Программа оценки параметров вращения 3D изображений, заданных кватернионными сигналами с неупорядоченными отсчетами. Свидетельство о государственной регистрации программы для ЭВМ №2009615027

67. Баев A.A., Роженцов A.A., Наумов A.C. // Программа распознавания 3D изображений с неупорядоченными отсчетами. Свидетельство о государственной регистрации программы для ЭВМ №2009615028

68. Баев A.A., Роженцов A.A., Красильников М.И. // Программное обеспечение для 3D сканера. Свидетельство о государственной регистрации программы для ЭВМ №2009615029

69. Результаты теоретических исследований Баева A.A. позволяют оценить степень совершенства существующих методов обработки 3D изображений. Основные выводы и разработанные в диссертации подходы использованы при разработке изделия 9С80М1-2. /

70. Главный конструктор —уС A.A. Пивень

71. Первый зам. начальника ТЦ «Коралл» ОАО «Марийский машиностроительный завод»1. В.Г. Задворных109029. Москва. Михайловскии проезд. Л 3. стр.13

72. Использование указанных результатов позволило:

73. Повысить скорость поиска в интернет-приложениях и сервисах на основе параметров, задаваемых в виде 3D моделей;

74. Начальник управления научной и инновационной деятельности к.т.н., доцент

75. Профессор кафедры РТиМБС д.т.н., профессор

76. ПЛИС" для студентов и магистрантов специальности "Радиотехника". Результаты диссертационной работы использованы в курсовом и дипломном проектировании, а также при подготовке магистерских диссертаций.

77. Председатель комиссии: Члены комиссии:1. Михеева /

78. ТЛ.А. Стешина/ А. Роженцов/ Г.Хафизов/