автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.05, диссертация на тему:Быстродействующее оптико-электронное устройство распознавания изображений объектов на основе трехмерных векторных эталонов

кандидата технических наук
Коростелев, Сергей Иванович
город
Курск
год
2009
специальность ВАК РФ
05.13.05
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Быстродействующее оптико-электронное устройство распознавания изображений объектов на основе трехмерных векторных эталонов»

Автореферат диссертации по теме "Быстродействующее оптико-электронное устройство распознавания изображений объектов на основе трехмерных векторных эталонов"

На правах рукописи

003486823

КОРОСТЕЛЕВ СЕРГЕЙ ИВАНОВИЧ

БЫСТРОДЕЙСТВУЮЩЕЕ ОПТИКО-ЭЛЕКТРОННОЕ УСТРОЙСТВО РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ НА ОСНОВЕ ТРЕХМЕРНЫХ

ВЕКТОРНЫХ ЭТАЛОНОВ

05.13.05 - Элементы и устройства вычислительной техники и систем управления

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

- 3 ДЕН 2009

Курск 2009

003486829

Работа выполнена в ГОУ ВПО «Курский государственный технический университет» на кафедре «Вычислительная техника» в совместной научно-исследовательской лаборатории Центра информационных технологий в проектировании РАН и Курского государственного технического университета «Информационные распознающие телекоммуникационные интеллектуальные системы».

Научный руководитель:

заслуженный деятель науки РФ, доктор технических наук, профессор Титов В. С.

Официальные оппоненты

доктор технических наук, профессор Бурмака A.A.

кандидат технических наук, Спеваков А.Г.

Ведущая организация:

Тульский государственный университет

Защита диссертации состоится «21» декабря 2009 г. в 16— часов на заседании диссертационного совета Д 212.105.02 при Курском государственном техническом университете по адресу: 305040, Курск, ул. 50 лет Октября, 94.

С диссертацией можно ознакомиться в библиотеке Курского государственного технического университета.

Автореферат разослан «17» ноября 2009 г.

Отзывы на автореферат в двух экземплярах, заверенные печатью, просим направлять по адресу: 305040, Курск, ул. 50 лет Октября, 94, КурскГТУ, ученому секретарю диссертационного совета

Ученый секретарь диссертационного совета кандидат технических наук, доцент

Титенко Е.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Ускорение темпов производства на основе автоматизации и роботизации технологических процессов является одним из приоритетных направлений развития приборостроения и вычислительной техники в настоящее время. Оптико-электронные устройства (ОЭУ), являющиеся неотъемлемым элементом систем управления, находят все большее применение в различных областях деятельности человека, начиная от производства и заканчивая процессом обработки данных. Основной функцией оптико-электронных устройств является распознавание объектов и измерение их параметров. Для большинства прикладных задач на практике имеется необходимость анализа и распознавания трехмерных объектов, в связи с чем, распознавание изображений объектов приобретает еще большую актуальность.

Решение задачи распознавания характеризуется рядом сложностей, связанных с положением объекта в пространстве. В связи с этим целесообразно применение методов, позволяющих производить распознавание объектов инвариантно к положению и ориентации в пространстве, а также обладающих высокой скоростью обработки данных.

Существует множество методов распознавания произвольно расположенных объектов, однако большинство из них имеет существенные ограничения. Так, например, существуют сложности в решении задачи идентификации объектов, отличающихся визуально незначительно и имеющих схожие ракурсы. Кроме того имеется зависимость достоверности распознавания от положения объекта в пространстве, что для произвольно расположенного объекта может приводить к его ошибочному распознаванию.

Оптико-электронные устройства, предназначенные для распознавания трехмерных объектов, как правило, основаны на анализе двух и более изображений объекта в различных ракурсах. Недостатками подобных устройств являются следующие: сложность аппаратуры, необходимость точной калибровки ОЭУ, значительная вычислительная сложность, которая может приводить к длительному времени распознавания.

Наряду с этим известны методы распознавания трехмерных объектов, основанные на анализе единственного изображения объекта. Подобные методы требуют значительных вычислительных ресурсов для реализации, большого объема памяти для хранения проекций эталонного объекта в различных ракурсах. Кроме того пространство используемых признаков зачастую не позволяет рационально сформировать базу эталонов, что приводит к существенным затратам памяти и длительному процессу поиска, отрицательно сказывающимся на быстродействии ОЭУ. Большинство существующих методов имеют узкий спектр применения, связанный с ограничениями, накладываемыми при реализации, такими, как аппаратная база, масса, габариты устройства и временные показатели скорости обработки данных.

Таким образом, существует объективная необходимость создания новых методов распознавания и ОЭУ, позволяющих решить задачу распознавания трехмерного объекта, снизить вычислительную сложность, повысить достоверность распознавания и скорость обработки данных.

В этой связи актуальной научно-технической задачей является разработка метода и устройств распознавания объектов, позволяющих повысить достоверность распознавания и обеспечить быстродействие ОЭУ.

Перспективным подходом к решению этих задач является применение трехмерных векторных изображений в качестве эталонов, позволяющих в сочетании с дополнительными признаками предварительного анализа повысить достоверность и увеличить скорость распознавания за счет инвариантности к положению объекта в

пространстве и сокращения затрат времени за счет использования параллельных вычислений.

Диссертационная работа выполнена в рамках фундаментальных исследований с госбюджетным финансированием, которые велись и ведутся в Курском государственном техническом университете (госбюджетная НИР: 1.1.05 "Исследование теоретических основ, методов и алгоритмов повышения качества обработки изображений в системе технического зрения" (№ гос. регистрации 01200508819,2005 г.).

Цель работы: разработка метода распознавания изображений объектов, основанного на использовании трехмерных векторных эталонов и быстродействующего оптико-электронного устройства, характеризующегося повышенной достоверностью и инвариантностью к аффинным преобразованиям объекта.

Задачи исследования, решаемые в работе:

1. Сравнительный анализ существующих методов и устройств распознавания изображений и обоснование необходимости создания комбинированных методов с повышенной достоверностью и быстродействующих устройств распознавания объектов.

2. Разработка математической модели распознавания изображений объектов на основе трехмерных векторных эталонов.

3. Создание метода инвариантного к аффинным преобразованиям в пространстве и алгоритмов распознавания изображений объектов, содержащих блоки, которые допускают аппаратную-ориентацию.

4. Разработка структурно-функциональной схемы и быстродействующего оптико-электронного устройства распознавания изображений трехмерных объектов.

Новыми научными результатами, выносимыми на защиту, являются:

1. Математическая модель распознавания объекта на основе трехмерных векторных эталонов, обеспечивающая инвариантность к положению объекта в пространстве и отличающаяся применением специализированной структуры данных описания эталонов.

2. Алгоритмы распознавания объектов и формирования трехмерных векторных эталонов, обеспечивающие уменьшение емкости памяти, необходимой для хранения эталонов, и возможность применение конвейерной обработки данных.

3. Метод распознавания изображений трехмерных объектов, обеспечивающей возможность реализации, как на программном, так и на аппаратном уровне, и позволяющий сохранить высокую достоверность распознавания при высокой скорости обработки данных за счет использования трехмерных векторных эталонов.

4. Структурно-функциональная схема оптико-электронного устройства распознавания объектов с конвейерной обработкой данных, особенностью которой является разработка и введение специализированных вычислительных устройств, реализующих параллельную, конвейерную обработку данных и обеспечивающих повышение быстродействия оптико-электронного устройства.

Объект исследования - оптико-электронные устройства распознавания изображений трехмерных объектов.

Предмет исследования - методы, алгоритмы и оптико-электронные устройства обработки и распознавания изображений.

Методы исследования. В работе использованы методы цифровой обработки сигналов и изображений, математического моделирования, распознавания изображений объектов и анализа дискретных изображений, методы проектирования устройств ЭВМ.

Практическая ценность работы состоит в том, что ее результаты являются основой для разработки широкого класса оптико-электронных устройств распознавания

трехмерных объектов по единственному изображению. Применение подобных устройств возможно в следующих системах: системах контроля качества продукции, автоматизированных манипуляторах, робототехнике, системах наведения.

Разработанный метод распознавания характеризуется гибкостью и возможностью реализации, как на программном, так и на аппаратном уровне, что обеспечивает широкий спектр областей использования. Особенностью метода является наличие ряда параметров, обеспечивающих баланс достоверности распознавания, производительности и аппаратных затрат в зависимости от условий применения.

Результаты диссертационной работы внедрены на предприятиях ООО «СМИ-Линк г. Курск», ОГУ СМЭП Курской области и используются в учебном процессе Курского государственного технического университета по учебным дисциплинам «Структурно-топологическое проектирование ЭВМ», «Основы теории распознавания образов».

Апробация работы. Основные положения диссертационной работы докладывались и получили положительную оценку на Международных и Российских конференциях: Всероссийская конференция по проблемам информатики, физики и химии (г. Москва РУДН 2005); Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации «Распознавание 2005» (г. Курск, Курский государственный технический университет 2005 г.); «Молодежь и XXI век: 2005, 2006, 2007» (г. Курск, Курский государственный технический университет 2005, 2006, 2007 гг.), а также на научно-технических семинарах кафедры «Вычислительно техники» с 2005 по 2009 годы.

Публикации. Основные результаты выполненных исследований и разработок опубликованы в 14 печатных работах, в том числе в 7 статьях. Среди них: 3 статьи, опубликованные в рецензируемых научных журналах, входящих в перечень журналов и изданий, рекомендуемых ВАК, а также 3 патента Российской Федерации.

Личный вклад автора. В работах, опубликованных в соавторстве, лично соискателем предложены: в [1] - метод распознавания изображений объектов с использованием трехмерных векторных эталонов и программа для его реализации; в [2] -метод распознавания символьной информации автомобильного бортового компьютера; в [6] - способ калибровки системы технического зрения распознавания номеров игровой рулетки; в [3,4,7,5] - устройство для инвариантного к аффинным преобразованиям распознавания изображений на основе трехмерных векторных эталонов; в [8] - способ распознавания одно - двухзначных чисел; в [9] - использование трехмерных эталонов в задаче распознавания; в [10] - программа распознавания образов, использующая векторные эталонные изображения.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы, включающего 87 наименований, изложена на 138 страницах и поясняется 36 рисунками и 16 таблицами.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность, сформулированы цель и задачи исследования, представлены положения, выносимые на защиту, научная новизна и практическая ценность работы.

В первой главе проведен анализ существующих методов и устройств распознавания изображений объектов. Определено одно из перспективных направлений решения задачи распознавания, каким является разработка методов, алгоритмов и устройств основанных на применении трехмерных векторных изображений в качестве эталонов.

Проведенный обзор существующих методов позволил установить их основные недостатки, среди которых - ограниченный набор параметров, длительное время

распознавания. Ограниченный набор параметров существенно сужает круг задач, в которых возможно применение параметрических методов. Длительное время распознавания, сложный процесс обучения за счет необходимости подбора параметров, которые оказывают влияние непосредственно на качество распознавания. Известные также нейросетевые методы, однако, на сегодняшний день они находятся на этапе развития и зачастую не в полной мере подходят для решения задачи распознавания произвольно расположенного объекта. Недостатками большинства методов являются ограничения, связанные с отсутствием инвариантности к аффинным преобразованиям в пространстве, большие вычислительные затраты методов сравнения с эталоном, обусловленные необходимостью полного перебора базы данных, большие затраты памяти. Зачастую сложность реализации ограничивает спектр применения, также имеет место низкая достоверность распознавания, связанная со сложностью задачи формирования базы эталонов, так как задача подбора оптимального набора эталонов не всегда решаема.

Сделан вывод о необходимости разработки новых комбинированных методов распознавания, обладающих высокой достоверностью распознавания и основанных на оптимизации процесса выборки эталонов.

Проведенный анализ также показал, что известные устройства распознавания изображений объектов не полной мере удовлетворяют требованиям современной промышленности, в частности, известные устройства характеризуются недостаточной скоростью распознавания и сложностью их практической реализации и применения. Основным недостатком существующих ОЭУ для распознавания трехмерных объектов является использование последовательной архитектуры и отсутствие предварительного набора признаков, позволяющих производить индексацию эталонов, что существенно сказывается на быстродействии.

В связи с этим актуальной является задача разработки оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов.

Показано, что наиболее перспективным подходом в решении задачи распознавания произвольно расположенного объекта является использование трехмерных векторных эталонов в сочетании с набором признаков, позволяющих произвести предварительную классификацию и оптимизировать базу данных эталонов.

Во второй главе разработана математическая модель распознавания изображений объектов на основе трехмерных векторных эталонов. Математическую модель распознавания FP составляют:

- математическая модель ввода изображения распознаваемого объекта ГВи;

- функция определения габаритного контейнера FrE(FBPI,q);

- функция масштабирования изображения FMin(Fre,n,m);

- функция кодирования изображения F^Funaq);

- математическая модель структуры представления эталонов MDL;

- функция выбора эталона FB3(FCK(MDL, [;кд)Л сг(\ШЬ. 1ГБ)), позволяющая

исключить полный перебор эталонов, аргументами которой являются функция

сравнения кодов FCK и функция сравнения габаритов Fcr;

- функция получения изображения проекции эталона F3H(MDL, FB3), описывает

построение проекции эталона, удовлетворяющей первичным условиям FB3;

- математическая модель распознавания на основе весовых коэффициентов и

входных данных FP(FBK,

- функция определения весовых коэффициентов FBK(F3H,qi);

- функция определения входных данных 1'вдО мш- ''эи-Ч:)-

Математическая модель ввода изображения FBii формирует двумерную матрицу L(n,m), элементы которой /,.(/' = \,n\j = 1,/л), представляют собой яркостные составляющие пикселей изображения.

Функция определения габаритного контейнера FrB(FBn,q) локализует объект на изображении и формирует матрицу 0(ni,mi), элементы которой вычисляются по формуле

(1)

где o,j - элемент матрицы 0(ni,mi); lati/lt] - элемент матрицы L(n,m), находящиеся внутри габаритного контейнера; а,р - смещения относительно начала координат матрицы L(n,m).

Функция масштабирования изображения Fun/Fn;, п, т) приводит матрицу, 0(ni,nii) к заданной размерности с применением передискретизации. Для последующей обработки матрицу Ofnj.m,) требуется разбить на 121 равную зону, с использованием сетки размерностью 11x11. Размерность определена экспериментально. В результате преобразования генерируется матрица С,(/г2,лг2), размерностью кратной И. Число 11 определено экспериментально.

Функция масштабирования изображения имеет следующий вид:

{«, =к -1 \,к eZ

0,(п2, т2), где1 (2)

т2 =/-11,/е Z

1 иш~

Функция кодирования изображения Ftçj(FMm><i) позволяет получить бинарную матрицу кода проекции объекта К( 11,11) на плоскость изображения. Код рассчитывается, исходя из процентного заполнения каждой зоны матрицы Ol(n1,mi) элементами, отличными от фона на значение q.

Функция кодирования изображения в операторной форме имеет вид

FKA=f{Fuul,q) = f{f{FrE),q) = f(f{f(Fm,q\q)))- (3)

Математическая модель представления эталонов описывает структуру, содержащую информацию о трехмерной модели эталона и вариантах его положения в пространстве. Данная структура позволяет хранить трехмерную векторную модель объекта, а также набор параметров, необходимых для предварительного анализа распознаваемого изображения объекта и построения соответствующей проекции.

Структура данных MDL(H) представляет собой массив-вектор содержащий требуемый набор объектов, необходимых для решения задачи распознавания, позволяющая хранить трехмерные эталоны, а также эффективно организовать процесс перебора возможных проекций векторной модели при реализации на микропроцессорных вычислительных устройствах (рис. 1).

Рис. 1. Структура MDL для хранения описания объекта

Рассмотрим структуру MDL(H).

MDLj, i = \,H-элемент класса объекта эталона.

Pti, i = 1, Я, - элемент одномерного массива, содержит информацию о координатах точки (вершины модели объекта) в прямоугольно-декартовой системе координатPt. = (л, ,>', ).

1] - элемент одномерного массива, содержащего топологию соединения точек по треугольникам Pt, i = \jf4, F = T(Pt(it ),Pt(i2 ),Pt(i3 )),,i2, /', e {l,2,...,#,}.

Применяя аффинные преобразования в трехмерном пространстве, выполняется построение проекции эталона с посредством соединения полученных точек на базе топологии Т и формируется матрица 02(п2,т2), где (n2=L-\l-,m2=M-ll',L,MeZ;L,MïO). Для каждой проекции хранится набор характеристик: код Cd(l 1,11) и соотношение сторон габаритного контейнера GB. Вектор характеристик проекции PRJni = H2 содержит:

А{а,,ау,аг), вектор углов поворота объекта по трем осям относительно плоскости

проецирования; Cd( 11,11) - матрица кода проекции; GB = пг1 т2 соотношение сторон габаритного контейнера.

Таким образом, математическая модель представления эталонов позволяет сформировать трехмерную векторную модель эталона. При распознавании выполняется предварительный анализ имеющихся проекций эталона с тем, чтобы исключить полный перебор и уменьшить вычислительные затраты.

Аргументами функции выбора эталонов FB3(FCK(MDL,FKji) являются: функция сравнения кодов FCK и функция габаритов Fer-

Итерационно производится анализ хранящегося набора объектов MDL на предмет соответствия элементов Cd и GB с заданными ограничениями. Различия в соотношении сторон габаритных контейнеров определяются значением qi".

MDL,-> PRJj-> G В - «,/ш, < с/, ; / = 1777, j = uT2 (4)

Функция сравнения габаритов объекта:

FCI{MDL, FmqO= fWDL,f{FB„,q),qi). (5)

Для определения расстояния между кодами вводится дополнительный параметр q2, обозначающий допустимое количество различных зон матрицы кодов проекции эталона и изображения объекта

S<q2, (6)

[0, иначе.

Функция сравнения кодов FCK в операторной форме имеет вид: FCK(MDL, Fm42)= f(MDL, f(f(Fm,q)),q2). (7)

Таким образом, функция выбора эталонов принимает вид: FB3(FCK(MDL, Fwl.FcriMDL, FrB)) = f{f(MDLJ(Fm>q),qi)J(MDLJ(nFm,q)),qiy). (8)

Функция получения изображения проекции эталона F3il(MDL, FB3) описывает построение проекции эталона, удовлетворяющей предварительным признакам. Для получения изображения проекции эталона используются полученные ранее индексы и извлекают вектор, содержащий углы поворота по трем осям в прямоугольно-декартовой системе координат. На базе имеющихся данных рассчитывают матрицы поворота на

заданный угол по трем осям соответственно. Затем производится построение модели посредством соединения полученных точек на базе топологии Т. Далее выделяется габаритный контейнер, изображение приводится к размерности, кратной 11, и кодируется. Формируется матрица 02{п2,т2), представляющая собой проекцию изображения эталонного объекта.

Математическая модель получения изображения проекции эталона имеет вид: ГэяГЛЮД Гвэ) =/(М01,/(/(АЮ^/(Рш^Ш,/(М0Ь,Д/(Рт,д)Ш)). (9)

Каждая из 121 зоны матрицы 02(п2,т2) заполнена некоторым количеством элементов, отличных от фона на значение я. Общее количество элементов, удовлетворяющих вышеуказанному условию, принимается за единицу.

Вес зоны является отношением элементов, отличных от фона на значение я, находящимся внутри зоны, к общему количеству этих элементов во всей матрице 02(п2,т2). Таким образом, суммарный вес всех зон будет равен единице. Функция определения весовых коэффициентов 1:вк(РЭи-Ч1) формирует матрицу весов\¥( 11,11). содержащую количество элементов, отличных от цвета фона на значение я, в каждой из 121 зон матрицы 02 («, ,т2): 11■

IV = 1 У рх; рх = А если 02[1 + <-ъ/П;к+;-т2/П] > ^ (]0)

0 Бт ,=Ц=1 ' [ О, иначе

где 5'т - суммарное количество элементов отличных от фона более чем на значение я в матрице 02(п2,т1).

Функция определения весовых коэффициентов имеет вид: Рм(РЖ)Ч,)=/(/(М?4/(/(А^^ (11)

Помимо весовых коэффициентов необходимо определить входные данные. Функция определения входных данных Рвд(Рмш,Рэи,Я1> вычисляет разностную составляющую в исходном изображении и изображении проекции эталона.

Построение входной матрицы Р( 11,11) выполняется посредством анализа исходных матриц О,(«,,«,) и 02(п2,т2), имеющих 121 зону, каждая зона размерностью (я,/Пхт,/11). Вводится параметр я3, задающий пороговую разность элементов матриц 0\(п2>т2) и 02{п2,т2).

Формирование элементов матрицы Р( 11,11) производится следующим образом:

" Бт ' | 0, иначе

где Яи = "£/*!; >9, / = Ш,у = Ш.

[ 0, иначе.

Функция определения входных данных имеет вид:

Рвд(РиШ< Рэи>4з)~

f(f(f(FSИ,q))J(MDLJ(f(MDLJ(PBИ,q),ql)J{^ЮLJ(f(PBИ^)),gMъ)■ (13)

Математическая модель распознавания Рр(Рвк, Рвд)- Имеется матрица весов XV и матрица входных значений Р. Вычисляют поэлементно произведения данных матриц, затем суммируют все элементы результирующей матрицы

си)

i=l: M

Сравнивая полученное значение с установленным порогом q4, принимается решение о принадлежности изображения объекта к классу текущего эталона с учетом мажоритарного принципа. Если Е> qt, то объект считается распознанным, в противном случае производится очередная итерация, и процесс распознавания повторяется для очередной проекции эталона, удовлетворяющей предварительным условиям.

Математическая модель распознавания в операторной форме записывается: FÄFbk, Гпи, q4)= F( f(f(MDL,/(f(MDL, f(Fm,q),<7l), ДА/DI, f(f(Fa,,q)),q2 ))).,q), /(/(/(Fm, <?)), /(MDL, /{/(MDL, /(Fm ,q),4l), /(MDL, /(/(FB[I ,<?)), <?2 ))),g3) ,44). (15)

Разработанная математическая модель распознавания изображения Fp(FBK, Fm, q4) (15) обеспечивает инвариантное к положению объекта в пространстве распознавание и высокую скорость обработки данных за счет использования трехмерных эталонов и вектора дополнительных признаков.

В третьей главе разработан метод распознавания изображений объектов на основе трехмерных векторных эталонов. Эталоны хранятся в виде векторной модели. Векторная модель объекта представляет собой множество треугольников, которые в совокупности образуют в трехмерном пространстве фигуру объекта. Данная форма представления объекта позволяет производить аффинные преобразования в трехмерном пространстве.

Метод распознавание включает несколько этапов.

1. Ввод изображения.

2. Вычисление признаков (код и соотношение сторон габаритного контейнера) изображения.

3. Определение проекции эталона, имеющей соответствующие признаки.

4. Вычисление матрицы входных параметров и матрицы весовых коэффициентов.

5. Определение на основе имеющихся данных класса эталона, к которому принадлежит объект.

Для изображения объекта, поданного на вход, производится выделение габаритного контейнера и кодирование. Затем выбирается массив с параметрами эталона, сравниваются коды распознаваемого изображения и эталонного, отношение сторон габаритных контейнеров изображений. Если же оба указанных условия выполнены, то производится сравнение проекции эталона с изображением, поданным на вход. Для этого строится соответствующая проекция эталона таким образом, чтобы размеры габаритного контейнера распознаваемого объекта и проекции эталонного совпадали.

Далее производится сравнение объекта с проекцией эталона. Для этого используется нейроподобная структура типа персептрон. При превышении порога решающей функции, принимается решение о принадлежности изображения объекта к классу текущего эталона, в противном случае производится очередная итерация, и процесс распознавания повторяется для очередной проекции эталона, удовлетворяющей предварительным условиям. По завершении перебора базы эталона по мажоритарному принципу определяется класс объекта.

Дополнительно определены параметры, рассмотренные во второй главе математической модели, имеющие непосредственное влияние на достоверность и скорость распознавания. Достоверность распознавания характеризуется суммарным значением погрешностей:

8Е » F(AG, AS, ACr, АЕ), F(AG, AS, А Cr, АЕ) = к, ■ AG + к, ■ AS + к, • АС г + к, ■ АЕ, (16)

где ДО - соотношение сторон габаритного контейнера; ДБ - соотношение кодов изображений; ДСг - влияние процедуры анализа контура изображения на погрешность; ДЕ - расстояние между произведениями матриц весов и матриц входных значений Р; к1,к,,к},кл - весовые коэффициенты. Определение значений весовых коэффициентов производится в соответствии с методом экспертной оценки сравнения уровней значимости анализируемых признаков.

На основе созданного метода разработаны алгоритмы распознавания изображений объектов, содержащие аппаратно-ориентированные блоки, основанные на применении логико-арифметических операций (рис. 2, 3).

Рис. 2. Алгоритм формирования базы трехмерных векторных эталонов

Отличительной особенностью алгоритмов является уменьшение емкости памяти необходимой для хранения эталонов и возможность применения конвейерной обработки данных, за счет введения аппаратно-ориентированных блоков.

Рис. 3. Алгоритм распознавания изображений объектов

Предложена структурно-функциональная схема оптико-электронного устройства (Рис.4). Входное изображение подается на блок ввода изображения (БВИ), выделяющий яркостную составляющую, который передает полученные данные в блок обработки входного изображения (БОВИ), обеспечивающий выделение габаритного контейнера и расчет вектора признаков входного изображения: общее количество пикселей отличных от цвета фона, соотношение сторон габаритного контейнера. Блоком анализа изображения и последующего кодирования (БАИиК) осуществляется вычисляется количество пикселей, отличных от фона для каждой из зон, определяемых выражением (11). Далее блок, извлекающий данные из запоминающего устройства и производящий сравнение параметров (ИЗБиСП), сравнивает параметры имеющихся эталонов, находящихся в (ЗУПЭ), и параметры, полученные блоком анализа изображения и последующего кодирования (БАИиК). В случае наличия соответствия из запоминающего устройства, содержащего эталонные изображения в векторном формате (ЗУЭВИ), извлекается соответствующая векторная модель эталонного объекта. Блок, обеспечивающий преобразование векторного изображения (БПВИ), выполняет поворот, масштабирование и передает данные в блок для просчета проекции (БПП), где преобразуется векторное изображение в соответствующую плоскую проекцию.

Модуль выделения предварительных П£И»нвко1 С_В_И СО

Модуль хранения трехмерных векторных ¿талонов

Модуль сохранения параметров идентифицированных »талонов

Рис. 4. Структурно-функциональная схема устройства (патент РФ № 2361273)

На основе данных полученных из блока для просчета проекции (БПП) генератор весов персептрона (ГВП) формирует веса для персептроного блока (ПБ). Далее с помощью блока, пересылающего параметры "похожих" изображений (БПППИ), выполняется сравнение исходного изображения и проекции эталона. В качестве входных данных для персептронного блока (ПБ) используется количество пикселей. Решающий элемент персетронного блока, обеспечивает идентификацию изображения. Параметры всех идентифицированных изображений заносятся в стек для накопления полученных изображений (СПИ), откуда впоследствии извлекаются блоком выборки трехмерного эталона по переданным параметрам и сохраняющим необходимые данные (БВЭиСД) для передачи в устройство для коммуникации с ЭВМ (УКЭВМ).

В предложенном устройстве реализованы алгоритмы, описывающие процесс распознавания объектов позволяющие минимизировать требования к вычислительным ресурсам при реализации.

Сравнительный анализ показал, что наиболее трудоемкие и часто повторяющиеся операции: построение проекции модели эталона и сравнение проекции эталона и входного изображения. В связи с чем, соответствующие модули объединены в модули идентификации, подключаемые параллельно (рис. 5). Параллельные модули идентификации обеспечивают повышение скорости работы ОЭУ. Их количество определяется требуемой скоростью работы и техническими требованиями к

характеристикам устройства. Структурная схема быстродействующего оптико-электронного устройства с параллельными модулями идентификации приведена на рис. 5.

Модуль идентификации 1 Модуль идентификации 2 Модуль идентификации N

Рис. 5. Структурная схема быстродействующего оптико-электронного устройства распознавания с параллельной обработкой данных

Для определения характеристик оптико-электронного устройства распознавания объектов проведен анализ временных зависимостей в режиме распознавания.

Характеристикой скорости работы устройства является время обработки устройством изображения объекта То6р, которое определяется

Тобр~ Теи+ Траст

Т1Х,сп=Т„о+Кэт \Тизу +ТШМ +Тср+Е-Тзп)+Т„р (17)

где Тви - время ввода изображения; ТраС„ - время распознавания объекта; Тпо - время предварительной обработки; Иэт - количество проекций эталонов, обладающих схожими характеристиками (соотношение сторон габаритного контейнера, код проекции) с входным изображением; Тшу - время извлечения трехмерной векторной модели эталона; Т„тм -время построения проекции трехмерного эталона; Тср - время сравнения проекции эталона и входного изображения; Т,п - время записи в стек результатов; Е - параметр, принимающий значение 1, если пороговое значение решающего элемента превышено, и О в противном случае; Т„р - время передачи накопленных данных во внешнее устройство.

Новизной структурно-функциональной организации и оптико-электронного устройства распознавания объектов является разработка и введение специализированных модулей и связей с другими элементами системы, обеспечивающие требуемую достоверность распознавания в условиях ограниченной аппаратной сложности и вычислительной мощности, а также существенное быстродействия распознавания за счет применения алгоритмов с аппаратно-ориентированными блоками и параллельной обработки данных. К специализированным модулям относятся: модуль построения проекций эталонов; модуль сопоставления изображений с пороговым решающим элементом; модуль выделения предварительных признаков СИ! и СО.

В четвертой главе разработан аппаратно-программный комплекс для проведения экспериментальных исследований, на основе двух методов: разработанном методе с использованием трехмерных векторных эталонов и известном методе, основанном на вычислении взаимно-корреляционной функции (ВКФ). Разработана методика проведения экспериментальных исследований и приведены полученные результаты.

Аппаратно-программный комплекс (рис. 6) состоит из веб-камеры, портативной ПЭВМ, осветительного устройства, объекта исследования.

б)

Рис. 6. а) Внешний вид АПК. б) система ориентирования ОИ

Проводилось распознавание 301 входного произвольно расположенного объекта. Объекты, в основном, имеют по 100 ракурсов, что определяется формой объекта.

Вероятность ошибочного распознавания Рош определялась по следующей формуле

^ = (18) где Мн - количество нераспознанных объектов; N - количество предъявляемых объектов.

Для метода распознавания, основанного на вычислении взаимно-корреляционной функции, получены следующие результаты: 8. N=301, Рош=0.027. Из вероятности ошибочного распознавания Рош следует, что вероятность распознавания Рр = 0.973.

Для метода распознавания на основе трехмерных векторных эталонов результаты: N„=3, N =301. Р^0.01, Рр = 0.990.

Характеристикой достоверности распознавания является вероятность безошибочного распознавания объектов: "«( £*

(19)

рБР=1-Е рлг IУ

'=1V )

где РА, - априорная вероятность появления объектов ¡'-го класса, в нашем случае Ри = 1/301: Ру - вероятность ошибочного отнесения объекта ('-го класса к )-тому классу, Пк -количество классов объектов (в нашем случае 4).

Подставив в выражение (20) значения, полученные в результате эксперимента, получаем следующие результаты: для метода на основе вычисления ВКФ Рбр=0,968±0,014, для разработанного оптико-элекгронного устройства РБР=0,983-0,014.

Обобщенная характеристика достоверности с учетом вероятности ошибочной идентификации (18), (19):

/V п-( 17' }

РаГ (20)

" ./'=и*'

Для метода на основе вычисления ВКФ 0з=0,940±0,014. Для разработанного оптико-электронного устройства на основе трехмерных векторных эталонов 05=0,973±0,014. Обобщенные результаты эксперимента приведены в табл. 4.

Полученные данные позволяют сделать вывод о том, что разработанное оптико-электронное устройство на основе трехмерных векторных эталонов обладает более высокой достоверностью распознавания.

Таблица 4. Сравнительный анализ разработанного устройства и устройства, реализующего метод, основанный на вычислении ВКФ

Объект Самолет Куб Пирамида Шар

Устройство, реализующее метод, основанный на вычислении ВКФ

Количество проекций эталонов 311 63 960 1

Количество проекций после оптимизации 681

Кол-во нераспознанных проекций 2 2 4

Кол-во ошибок распознавания 10

Разработанное устройство

Количество проекций эталонов 367 23 83 1

Количество проекций после оптимизации 367 22 83 1

Общее количество проекций после оптимизации 473

Кол-во нераспознанных проекций 1 1 1

Кол-во ошибок распознавания 5

Исключение неинформативных проекций из базы данных эталонов позволяет существенно повысить скорость работы ОЭУ (рис.7).

Рис. 7. Временные характеристики ОВ, С<3(11,11): а) ВКФ промоделированный на АПК; б) разработанное ОЭУ промоделированное на АПК; в) разработанное ОЭУ, реализованное аппаратно Подставив полученные значения в формулу (18), выполним теоретический расчет среднего времени распознавания объекта:

Т0вр= Тт+ Грос„=14мс+ =3.8+6,622-(0,04 + 5,24+0,019 + 0,37-0,11)+ 3.3 =7.1+6,622-5.689=42.46 мс.

Исходя из рисунка 7 в) практическое среднее время распознавания объекта составляет Т0бр„=41.59 мс. Полученные результаты свидетельствуют, что отклонение в расчетах оказалось минимальным.

Далее производится расчет зависимости скорости обработки данных от количества параллельных модулей идентификации для указанных характеристик устройства. Расчет производится согласно методике, описанной в главе 3, результаты представленны на гистограмме (рис. 8).

«Вис«« «с «."л

■юлю ■ |

Рис. 8. Зависимость времени распознавания от количества параллельных модулей идентификации для устройства с вышеуказанными характеристиками

Проведенный анализ показывает, что для работы устройства требуется наличие 2-4 параллельных модулей идентификации, дальнейшее увеличение количества очевидного прироста в скорости распознавания не дает.

Основные характеристики разработанного ОЭУ и аналога, основанного на вычислении ВКФ, приведены в таблице 5.

Таблица 5. Основные характеристики метода, основанного на вычислении ВКФ и _ разработанного ОЭУ _

Наименование ОЭУ и реализованного метода Достоверность распознавания Среднее время распознавания на АПК, мс Расчетное время распознавания при аппаратной реализации, кол-во блоков - мс

| Устройство, реализующее метод, основанный на вычислении ВКФ 0,940±0,014 635,81 -

Разработанное устройство 0.973±0.014 180,01 1-42; 2-27; 3-20; 4-17

Из анализа характеристик ОЭУ сделан вывод, что быстродействие и достоверность разработанного ОЭУ, использующего в качестве эталонов трехмерные векторные изображения, выше, чем достоверность распознавания (повышена на 3,3%) и скорость обработки данных аналогов (от 3,5 и до 5,9 раз) - ОЭУ основанных на вычислении ВКФ, при существенно меньшей вычислительной сложности алгоритмов.

В заключении сформулированы основные результаты диссертации.

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ

При решении поставленной в диссертационной работе задачи были получены следующие результаты.

1. Основываясь на анализе существующих методов и устройств распознавания изображений объектов, создана математическая модель распознавания изображений объектов на основе трехмерных векторных эталонов, позволяющая повысить скорость обработки данных и достоверность распознавания трехмерных объектов за счет введения частных математических моделей хранения данных и выбора эталона.

2. Разработан метод распознавания изображений трехмерных объектов, обеспечивающей возможность реализации, как на программном, так и на аппаратном уровне, и позволяющий сохранить высокую достоверность распознавания при высокой скорости обработки данных за счет использования трехмерных векторных эталонов.

3. Разработаны алгоритмы, описывающие процесс распознавания объектов и формирования трехмерных векторных эталонов, позволяющие уменьшить емкость памяти, необходимой для хранения эталонов, и применять конвейеризацию и параллелизм, а

также выполнять ряд операций на специально разработанных вычислительных модулях, что существенно увеличивает скорость обработки данных.

4. Разработана структурно-функциональная схема быстродействующего оптико-электронного устройства распознавания объектов с применением принципов параллелизма и конвейерной обработки данных, особенностью которой является разработка и введение специализированных вычислительных устройств, реализующих параллельную, конвейерную обработку данных и специализированную адресацию, обеспечивающее высокую достоверность распознавания и скорость работы ОЭУ.

5. В процессе экспериментальных исследований подтверждена адекватность разработанной математической модели быстродействующего оптико-электронного устройства на основе трехмерных векторных эталонов, что позволяет использовать математическую модель для теоретических исследований влияния параметров разработанного устройства на скорость и достоверность распознавания. Сравнительный анализ разработанного оптико-электронного устройства показал, что оно характеризуется более высокой достоверностью (достоверность повышена на 3,3%) и быстродействием (в 3,5 раза без применения параллелизма и в 5,9 при использовании параллельных модулей идентификации), чем существующие аналоги.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ по перечню ВАК

1. Коростелев, С.И. Метод распознавания изображений объектов с использованием трехмерных векторных эталонов и программа для его реализации [Текст] / С.И. Коростелев, B.C. Титов, B.C. Панищев [и др.] // Телекоммуникации. 2007. № 9. С. 1014.

2. Коростелев, С.И. Метод распознавания символьной информации автомобильного бортового компьютера [Текст] / С.И. Коростелев, С.В.Дегтярев, М.И. Труфанов [и др.]// Датчики и системы. 2008. №5. С. 5 - 7.

3. Коростелев, С.И. Оптико-электронное устройство распознавания изображений объектов на основе трехмерных векторных эталонов [Текст] / С.И. Коростелев, В.С.Титов, М.И. Труфанов [и др.]// Информационно-измерительные управляющие системы. 2009. № 4. С. 59 - 64.

Монографии

4. Коростелев, С.И. Распознавание объемных объектов на основе трехмерных векторных эталонов [Текст]/ С.И. Коростелев // Монография: Оптико-электронные системы распознавания и анализа трехмерных динамических объектов / B.C. Титов [и др.]; Курск, гос. тех. ун-т. Курск, 2008. С. 92- 103.

Наиболее значимые статьи, опубликованные в других изданиях

5. Korostelev, S. Vision system for image recognition based on three-dimensional vector patterns [Text] / V. Gridin, V. Titov, M. Truphanov, S. Korostelev // Machine graphics and vision. Poland. 2009. Vol. 18. No. 2. P. 175 - 186.

Патенты

6. Пат. 2344478 Российская Федерация, МПК G 06 К N 9/32. Способ калибровки системы технического зрения распознавания номеров игровой рулетки и устройство для его реализации [Текст] / Труфанов М.И., Коростелев С.И., Алябьев Н.В.; заявитель и патентообладатель Курск, гос. тех. ун-т. № 2007140668/09; заявл. 01.11.2007; опубл. 20.01.2009, Бюл. №2.-7 с.

7. Пат. 2361273 Российская Федерация, МПК G 06 К N 9/62. Способ и устройство распознавания изображений объектов [Текст] / Коростелев С.И., Титов B.C.,

Панищев B.C.; заявитель и патентообладатель Курск, гос. тех. ун-т. № 2007109075/09; заявл. 13.03.2007; опубл. 10.07.2009, Бюл. № 19. - 10 с.

8. Пат. 2365992 Российская Федерация, МПК G 06 К N 9/32. Способ распознавания одно- двухзначных чисел на игровом колесе рулетки и автокалибрующееся оптико-электронное устройство для его реализации [Текст] / Титов B.C., Коростелев С.И., Труфанов М.И., Мирошниченко С.Ю., Панищев B.C.; заявитель и патентообладатель Курск, гос. тех. ун-т. № 2007148769/09; заявл. 25.12.2007; опубл. 27.08.2009, Бюл. № 24. -7 с.

Материалы и тезисы докладов, опубликованные в трудах Всероссийских и Международных конференций

9. Коростелев, С.И. Использование трехмерных эталонов в задаче распознавания [Текст] / С.И. Коростелев, B.C. Панищев // Всероссийская конференция по проблемам информатики, физики и химии: материалы Всероссийской конференции, 18-25 апреля 2005 г. Москва; Тезисы докладов физические секции. М.: изд-во РУДН, 2005. С. 106 - 108.

10. Коростелев, С.И. Программа распознавания образов, использующая векторные эталонные изображения [Текст] / С.И. Коростелев, B.C. Панищев, B.C. Титов // Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание - 2005 [Текст]: сб. материалов 7 Междунар. конф. / Курск гос. техн. ун-т. Курск, 2005. - 254 с.

11. Коростелев, С.И. Программа распознавания образов, использующая векторные эталонные изображения [Текст] / С.И. Коростелев // Молодежь и XXI век: тезисы докладов XXXIII вузовской научно-технической конференции студентов и аспирантов в области научных исследований: в 2 ч. Курск, гос. техн. ун-т. Курск, 2005. Ч. 1. 208 с.

12. Коростелев, С.И. Устройство для распознавания образов, инвариантного к аффинным преобразованиям [Текст] / С.И. Коростелев // Молодежь и XXI век: тезисы докладов XXXIV вузовской научно-технической конференции студентов и аспирантов в области научных исследований: в 2 ч. / Курск, гос. техн. ун-т. Курск, 2006. Ч. 1. 134 с.

13. Коростелев, С.И. Программа распознавания образов [Текст] / С.И. Коростелев // Молодежь и XXI век: тезисы докладов XXXV вузовской научно-технической конференции студентов и аспирантов в области научных исследований: в 2 ч. / Курск, гос. техн. ун-т. Курск, 2007. Ч. 1. 228 с.

14. Коростелев, С.И. Способ распознавания образов, инвариантный к аффинным преобразованиям поворота и масштабирования [Текст] / С.И. Коростелев // Интеллектуальные и информационные системы: материалы Всероссийской научно-технической конференции / Тул. гос. техн. ун-т. Тула, 2007. 134 с.

Соискатель Коростелев С.И.

ИД №06430 от 10.12.01 Подписано к печати_. Формат 60x84 1/16.

Печатных листов 1,0 Тираж 100 экз. Заказ_.

Курский государственный технический университет.

Издательско-полиграфический центр Курского государственного технического университета.

305040, г. Курск, ул. 50 лет Октября, 94.

Оглавление автор диссертации — кандидата технических наук Коростелев, Сергей Иванович

ВВЕДЕНИЕ.

ГЛАВА 1. АНАЛИЗ МЕТОДОВ И УСТРОЙСТВ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ.

1.1. Методы, основанные на анализе контура объекта.

1.2. Нейросетевые методы.

1.3. Методы, основанные на сравнении с эталоном.

1.4. Методы распознавания сложных стерео- и мультиизображений в реальном времени.

1.5. Оптико-электронные устройства для распознавания изображений объектов.

ГЛАВА 2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ ТРЕХМЕРНЫХ ВЕКТОРНЫХ ЭТАЛОНОВ.

2.1. Математическая модель ввода изображения распознаваемого объекта

2.1.1. Функция определения габаритного контейнера.

2.1.2. Функция масштабирования изображения.

2.1.3. Функция кодирования изображения.

2.2. Математическая модель представления эталонов MDL.

2.2.1. Функция выбора эталонов.

2.2.2. Функция получения изображения проекции эталона.

2.3. Функция определения весовых коэффициентов.

2.4. Функция определения входных данньгс.

2.5. Математическая модель распознавания на основе весовых коэффициентов и входных данных.

2.6. Обобщенный алгоритм работы оптико-электронного устройства распознавания изображений объекта.

ГЛАВА 3. АНАЛИЗ ХАРАКТЕРИСТИК И СИНТЕЗ БЫСТРОДЕЙСТВУЮЩЕГО ОПТИКО-ЭЛЕКТРОННОГО УСТРОЙСТВА РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ НА ОСНОВЕ ТРЕХМЕРНЫХ ВЕКТОРНЫХ ЭТАЛОНОВ.

3.1. Достоверность распознавания объектов.

3.2. Синтез метода и алгоритмов распознавания.

3.2.1. Алгоритмы формирования эталонов.

3.2.2 Алгоритмы формирования предварительных признаков.

3.2.3. Синтез алгоритма распознавания изображений.

3.3. Синтез быстродействующего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов.

3.3.1 Структурно-функциональная схема и описание принципов работы

3.3.2. Повышение быстродействия устройства оптико-электронного устройства распознавания изображений объектов.

3.3.3. Анализ быстродействия оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов

3.4. Инженерная методика определения параметров устройства и количества параллельных модулей идентификации объекта.

ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ ВЫСОКОТОЧНОГО ОПТИКО-ЭЛЕКТРОННОГО УСТРОЙСТВА РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ НА ОСНОВЕ ТРЕХМЕРНЫХ ВЕКТОРНЫХ ЭТАЛОНОВ.

4.1. Аппаратногпрограммный комплекс для проведения испытаний высокоточного оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов.

4.2. Методика проведения экспериментальных исследований.

4.3. Экспериментальное определение основных характеристик быстродействующего оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов.

4.3.1. Оценка достоверности.

4.3.2. Оценка быстродействия.

4.3.3. Расчет количества параллельных модулей иденти-фикации.

4.3.4. Оценка дополнительных характеристик.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Коростелев, Сергей Иванович

Актуальность работы. Ускорение темпов производства на основе автоматизации и роботизации технологических процессов является одним из приоритетных направлений развития приборостроения и вычислительной техники в настоящее время. Оптико-электронные устройства (ОЭУ), являющиеся неотъемлемым элементом систем управления, находят все большее применение в различных областях деятельности человека, начиная от производства и заканчивая процессом обработки данных. Основной функцией оптико-электронных устройств является распознавание объектов и измерение их параметров. Для большинства прикладных задач на практике имеется необходимость анализа и распознавания трехмерных объектов, в связи с чем, распознавание изображений объектов приобретает еще большую актуальность.

Решение задачи распознавания характеризуется рядом сложностей, связанных с положением объекта в пространстве. В связи с этим целесообразно применение методов, позволяющих производить распознавание объектов инвариантно к положению и ориентации в пространстве, а также обладающих высокой скоростью обработки данных.

Существует множество методов распознавания произвольно расположенных объектов, однако большинство из них имеет существенные ограничения. Так, например, существуют сложности в решении задачи идентификации объектов, отличающихся визуально незначительно и имеющих схожие ракурсы. Кроме того имеется зависимость достоверности распознавания от положения объекта в пространстве, что для произвольно расположенного объекта может приводить к его ошибочному распознаванию.

Оптико-электронные устройства, предназначенные для распознавания трехмерных объектов, как правило, основаны на анализе двух и более изображений объекта в различных ракурсах. Недостатками подобных устройств являются следующие: сложность аппаратуры, необходимость точной калибровки ОЭУ, значительная вычислительная сложность, которая может приводить к длительному времени распознавания.

Наряду с этим известны методы распознавания трехмерных объектов, основанные на анализе единственного изображения объекта. Подобные методы требуют значительных вычислительных ресурсов для реализации, большого объема памяти для хранения проекций эталонного объекта в различных ракурсах. Кроме того пространство используемых признаков зачастую не позволяет рационально сформировать базу эталонов, что приводит к существенным затратам памяти и длительному процессу поиска, отрицательно сказывающимся на быстродействии ОЭУ. Большинство существующих методов имеют узкий спектр применения, связанный с ограничениями, накладываемыми при реализации, такими, как аппаратная база, масса, габариты устройства и временные показатели скорости обработки данных.

Таким образом, существует объективная необходимость создания новых методов распознавания и ОЭУ, позволяющих решить задачу распознавания трехмерного объекта, снизить вычислительную сложность, повысить достоверность распознавания и скорость обработки данных.

В этой связи актуальной научно-технической задачей является разработка метода и устройств распознавания объектов, позволяющих повысить достоверность распознавания и обеспечить быстродействие ОЭУ.

Перспективным подходом к решению этих задач является применение трехмерных векторных изображений в качестве эталонов, позволяющих в сочетании с дополнительными признаками предварительного анализа повысить достоверность и увеличить скорость распознавания за счет инвариантности к положению объекта в пространстве и сокращения затрат времени за счет использования параллельных вычислений.

Диссертационная работа выполнена в рамках фундаментальных исследований с госбюджетным финансированием, которые велись и ведутся в Курском государственном техническом университете (госбюджетная НИР:

1.1.05 "Исследование теоретических основ, методов и алгоритмов повышения качества обработки изображений в системе технического зрения" (№ гос. регистрации 01200508819, 2005 г.).

Цель работы: разработка метода распознавания изображений объектов, основанного на использовании трехмерных векторных эталонов и быстродействующего оптико-электронного устройства, характеризующегося повышенной достоверностью и инвариантностью к аффинным преобразованиям объекта.

Задачи исследования, решаемые в работе:

1. Сравнительный анализ существующих методов и устройств распознавания изображений и обоснование необходимости создания комбинированных методов с повышенной достоверностью и быстродействующих устройств распознавания объектов.

2. Разработка математической модели распознавания изображений объектов на основе трехмерных векторных эталонов.

3. Создание метода инвариантного к аффинным преобразованиям в пространстве и алгоритмов распознавания изображений объектов, содержащих блоки, которые допускают аппаратную-ориентацию.

4. Разработка структурно-функциональной схемы и быстродействующего оптико-электронного устройства распознавания изображений трехмерных объектов.

Новыми научными результатами, выносимыми на защиту, являются:

1. Математическая модель распознавания объекта на основе трехмерных векторных эталонов, обеспечивающая инвариантность к положению объекта в пространстве и отличающаяся применением специализированной структуры данных описания эталонов.

2. Алгоритмы распознавания объектов и формирования трехмерных векторных эталонов, обеспечивающие уменьшение емкости памяти, необходимой для хранения эталонов, и возможность применение конвейерной обработки данных.

3. Метод распознавания изображений трехмерных объектов, обеспечивающей возможность реализации, как на программном, так и на аппаратном уровне, и позволяющий сохранить высокую достоверность распознавания при высокой скорости обработки данных за счет использования трехмерных векторных эталонов.

4. Структурно-функциональная схема оптико-электронного устройства распознавания объектов с конвейерной обработкой данных, особенностью которой является разработка и введение специализированных вычислительных устройств, реализующих параллельную, конвейерную обработку данных и обеспечивающих повышение быстродействия оптико-электронного устройства.

Объект исследования - оптико-электронные устройства распознавания изображений трехмерных объектов.

Предмет исследования - методы, алгоритмы и оптико-электронные устройства обработки и распознавания изображений.

Методы исследования. В работе использованы методы цифровой обработки сигналов и изображений, математического моделирования, распознавания изображений объектов и анализа дискретных изображений, методы проектирования устройств ЭВМ.

Практическая ценность работы состоит в том, что ее результаты являются основой для разработки широкого класса оптико-электронных устройств распознавания трехмерных объектов по единственному изображению. Применение подобных устройств возможно в следующих системах: системах контроля качества продукции, автоматизированных манипуляторах, робототехнике, системах наведения.

Разработанный метод распознавания характеризуется гибкостью и возможностью реализации, как на программном, так и на аппаратном уровне, что обеспечивает широкий спектр областей использования. Особенностью метода является наличие ряда параметров, обеспечивающих баланс достоверности распознавания, производительности и аппаратных затрат в зависимости от условий применения.

Результаты диссертационной работы внедрены на предприятиях ООО «СМИ-Линк г. Курск», ОГУ СМЭП Курской области и используются в учебном процессе Курского государственного технического университета по учебным дисциплинам «Структурно-топологическое проектирование ЭВМ», «Основы теории распознавания образов».

Апробация работы. Основные положения диссертационной работы докладывались и получили положительную оценку на Международных и Российских конференциях: Всероссийская конференция по проблемам информатики, физики и химии (г. Москва РУДН 2005); Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации «Распознавание 2005» (г. Курск, Курский государственный технический университет 2005 г.); «Молодежь и XXI век: 2005, 2006, 2007» (г. Курск, Курский государственный технический университет 2005, 2006, 2007 гг.).

Публикации. Основные результаты выполненных исследований и разработок опубликованы в 14 печатных работах, в том числе в 7 статьях. Среди них: 3 статьи, опубликованные в рецензируемых научных журналах, входящих в перечень журналов и изданий, рекомендуемых ВАК, а также 3 патента Российской Федерации.

Личный вклад автора. В работах, опубликованных в соавторстве, лично соискателем предложены: в [48] - метод распознавания изображений объектов с использованием трехмерных векторных эталонов и программа для его реализации; в [2] - метод распознавания символьной информации автомобильного бортового компьютера; в [3] - способ калибровки системы технического зрения распознавания номеров игровой рулетки; в [85,67,6,87] -устройство для инвариантного к аффинным преобразованиям распознавания изображений на основе трехмерных векторных эталонов; в [1] - способ распознавания одно - двухзначных чисел; в [68] - использование трехмерных эталонов в задаче распознавания; в [85] - программа распознавания образов, использующая векторные эталонные изображения.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы, включающего 87 наименований, изложена на 138 страницах и поясняется 36 рисунками и 16 таблицами.

Заключение диссертация на тему "Быстродействующее оптико-электронное устройство распознавания изображений объектов на основе трехмерных векторных эталонов"

126 Выводы

1. Разработаны аппаратно-программный комплекс и методика проведения экспериментальных исследований для определения основных характеристик и параметров оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов. Проведен эксперимент, позволяющий оценить быстродействие устройства и достоверность распознавания объектов.

2. В результате выполнения экспериментальных исследований подтверждена адекватность разработанной математической модели оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов.

3. Проведенные экспериментальные исследования оптико-электронного устройства распознавания изображений объектов на основе трехмерных векторных эталонов позволили провести сравнительный анализ с методом, основанным на ВКФ, подтверждающий преимущества разработанного высокоточного оптико-электронного устройства. Подтверждено высокое быстродействие и достоверность распознавания разработанного оптико-электронного устройства. Сравнительный анализ быстродействия разработанного оптико-электронного устройства показал, что оно обладает более достоверностью (достоверность повышена на 3,3%) и высоким быстродействием (в 3,5 раза без применения параллелизма и в 5,9 при использовании параллельных модулей идентификации), чем существующие аналоги.

ЗАКЛЮЧЕНИЕ

При решении поставленной в диссертационной работе задачи были получены следующие результаты.

1. Основываясь на анализе существующих методов и устройств распознавания изображений объектов, создана математическая модель распознавания изображений объектов на основе трехмерных векторных эталонов, позволяющая повысить быстродействие и достоверность распознавания трехмерных объектов за счет введения частных математических моделей хранения данных и выбора эталона.

2. Разработан метод распознавания изображений трехмерных объектов, обеспечивающей возможность реализации, как на программном, так и на аппаратном уровне, и позволяющий сохранить высокую достоверность распознавания при высокой скорости обработки данных.

3. Разработаны алгоритмы, описывающие процесс распознавания объектов и формирования трехмерных векторных эталонов, позволяющие уменьшить емкость памяти, необходимой для хранения эталонов, и применять конвейеризацию и параллелизм, а также выполнять ряд операций на специально разработанных вычислительных модулях, что существенно увеличивает скорость обработки данных.

4. Разработана структурно-функциональная схема быстродействующего оптико-электронного устройства распознавания объектов с применением принципов параллелизма и конвейерной обработки данных, особенностью которой является разработка и введение специализированных вычислительных устройств, реализующих параллельную, конвейерную обработку данных и специализированную адресацию, обеспечивающее высокую достоверность распознавания и скорость работы ОЭУ.

5. В процессе экспериментальных исследований подтверждена адекватность разработанной математической модели быстродействующего оптико-электронного устройства на основе трехмерных векторных эталонов, что позволяет использовать математическую модель для теоретических исследований влияния параметров разработанного устройства на скорость и достоверность распознавания. Сравнительный анализ разработанного оптико-электронного устройства показал, что оно обладает более высокой достоверностью (достоверность повышена на 3,3%) и быстродействием (в 3,5 раза без применения параллелизма и в 5,9 при использовании параллельных модулей идентификации), чем существующие аналоги.

Библиография Коростелев, Сергей Иванович, диссертация по теме Элементы и устройства вычислительной техники и систем управления

1. B.C. Панищев. № 2007148769/09; заявл. 25.12.2007; опубл. бюл. № 24 27.08.2009, 2009 г.

2. Коростелев, С.И. Метод распознавания символьной информации автомобильного бортового компьютера Текст./ С.И. Коростелев,

3. C.В.Дегтярев, М.И. Труфанов, А.В. Медведев // Датчики и системы. №5. 2008.-С. 5-7.

4. Чернов, А.В. Автоматическое распознавание контуров зданий на картографических изображениях Текст. / А.В. Чернов, Н.В. Чупшев// Компьютерная оптика: Том № 31 №4, Октябрь декабрь 2007 г. С. 101-103.

5. Dajnowiec, М. An Adaptive Rule Based Automatic Lung Nodule Detection •i System Text. / M. Dajnowiec, J. Alirezaie, P. Babyn // Pattern Recognition and1.age Analysis. Lect. Notes in Сотр. Sci.,v. 3687. 2005. P. 773-782.

6. Головко, В.А. Нейроинтеллект: Теория и применения. Самоорганизация, отказоустойчивость и применение нейронных сетей Текст. / В.А Головко В.А// Книга 2. Брест: БПИ. 1999. 228 с.

7. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика Текст./ Ф. Уоссермен // М.: Мир. 1992. 184 с.

8. Petrou, М. Learning in Pattern Recognition Text. / M. Petrou // Lecture Notes in Artificial Intelligence Machine Learning and Data Mining in Pattern Recognition. 1999. P. 11-12.

9. Jacobsen, X. A Comparison between Neural Networks and Decision Trees Text. / X. Jacobsen, U. Zscherpel, P. Perner // Lecture Notes in Artificial Intelligence Machine Learning and Data Mining in Pattern Recognition. 1999. P. 144-158.

10. Гимаров, В.А. Нейросетевой алгоритм классификации сложных объектов Текст. / В.А. Гимаров, М.И. Дли // Программные продукты и системы. 2004 № 4. -МНИИПУ, НИИ «Ценртрпрограммсистем». 2004. С. 51-55.

11. Круглов, В.В. Нечеткая логика и искусственные нейронные сети Текст. / В.В. Круглов, М.И. Дли, Р.Ю. Голунов // М.: Физматлит 2001. 221 с.

12. У сков, А. А. Гибридный нейросетевой алгоритм идентификации сложных объектов Текст. / А.А. Усков, Д.В: Санатин // Программные продукты и системы.- 2006 № 1. МНИИПУ, НИИ «Ценртрпрограммсистем». 2006. С. 4-7.

13. Катковник, В1. Я. Непараметрическая идентификация и сглаживание данных Текст. / В. Я. Катковник // М.: Наука. 19851 336 с.

14. Дли, М.И. Локально-аппроксимационные модели сложных объектов Текст. / Дли М.И. // М.: Наука; Физмалит. 2000. 224 с.

15. Дюк В. Data Mining: учебный курс Текст. / В. Дюк, А. Самойленко // СПб.: Питер. 2001. 368 с.

16. Круглов, В.В. Искусственные нейронные сети. Теория и практика Текст. / В.В. Круглов, В.В. Борисов // М.: Глячая линия — Телеком. 2001. 384 с.

17. Hubel, D.H. Receptive fields and functional architecture in two nonstriate visual area (18 and 19) of the cat Text. / D.H. Hubel, T.N. Wiesel // J. Neurophysiol. 28. 1965. P. 229-289.

18. Fukushima, K. Neocognitron: a self-organising neural network for mechanism of pattern recognition unaffected by shift in position Text. / K. Fukushima // Biological Cybernetics 36. 1980. P. 193-202.

19. Satoh, S. Recognition of Hand-written Patterns by Rotation-invariant Neocognitron Text. / S. Satoh, J. Kuroiwa, H. Aso, S. Miyake // Proc. of ICONIP'98, 1. 1998. P. 295-299.

20. Satoh, S. Pattern Recognition System with Top-Down Process of Mental Rotation Text. / S. Satoh, J. Kuroiwa, H. Aso and S. Miyake // Proc. of IWANN'99, 1. 1999. P. 816-825.

21. Carpenter, G.A. Fuzzy Artmap : A neural network architecture for incremental supervised learning of analog multidimensional Maps Text. / G.A. Carpenter, S. Grossber // IEEE Transactions on Neural Network. V. 3. 1992. P. 698-712.

22. Carpenter G.A. What-and-Where filter. A partial mapping neural network for object recognition and image understandingText. / G.A. Carpenter, S. Grossber, G.W. Leshert // Computervision and image understanding. V. 69, No. 1. 1998. P. 11-22.

23. Загоруйко, Н. Г. Семейство алгоритмов. Локатор для быстрого поиска ближайшего аналога Текст. / Н. Г. Загоруйко, В.В. Дюбанов // СибЖИМ. Т. 38, №5. 2006. С. 54—62.

24. Johnson, А.Е. IEEE Trans. Text. / А.Е. Johnson, М. Hebert // Pattern Analysis and Machine Intelligence, 21(5). 1999. P. 433-449.

25. Черников, И.С. Компьютерное моделирование Текст. / И.С. Черников // Труды XV международной научно-технической конференции «Телематика 2008», СПб. 2008. С. 166-170.

26. Timofeev, A.V. Application DSP and ADSP For Artifical Neural Network Control of Dynamic Objects Text. / A.V. Timofeev, O.A. Derin, R.U. Sova // Proceedings of the First International Conference Szczecin Poland, December 1112. 1997. P.91-95.

27. Анцев, Г.В. К вопросу формирования эталонных изображений для оптикоэлектронной бортовой системы автоматического распознавания объектов Текст. / Г.В. Анцев, А.А. Макаренко, JI.C. Турнецкий //

28. Идентификация систем и задачи управления: труды VII международной конференции SICPRO 08. Москва, Институт проблем управления им. В.А. Трапезникова РАН. 2008. С. 2130-2139.

29. Макаренко, А.А. К вопросу коррекции проективных искажений оптикоэлектронного аэроснимка Текст. / А.А. Макаренко, JI.C. Турнецкий // XII Международная научно-техническая конференция «Радиолокация, навигация, связь». Воронеж. 2006. С. 1952-1960.

30. Пискунов, Н.С. Дифференциальное и интегральное исчисления Текст. / Н.С. Пискунов // Учебник для втузов. Т. 2. - М.: Наука. - 1970. - С. 576.

31. Юдин, М.Ф. Основные термины в области метрологии Текст.: Словарь-справочник / Юдин М.Ф., Селиванов М.Н., О.Ф. Тищенко, А.И. Скороходов; Под ред. Ю.В. Тарбеева//М.: Издательство стандартов. 1989. С. 113.

32. Козлов, Ю.М. Адаптация и обучение в робототехнике Текст. / Козлов Ю.М. -М.: Наука. Гл. ред. физ.-мат. лит. 1990. С. 248.

33. Труфанов, М.И. Калибровка установочного положения датчиков бинокулярного оптико-электронного устройства Текст. / М.И. Труфанов // Сборник материалов МНТК «Медико-экологические информационные технологии». Курск. 2005. С. 91 92.

34. Растригин, JI.A. Адаптация сложных систем Текст. / Растригин JI.A. // Рига: Зинатне. 1981. 375 с.

35. Bas, Е.К. An easy to install camera calibration for traffic monitoring Text. / E.K.Bas, J.D.Crisman // In Proc. IEEE Conf. on Intelligent Transportation Systems. 1997. P. 362-366.

36. Ярославский, Л. П. Введение в цифровую обработку изображений Текст. / JI. П. Ярославский // М.: Сов. радио. 1979. 216 с.

37. Wolberg, G. Digital Image Warping / G. Wolberg // IEEE Computer Society Press Monograph. 1990. P. 344.

38. Gonzalez, R.C. Digital Image Processing Text./ R.C. Gonzalez, R.E. Woods// Upper Saddle River, NJ, USA: Prentice-Hall, Inc. 2006. P. 624.

39. Коростелев, С.И. Метод распознавания изображений объектов с использованием трехмерных векторных эталонов и программа для его реализации Текст. / С.И. Коростелев, B.C. Титов, B.C. Панищев, В.А. Денисюк // Телекоммуникации. № 9. 2007. С. 10-14.

40. Кобаяси, Ш. Основы дифференциальной геометрии Текст. / Ш. Кобаяси, К. Номидзу // Т. 1, Наука, М. 1981.344 с.

41. Никулин, Е. А. Компьютерная геометрия и алгоритмы машинной графики Текст. / Е. А. Никулин // СПб: БХВ-Петербург. 2003. 560 с.

42. Дональд, Херн Бейкер Компьютерная графика и стандарт OpenGL. 3-е изд. Текст. / Херн Дональд, М. Паулин // М.: «Вильяме». 2005. С. 1168

43. Розенблатт, Ф. Принципы нейродинамики: Перцептроны и теория механизмов мозга Текст. / Ф. Розенблатт // М.: Мир. 1965. 480 с.

44. Верхагин, К. Распознавание образов: состояние и перспективы Текст. / К. Верхагин // М.: Радио и связь. 1985. 104 с.

45. Чепонис, К.А. Методы, критерии и алгоритмы, используемые при преобразовании, выделении и выборе признаков в анализе данных / К.А.Чепонис // Сб.статей. Вильнюс. 1988. 150 с.

46. Сойфер, В.А. Методы компьютерной обработки изображений Текст. / В.А. Сойфер // М.: Физматлит. 2001. 784 с.

47. Юдин, М.Ф. Основные термины в области метрологии Текст. / Словарь-справочник // Юдин М.Ф., Селиванов М.Н., О.Ф. Тищенко, А.И. Скороходов; Под ред. Ю.В. Тарбеева. М.: Издательство стандартов. 1989. С.113.

48. Журавлев, Ю.И. «Распознавание». Математические методы. Программная система. Практические применения Текст. / Ю.И. Журавлев, В.В. Рязанов, О. В. Сенько // М.: Фазис. 2006. 176 с.

49. Hjaltson, G.R. Ranking in spatial databases Text. / G.R. Hjaltson, H. Samet // Lecture Notes in Computer Science, 951. 1995. P. 83-95.

50. Friedman, J. H. An algorithm for finding best matches in logarithmic expected time Text. / J. H. Friedman, J.L. Bently, R.A.Finkel // In ACM Transaction on Mathematical Software, volume 3 Sept. 1977. PP. 209-226.

51. Хоровиц, П. Искусство схемотехники. В 3-х томах: Т. 2. Перевод с английского 4-е изд. Текст. / П. Хоровиц, У. Хилл // М.: Мир. 1993. - 371 с.

52. Титов, B.C. Технико-экономический анализ разработки средств визуального контроля. Учебное пособие Текст. / B.C. Титов, В.И. Сырямкин, Т.А. Ширабакина // Курск гос. техн. ун-т. Курск. 1995. 98 с.

53. Титов, B.C. Методика применения экспертных методов для оценки качества продукции Текст. / B.C. Титов, Т.А. Ширабакина // М.: Стандарт. 1975.31 с.

54. Патент 2361273, Российская Федерация МПК G 06 К N 9/62. Способ и устройство распознавания изображений объектов Текст. / С.И. Коростелев, B.C. Титов. B.C. Панищев. № 2007109075/09; заявл. 13.03.2007; опубл. бюл. № 19 10.07.2009, 2009 г.

55. Воеводин, В.В. Параллельные вычисления Текст. / В.В. Воеводин, Вл.В. Воеводин // СПб.: БХВ-Петербург. 2002. 608 с.

56. Гуров, В.В. Основы теории и организации ЭВМ Текст. / В.В. Гуров, В.О. Чуканов // М.: ИНТУИТ. 2006. 280 с.

57. Григорьев, B.JI. 80486. Архитектура и программирование: В 4 т. Т. 4 Текст. / В.Л. Григорьев // М.: МИКАП. 1993. 382 с.

58. Bier, J. Choosing a Processor: Benchmarks and Beyond (S043) Text. / J. Bier // Berkeley, California: Berkeley Design Technology, Inc., USA. 2006. P. 254.

59. Deering, W. The Triangle Processor ond Normal Vector Shader A VLSI System for High Perfonnance Graphics Text. / W. Deering // Computer Graphics, 4. April 1988 VoL. 22. 1988. P. 21-30.

60. Duff, T. Smoothly shaded rendering of polyhedral objects on raster displays Text. / T. Duff// Computer Graphics Feb. 1979 Vol. 13, 2. 1979. PP. 270-275.

61. Bishop, C. Fast Phong Shading Text. / C. Bishop, D.M. Weimar // Computer Graphics, 4. April 1986, Vol. 20. 1986 P. 103-106.

62. Jackel, O. A Real-time Raster Scan Display for 3-D Graphics Text. / O. Jackel, H. Ruesseler // Advance in Computer Graphics Hardware IV, S pringer. 1991.

63. Jackel, O. Grafik-Computer, Springer-Verlag, 1992. Text. / O. Jackel, M. Cobernuss, H. Ruesseler // Verfanren und Schaltungsarundnung zur Untetduckung verdeckter Bikfpunkte, DE 41 43 576 Al, German Patent Of ice. 1993. P. 25.

64. Molnar, S. PixalFlow High-Speed Rendering Using Image CompositionText. / Molnar S., Zyles,Z., // SIGGRAPH'92. 1992.

65. Akenine-Moller, T. Real-Time Rendering, Third Edition Text. / T. Akenine-Moller//England: AK Peters. 2008 . P. 1045.

66. Галушкина, А.И. Проблемы построения и обучения нейронных сетей Текст. / А.И.Галушкина, В.А.Шахнова // М.: Изд-во Машиностроение. Библиотечка журнала Информационные технологии №1. 1999. С. 105.

67. Галушкин, А.И. Некоторые исторические аспекты развития элементной базы вычислительных систем с массовым параллелизмом (80- и 90- годы) Текст. / А.И.Галушкин // Нейрокомпьютер. №1. 2000. С.68-82.

68. Лебедев; О.Н. Применение микросхем памяти в электронных устройствах Справ, пособие Текст. / О.Н. Лебедев // М.: Радио и связь. 1994. 216 с.

69. Агуров П. В. Интерфейс USB. Практика использования и программирования Текст. / П.В. Агуров // СПб: БХВ-Петербург. 2004. 576 с.

70. Коростелев, С.И. Оптико-электронное устройство распознавания изображений объектов на основе трехмерных векторных эталонов Текст. /

71. С.И. Коростелев, В.С.Титов, М.И. Труфаиов, А.В. Медведев // Информационно-измерительные управляющие системы № 4 2009. С. 59 64.

72. Александрова, В.В. Компьютерное моделирование пространственных форм в среде 3D STUDIO МАХ Текст. / В.В. Александрова // СПб.: Анатолия 2003. 319 с.

73. Korostelev, S. Vision system for image recognition based on three-dimensional vector patterns Text. / V. Gridin, V. Titov, M. Truphanov, S. Korostelev // Machine graphics and vision. Poland, Vol. 18, No. 2, 2009. P. 175 186.