автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование методов анализа и построения трехмерной модели лица по фотографиям
Автореферат диссертации по теме "Разработка и исследование методов анализа и построения трехмерной модели лица по фотографиям"
Направахрукописи
АЛЬ АККАД М.Айман
РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ АНАЛИЗА И ПОСТРОЕНИЯ ТРЕХМЕРНОЙ МОДЕЛИ ЛИЦА ПО ФОТОГРАФИЯМ
Специальность:
05.13.01 - системный анализ, управление и обработка информации (в машиностроении и вычислительной технике)
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Ижевск 2004
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования "Ижевский государственный технический университет" (ГОУ ВПО "ИжГТУ")
Защита состоится 21 января 2005 года в 14°° часов на заседании диссертационного совета в ГОУ ВПО "ИжГТУ" по адресу: 426069, г.Йжевск, ул. Студенческая, 7, корпус 1.
С диссертацией можно ознакомиться в библиотеке ГОУ ВПО "ИжГТУ" Автореферат разослан 15декабря 2004 года.
Научный руководитель:
доктор технических наук, профессор КучугановВ. Н.
Официальные оппоненты:
доктор технических наук, профессор СметанииАМ. кандидат технических наук МиличВ.Н.
Ведущая организация:
Нижегородский государственный архитектурно-строительный университет (ННГАСУ)
Ученый секретарь диссертационного совета, кандидат технических наук, доцент
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. На протяжении долгого времени человеческое лицо является объектом пристального изучения многих отраслей науки, ведь оно несет в себе важную уникальную информацию о поле, возрасте и эмоциях человека. Именно уникальность лица каждого человека предопределяет возможность его использования и в области распознавания и удостоверения.
Распознавание образов уже признано важной отраслью машинного зрения в рамках теории вычислительных машин и систем. В сфере распознавания образов распознавание лиц выделилось в независимую область для научных исследований. Оказалось, что системы распознавания лиц представляют собой особый интерес для целого ряда применений в таких областях, как системы безопасности или индексация больших мультимедийных баз данных. Все больше и больше разработок в области безопасно-ста сконцентрировано на биометрическом решении для того, чтобы избавиться от РШ кодов и карт, которые могут быть украдены или потеряны. Еще одним преимуществом использования биометрических черт лица является низкая стоимость оборудования, в частности, камеры, Изображения типа фотографий для досье (фас и профиль) приняты и широко используются в качестве официального метода удостоверения многими правительствами и институтами.
Распознавание образов и интерпретация, основанная на знаниях -одна из важнейших задач искусственного интеллекта (Осипов Г.С.). Как следует из анализа области искусственного интеллекта и машинного зрения, важной частью решения задачи распознавания образа является задача его представления. Вследствие быстрого развития технологии создания аппаратного и программного обеспечения, в компьютерной графике и распознавании образов были сделаны попытки реализовать автоматическое моделирование трехмерного человеческого лица по видео или фотоснимкам, содержащим изображение лица.
Несмотря на разнообразие методов построения и распознавания трехмерной модели, они все еще обладают такими недостатками, как сложность и дорогостоящее внедрение. В связи с этим возникает необходимость в разработке новых подходов, которые упрощают построение трехмерных моделей лиц и делают распознавание более точным.
Для автоматизированного создания трехмерной модели по фотографии необходимым является определение антропометрических точек лица. Большинство существующих систем автоматизированного построения модели головы по фотографиям используют ручное выделение антропометрических точек лица на изображениях. Методы, предложенные в данной работе, позволяют в значительной степени автоматизировать этот процесс.
I Н>С НАЦИОНАЛЬНАЯ
I библиотека
з! ¿"ж
Объектом исследования являются алгоритмы выделения деталей и особых точек объекта на изображении, методы восстновления формы трехмерных объектов по фотографиям, методы распознавания трехмерных объектов
Предметом исследования являются методы выделения области лица, его деталей, и особых точек, использующие априорные знания структуры челрвеческого лица и цвет кожи как признак его присутствия на изображении, алгоритм восстановления формы поверхности лица, с учетом достоверных точек и контуров, метод представления изображения переменной шириной пульса для распознавания лица человека по двум и большему числу цветных фотоизображений.
Цель работы. Повышение эффективности и надежности алгоритмов анализа фотоизображений человеческого лица, восстановления формы поверхности лица и распознавания
Для достижения поставленной цели требуется решить следующие
задачи.
1. Исследование методов восстановления формы по изображению и методов распознавания объектов
2. Выбор и обоснование методов предобработки изображений, анализа, выделения Деталей лица и достоверных точек, нормализации изображений по яркости, масштабу, ракурсу съемки
3. Разработка и исследование метода восстановления форма поверхности по двум фотоизображениям (фас и профиль).
4. Разработка метода распознавания объектов.
5. Разработка и исследование алгоритмов и программ.
Методы исследования. Теоретические исследования выполнены с использованием теории множеств, теории графов, векторной и матричной алгебры, математической логики, математического моделирования, теории сплайнов,
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается корректностью разработанных математических моделей, их адекватностью по известным критериям оценки в рассматриваемой предметной области, использованием известных положений фундаментальных наук, положительными результатами проведенных экспериментов
На защиту выносятся результаты исследования применения методов предварительного анализа изображения, выделения антропометрических точек и восстановления формы по изображению для построения трехмерной модели лица и распознавания,
результаты системного анализа методов синтеза и распознавания объектов, на основе которых создана и впервые представлена классификация решений задачи распознавания, позволяющая провести анализ их точности на основе практики известных исследований,
- метод выделения области лица и его контуров на фотографии;
- методы извлечения деталей лица (брови, глаза, рот) и антропометрических точек (угловые и верхние точки бровей, уголки рта, мочки ушей, крылья носа, вершина подбородка, уголки глаз) по фотографии,
- адаптивный метод восстановления формы поверхности путем настройки по достоверным точкам по двум фотоизображениям;
- метод построения трехмерной модели по двум фотоизображениям;
- метод распознавания трехмерных объектов по фотографии на основе нового способа представления объектов, названного представлением переменной шириной пульса (ПШП);
- разработка программно-инструментальных средств автоматизированной системы построения трехмерной модели и распознавания по двум фотоизображениям;
- результаты экспериментальных исследований.
Научная новизна.
1. Метод адаптации функционала кривизны с помощью контура профиля для построения полигональной поверхностной модели лица человека по двум фотографиям.
2. Метод распознавания объектов путем сравнения каркасных трехмерных моделей.
3. Мегод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных векторов полигонов.
Практическая полезность и реализация.
1. Полученные в работе методы и алгоритмы анализа фотоизображений лица человека, восстановления поверхностной трехмерной модели и распознавания объекта позволяют повысить качество и надежность процессов построения и распознавания трехмерных моделей лица
2. Созданная программная система можег найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов,
Апробация работы. Основные положения диссертационной работы докладывались на 3-х международных конференциях: на IV Международной научно-технической конференции (Ижевск, 29 - 30 мая, 2003 г.) на 14-той Международной Конференции по Компьютерной Графике и зрению Графикон-2004 (6-10 сентября 2004 г.); Международном Форуме "Высокие Технологии - 2004" (23-26 ноября 2004 г.). Работа многократно обсуждалась на постоянном семинаре "Системный анализ, управление и обработка информации" кафедр "Автоматизированные системы обработки информации и управления" и "Вычислительная техника" Ижевского государственного технического университета.
Публикации. Результаты работы отражены в научных публикациях,
в том числе статей в журналах и сборниках, 3 доклада на научно-технических конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 132 машинописных листах с таблицами и иллюстрациями. Список литературы включает 201 наименование.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность работы, сформулированы цель и решаемые задачи, направления и методы их решения. Кратко изложено содержание работы, сформулированы научная новизна и практическая полезность.
В первой главе приводится краткий обзор существующих методов обнаружения лица и особых точек, описываются алгоритмы предварительного анализа и выделения опорных точек, которые необходимы для построения трехмерной модели и распознавания. Также приводится обзор существующих методов построения трехмерной модели лица и головы, выполнен анализ методов, которые классифицированы по признаку использования одной, двух, трех или большего числа фотографий следующим образом:
Методы, использующие одну фотографию, которые включают методы, основанные на анализе изображений (восстановление формы по затенению, восстановление формы по контуру, восстановление формы по множеству признаков); методы, основанные на анализе видов (структурированный свет, восстановление формы по текстуре, восстановление формы по движению); метаморфические методы, и методы, основанные на анализе физиологии (пружинная модель мускулов, векторные мускулы, слоистая пружинная модель мускулов).
Методы, использующие две фотографии, которые включают бинокулярную стереоскопию (калиброванную, некалиброванную); фотометрическую стереоскопию; и ортогональные фотографии.
Методы, использующие три или большее количество фотографий, которые включают синтез, основанный на анализе освещения (восстановление формы по затенению на основе нескольких изображений, фотометрическая стереоскопия по нескольким фотографиям, синтез новых видов (синтез новых видов без использования трехмерной модели); томографический синтез, тринокулярная стереоскопия, синтез при помощи лазерных дальномеров.
Также приведена классификация существующих методов распознавания трехмерных объектов: методы, основанные на использовании модели (распознавание по одной фотографии - связанное с объектом); распознавание по двум, трем или большему числу фотографий - связанное с наблюдателем; гибридное распознавание; распознавание без использования моде-
лей статистическое (анализ главных компонентов, линейно-дискриминант-ный анализ, теория информации, скрытые модели Маркова); нейронные сети.
Во второй главе описываются алгоритмы предварительного анализа и выделения опорных точек. Сначала производится обнаружение лица и удаление фона, затем на области лица распознаются основные детали лица. Затем, основываясь на результатах предыдущего этапа и данных антропометрической статистики, определяются главные опорные точки для того, чтобы использовать их позже в качестве фиксированных параметров для построения трехмерной модели лица. Некоторые опорные точки используются для определения ракурса и затем для коррекции изображения. В основном, для решения этих задач использованы очевидные и известные методы, которые были модифицированы нами под выбранную стратегию. В частности, предложены шаблоны для поиска на контурах опорных точек (мочки уха, крылья носа, вершина подбородка), динамически деформируемый шаблон для выделения уголков рта, нейросетевой алгоритм для поиска уголков глаз.
Извлечение областей глаз и губ. Так как расстояние между центрами радужных оболочек глаз не меняется при различных выражениях лица, оно может быть использовано для определения других его элементов. В данной работе используется метод шаблонного сравнения.
Алгоритм содержит два шага:
1. Пороговая фильтрация. Локализация радужной оболочки глаза основана на предположении, что это темный диск со светлыми краями окружения. Изображение лица сегментировано с очень низким уровнем порогового значения для изоляции 5% самых темных пикселей, данные пиксели могут прит нужным оболочкам. Пороговое значение рассчитывается как , где - яркость пикселя в точке Далее стро-
// • № • 3
ится филированное двухградационное растровое изображение:
2. Шаблонное сравнение. Модель будет касаться только одного глаза, так как для другого все аналогично. Корреляция между диском Оу и пикселями профильтрованного изображения это число совпадающих
точек, которое вычисляется как где - это левая
или правая половина окна глаза для двух радужных оболочек соответственно, Иц - темная или светлая точка на диске, которая описывается как
D„
1, иначе
для окружности с центром (хо,у о) и радиусом г, заданными как Хо е (W/2, W-(20+г)) для правого глаза; Хо S (20+г, W/2) для левого глаза; у0 £ (20+г, 11/2-г); г е 18,12].
Используя величины Хц, Г о. и корреляционный максимум Стах, получаем гипотетические центры (xh, yh), результирующей матрицей будет L,j = E,j, где i е [xh-25,xh+25] uje ¡yh-35,yh+35]\ для правого глаза все аналогично.
Для определения губ, мы различаем губы и лицо, используя оттенок цвета лица (hue) и информацию о насыщенности цвета, а именно то, что губы имеют особый характеристический красный цвет, который отличается от общего цвета лица.
Поэтому, после извлечения области лица, мы применяем фильтр, который использует оттенок цвета лица и значение насыщенности:
„ 1 /2((й - G)+(/? - в)) с ,
Н = arccos- .„ ..." tiiи/ 1 " . . 5=1-
R+G+B
_\l,II>Tl и H [О, иначе
<Т. и S>T, и S<T.
Чтобы найти область губ и их наиболее вероятное расположение, к потенциальной области губ применяется овальный шаблон. Размер шаблона выбирается пропорционально размеру эллипса лица.
Извлечение области лица. Для извлечения области лица, мы применяем следующий алгоритм:
- обнаружение области лица, посредством использования красного компонента пикселей на цветном изображении;
- использование эллипса в качестве приближающей фигуры формы лица и результатов статистических измерениями, что дает надежные результаты даже, когда имеем фон, сравнимый с цветом кожи.
Для этой цели и в качестве отправной точки мы проводили стати-стичсские измерения 50 фотографий лиц. Исходя из априорного знания о человеческом лице и результатов статистических измерений, можно сделать следующие выводы:
- область лица может быть приближенно описана эллипсом:
- среднее отношение радиусов эллипса составляетЛуК/ ~ 1.287;
- среднее отношение а/а/ ~ 4.1 где а^ расстояние между центром рта и центром эллипса, и aj расстояние между центром линии глаз и центром эллипса;
- среднее OTHOineBjfisrj ~ 1.950, где ctj- расстояние между вершиной подбородка и центром эллипса и аз—R}.
Извлечение области лица происходит в несколько этапов:
Применяем к изображению следующий фильтр: 1, if Ru > Gv and Rb > Bu and R^ > T, and Gu > T2 and
Bv>Tt and maxfa,G^B^-mmiRy^B^Tt and fa-G^T,,
О, иначе
где порога Ti, Tj, 7j T4, И Tj рассчитаны согласно свойствам цвета человеческой кожи, и относительно среднего порогового значения, вычисленного для уравнивания яркости.
Мы используем овальную модель, которая инициализируется около ожидаемого положения лица на изображении, и затем постепенно адаптируется, чтобы произошло совмещение с данными изображения лица. Процесс адаптации предполагает, что пиксели кожи находятся внутри эллипса, и внутри этой области имеется два омбилических отверстия Я/ и Е] в верхней части (глаза) и отверстие типа складки Мв нижней части (рот). Обнаружение Ei, Е}, и М производится на предыдущем этапе определения областей рта и глаз.
Мы вычисляем центр линии у=ах+Ь, которая проходит ч е р Ец и затем мы строим перпендикуляр, который проходит через центр и пересекается с линией, проходящей через точку М.
Применяя отношения, приведенные ранее, находим центр эллипса, что позволяет нам построить и извлечь лицо и удалить фон.
Выравнивание яркости. Поскольку условия освещения съемки объекта могут быть различными, может понадобиться осветлить либо затемнить фотографию. Мы определили фиксированное среднее значение яркости Вт, затем рассчитали среднее значение яркости /„для исследуемого изображения, после этого вычислили
Затем осуществляется осветление/затемнение изображения путем прибавления/вычитания Д из значений цвета пикселей изображения.
Масштабирование. Так как расстояние, с которого производится съемка, тоже может быть разным, мы приводим изображение к заданному масштабу следующим образом:
Для каждой точки Р(х,у) мы приводим ее к Р(х',у') используя множитель по оси х, и по оси у, таким образом
Определяем матрицу
где в^ю'Мн 4^=И'/Ъ, уч'иИ''- заданные заранее высота и ширина соответственно; w и к- высота и ширина исследуемого объекта, в результате определения области лица.
После извлечения глаз и областей губ, мы заполним соответствующие им отверстия, чтобы сконцентрировать поиск в другой области лица.
Извлечение области бровей. Брови находятся, используя информацию о яркости и контрастности, производится попытка найти удлиненные области, выше которых расположены ясные, более светлые участки лба, а ниже - области глаз.
Распознавание опорных точек на фронтальном и профильном видах (рис. I) осуществляется после выделения контуров.
Для определения концов и вершин бровей мы используем Байесову вероятность. Двумерное распределение Я/, когда другие точки заданы, является двумерным распределением Гаусса, обозначенным как
Р(Е,\Е2,Т).
Точке Я/ присваивается значение
где с{Чи - результат локального поиска соответствия шаблону в Е]. Цель состоит в том, чтобы найти (£/, Е], Т) который дает максимальное значение 5 = (БЕ^ЗЕз+ЗТ).
Чтобы найти ограниченное число характеристических точек, принадлежащих рту, мы используем градиент Горизонтально ориентируемый градиент в области рта суммируется по вертикальным линиям. Положение уголков рта находятся как максимально отрицательный и положительный уклон соответственно (рис. 2).
Рис. 1. Фронтальный и боковой шаблон липа с опорными точками
Рис. 2: а) определение положения точек уголков рта; б) деформируемый шаблон рта; в) пример обнаружения линии впадины
Точки уголков рта находятся на одной линии. Местоположение этой линии впадины определяется поиском локальных минимумов в каждой вертикальной полосе, в пределах выбранной горизонтальной щели в центре контрольного окна. Профиль интенсивности вдоль линии впадины рассчитывается путем суммирования вертикально граничащих пикселей. Профиль обычно имеет форму бассейна, и углы рта обнаруживаются путем нахождения левого и правого края бассейна.
Извлечение опорных точек мочек ушей и крыльев носа. Исходя из наших наблюдений, мы выяснили, что существует подобие между мочками ушей и крыльями носа, то есть обе точки имеют форму перехода. Поэтому их извлечение будет основано на контурах лица и деталях лица. Они будут локализованы путем поиска соответствующего вида точек разветвления контура, также учитывается геометрическое местоположение этих деталей.
Вершина подбородка. Вершина подбородка - пересечение между частью контура подбородка контура лица и вертикальной линии, проходящей через центр рта. Самая низкая точка подбородка получается из соответствия профильной проекции изображения и фронтального изображения.
Локализация уголков глаз. Чтобы найти местоположение уголков глаз, мы будем использовать определение кривизны и обучение многослойного перцептрона для классификации. Чтобы определить уголки глаз, мы выявляем радужные оболочки глаз в два шага: пороговая фильтрация; шаблонное сравнение. Затем выравниваем фотоизображение горизонтально, так как выравнивание приводит все фотографии к одному виду, и таким образом, уменьшает время вычислений и цикл обучения После этого рассчитываем нормали в области глаз, для чего используется система итерационных уравнений. Экспериментально доказано, что для наших целей достаточно 4 итераций, ке[0,3]. После завершения циклов итерации производится выравнивание нормалей. Найдем среднюю нормаль как navg-nlnJ|2 , установим величину ~ (0,0,1/, тогда любая нормаль на
изображении будет;
"аур
Далее определяем кривизну поверхности вокруг глаз: среднюю кривизну поверхности Н и Гауссову кривизну Кпо следующим формулам:
Н = г(1 Л с?) ~2рцз + 1(1 + р>)/2(1 +
Чтобы найти производные предлагается использовать
дискретную аппроксимацию для поверхности, применив метод конечных разностей.
Трехмерная сетка (карта глубин) строится путем вычисления координаты I в каждой точке:
Теперь/чтобы определить уголки глаз, используем систему классификатора, входными данными для которой являются значения Гауссовой кривизны локальных областей вокруг глаз, а выходными данными - вектор-столбец весовых коэффициентов вероятности принадлежности исходного изображения к некоторому классу размерности Class Amount N от общего числа классов, распознаваемых системой: Class
Amount].
Классификатор реализован на базе многослойного персептрона Число нейронов входного слоя равно кц = 35, в скрытом слое кj -70 нейронов, в выходном слое число нейронов совпадает с числом классов, которые нужно распознать к} = Class Amount. Обучение производится по методу обратного распространения ошибки. За редуцирующую (логистическую)
функцию взята функция сигмоида:
С применением обратного распространения, процедура строится
так:
а) послать на входы сети одно из возможных изображений;
б) рассчитать
gihOgG)
для выходного слоя, согласно формуле:
^ ft, если нейрон на выходе совпадает с заданным классом, (О, если нейрон не совпадает с заданным классом
в) рассчитать и для всех остальных слоев по формуле:
г) скорректировать все веса в НС;
д) если ошибка сети существенна, перейти к шагу а, в противном случае, конец,
Выход модуля экспертной системы - принадлежность к числу классов. Answer е [1, Class Amount].
Вычисление и коррекция ракурса с использованием опорных точек. Голова может быть представлена эллиптическими сечениями, как показано на рис. 4: область лица - эллиптическим сечением Е/, область профиля - эллиптическим сечением Ер> проходящим через центр рта и ортогональным к эллиптическими сечениями, параллельными и параллельными плоскости XOZ и проходящими через брови и рот соответственно.
Рис. 3. Рассчитанная трехмерная сетка для левого глаза с отмеченными уголками
Рис. 4. Эллипсы определяют позу Рис, 5. Эллиптический диск
для определения ракурса Рассмотрим сечение Еь, в центре этого сечения установим трехмерную систему координат, как показано на рис. 5 следующим образом:
В общем случае эллиптическую дугу можно построить но 7 точкам. Если четыре точки не лежат на одной окружности и две из них (A,D) лежат на большой оси, т.е. определяют большой радиус эллипса, то можно вычислить его парамегры по этим четырем точкам. В начальном положении, т.е., когда голова на изображении расположена строго прямо, и нет наклона ни в одном направлении, параметры диска будут иметь следующие значения:
Лу^-В^Су^В^Соти Д,= -Вх~а; #,= -Сх; В,=С2; Л^О^О.
Отношение между этими фиксированными точками и точками, полученными в результате вращения в пространстве:
Тогда для определения угла поворота, достаточно проследить движение одной или двух вершин бровей.
С'
О, =агс8ш—~
С' С'
6' = агсят—, в, = агсвт—.
' с; " с:
В третьей главе основное внимание уделяется синтезу и текстури-рованию трехмерных моделей.
Построение поверхностной модели лица человека осуществляется на фронтальном изображении области лица, где уже вырезаны области бровей, глаз, ноздрей, губ. Задача решается в 3 этапа:
1. Адаптация (настройка) функционала кривизны, вычисляемой по Ламберту, к конкретному фотоизображению путем анализа осевого (вертикального) сечения и "подгонки" его коэффициентов на основе геометрии контура профиля, выделенного на профильном виде.
2. Построчное сканирование изображения лица на фронтальном виде с помощью адаптированного функционала кривизны с учетом априорных знаний о строении поверхности лица.
3. Сглаживание полученной поверхностной модели.
Анализ контура профиля.
Нахождение опорной точки "кончик носа", (мы присваиваем ей индекс 4). Ее координата х известна, т.е. $Р41 — Р1х, Определим координату у, как максимум яркости пикселей средней части профиля (рис. 6), т.е. = тах(1та£еРгоп1р1Х11),
где I =
Рис. 6. Пояснение метода поиска точки "кончик носа"
Определение знака приращения координаты z (рис. 7) в заданной точке профиля, по матрице PL. Определим функцию sign(y), возвращающую знак изменения координаты z.
-1, если Ply,2 - Ply+ANGLESTEP,2 < О +1, иначе
где plx - переменная, значение которой определено в модуле "выделения контуров"; у - координата у е [1, Height • ANGLESTEP],
Sign(y) =
030 40 во 80100 1» 140 К» 180
Рис 7. Пояснение метола определения знака приращения
Вычисление приращения/убывания координаты z, для точек, лежащих на оси У исходя из значений яркости Д ля начала найдем линию профиля взяв за основу формулу
где R - значение яркости пиксела, график получившейся функции (¡((Я). Из формулы (10), можно получить, что тангенс угла наклона вектора нормали можно вычислить как.
Р = -
/
Следовательно, угол наклона будет.
fVTrl
aarctg p^atdg
l
С другой стороны мы знаем, что вектор нормали и = (р, 0, -1), а его длина |п|= yjp'+\ ,
где а— это угол наклона вектора нормали к оси абсцисс Можно получить, что
3111(90° - а) = J
п п
Следовательно,
а = — агссо:
= arceos
¡P^i
Тогда изменение высоты на каждом шаге определения а, будет.
1
AZ = tga = -arceos—.
и
J5
Достоверный контур профиля
Контур найденный по Ламберту
Точке максимума яркости
Контур, найденный адаптивным методом
Значения яркостей пикселей
Рис. 8. Пояснение метода адаптации функционала Ламберта
Далее строится поверхностная модель лица путем построчного сканирования изображения лица на фронтальном виде с помощью адаптированного функционала кривизны с учетом априорных знаний о строении поверхности лица и сглаживания полученной поверхностной модели.
Всгавка деталей лица. Типовые геометрические модели (ГМ) деталей: "брови", "глаза", "губы" выбираются автоматически из базы геометрических моделей (БГМ), параметризуются (деформируются) по размерам, полученным в ходе их распознавания (глава 2), и присоединяются с помощью булевых операций к модели лица, ранее наложенной на типовую модель головы.
Текстурирование модели головы. Текстурирование позволяет раскрасить трехмерную модель, сделать ее более реалистичной. Для модели головы основной проблемой текстурирования является построение текстурной карты, т.к. модель является трехмерной, а создать изображение, охватывающее голову человека со всех сторон не так просто. Для этого применяется набор фотографий объекта моделирования в разных проекциях в сочетании с методикой построения общей текстурной карты модели.
Текстурная карта представляет собой растровое изображение и набор текстурных координат, определяющих соответствие элементов модели и частей изображения. Сущность метода построения текстурной карты по набору изображений объекта состоит в ее компоновке из трансформированных частей указанных изображений, подбираемых из условия достижения наилучшего качества текстуры. Наилучшее качество текстуры чаще всего достигается путем подбора наиболее информативных частей исходных изображений для определенной Части модели.
Построение текстурной карты для полигональной модели по набору изображений объекта моделирования в проекциях производится в следующей последовательности:
1. Производится укладка полигонов модели в сетку на плоскости. Вершины полученной плоской сетки являются набором текстурных коор-
динат.
2. Последовательно перебираются треугольники полигональной модели,
3. Определяется угол поворота полигона к плоскостям проекций, для которых имеются изображения объекта. Выбирается проекция, угол поворота к которой минимален.
4. Треугольник проецируется на найденную плоскость.
5. Часть изображения, попадающая в область треугольника, вписывается в соответствующий ей участок сетки на плоскости.
6. На получившейся текстурной карте производится выравнивание яркости на стыках элементов разных изображений.
Проще и удобнее всего использовать для текстурирования до шести изображений, соответствующих плоскостям основных проекций, но в общем случае возможно использование любого количества изображений в разных проекциях. Для человеческой головы (предполагается, что она обладает симмегрией) обычно бывает достаточно изображений в двух проекциях - фас и профиль. Второй профиль в данном случае получается как горизонтальное отражение первого. Виды сзади, сверху и снизу обычно не имеют существенных деталей, требующих текстурирования высокого качества.
В четвертой главе предлагаются методы распознавания (идентификации) трехмерных моделей лица человека, приводится описание программной системы для анализа фотоизображений,
Выделение каркаса полигональной модели головы производится с целью сокращения обьема информации, которую требуется хранить в баче геометрических моделей (БГМ) и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации.
Алгоритм выделения каркаса.
1, Построение сечений полигональной модели с заданным шагом вдоль вертикальной (У) оси головы
2. Разбиение очередного сечения на участки постоянной (с заданной
3. Построение профильных кривых, соединяющих одноименные точки в разных сечениях.
На рис. 10 показан результат восстановления полигональной модели по каркасной. В данном примере было использовано 5 сечений, 2 ортогональных (плоских) и 10 дополнительных (5 левых и 5 правых) профильных пространствен-
точностью) кривизны (рис. 9).
Рис. 9. Разбиение сечения на участки постоянной кривизны
ных кривых (кинематический метод Кучуганова-Харина построения аморфного твердотелъного объекта)
Сравнение каркасных моделей и оценка сходства осуществляется с помощью корелляционного анализа путем сопоставления одноименных сечений и профильных кривых анализируетмого объекта и объектов из базы данных При этом пространственные кривые проецируются на плоскости ХОУ и Х02 Сокращение перебора объектов из базы данных достигается за счет отбрасывания неудовлетворительных моделей на основе соотношений между антропометрическими точками, которые выделены на этапе предварительного анализа (глава 2)
Рис 10. Восстановление полигональной модели по каркасной
Представление переменной шириной пульса и распознавание.
В базе данных для каждого изображения сохраняется структура данных трехмерной модели, которая состоит из координат узлов и значений векторов нормалей После получения нового изображения для идентификации, строится его трехмерная модель и карта векторов Как показано выше, модель строигся после корректировки ракурса изображения Полученная модель сравнивается с имеющимися в базе данных. Сравнение проводится по методу, который мы назвали циклический метод сопоставления объекта (ЦСО), по данному методу рассчитывается когда,Л(9 £ 3, это означает, что совпадение найдено Объект представляется следующим образом значения векторов полигонов трехмерной модели, преобразуются в величины ширины пульса, как показано на рис. 11. Данную форму пред-ставнения мы назвали Представление Переменной Шириной Пульса объекта
Данная форма представления может использоваться для аппаратной реализации, реализации методов сжатия, в анимации
Оценка эффективности метода ПШП. Для эффективного использования метода ПШП рассмотрим следующие положения
_пгии I_
_Л_ПЛ_1-
Рис 11 Представление переменной шириной пульса для двух полос изображения лица
Градиент кривизны поверхности предполагает процесс дифференциации, и если мы можем измерить градиент, мы можем использовать его для того, чтобы вывести локальную форму и ориентацию поверхности. Будет использован градиент угла ориентации а двух соседних полигонов трехмерной модели (рис. 12). Градиент угла а в основном направлении пропорционален основной кривизне в этомнаправлении: а „„„ - ктш, а ~ кт/„. Так как выборка вдоль поверхности равномерна, значения кривизны прямо пропорциональны векторам ориентации Проведем анализ поверхности целого объекта, основанный на элементах участка, где каждый участок содержит четыре узла, как на рис. 12.
Рис. 12. Участок поверхности объекта
Рассчитаем Aa.1~a.r-a2, Аа2=Ягаз, Аа$=ау0.4 , и Аа^ау-а^. Участок плоский, если Аа^Аа^-Аа^^Аа^-О, участок шарообразный, если Аа^Ао.2 -Аа^Аа^О', участок цилиндрический в одном основном направлении, если Аа/=Аа^0 и Ааз-Аа^-О; участок цилиндрический во втором основном направлении, если Аа^Аа^О И Ащ-Аа^О. В тех областях, где не происходит значительных изменений угла ориентации, для уменьшения требуемого пространства в базе данных сохраняются только граничные узлы и их координаты.
Из вышеизложенного следует, что для того, чтобы получить реали-стачное и корректное представление поверхности лица, для каждого узла необходимо сохранить разность углов наклона относительно главных направлений:
«шок -а-1-0-2, атт = а/-«з-
Оценка эффективности данного метода проводилась по следующим критериям:
1. Хранение в памяти. Поскольку мы собираемся сохранять вектора определенных узлов трехмерной модели лица в графической базе данных, размер данных будет уменьшен как минимум наЗЗ % (от 43 до 29 килобайт для каждой модели), в зависимости от области применения.
2. Коммуникации и реализация аппаратных средств. Представление методом 1111111 позволяет просто и эффективно реализовывать распознавание в конфигурации аппаратных средств (например в чипах FPGA), свободно посылать данные через среды коммуникации, легко и эффективно и синхронизировать данные между передающим устройством и устройством для приема данных без необходимости посылать информацию о такте. Ус-
тойчивость метода к импульсным помехам и флуктуационным помехам показана в работе.
3. Распознавание. Принимая во внимание 2 вида пола, 3 возрастные группы, 3 расовые группы было взято N=252. Когда имеют место мгновенные изменения (анимация) или долговременные (взросление и старение), вводится коэффициент (, причем в пропорционально Л Результаты эксперимента приведены в табл. 1 и 2.
Таблица 1
Влияние изменений яркости
сходство -99.8% сходство = 99.4% сходство = 94.1% сходство = 89.45% сходство = 88.28%
В, •
В=Вщ+5 *
В=Вп+10 »
В=В,г5 *
В-ВгЮ *
Таблица 2
Влияние изменений ракурса
сходство - 99.8% сходство = 98.8М сходство = 92.22% сходство= 70% сходство = бит
Ракурс *
р--В+5"; Г=С+5° *
а=А+10°; Р=В+10"; Г=С+10° *
а=А-У; Р-В-5"; у-С-5° о
а=А-10°; р=В-Ю"; Г^С-10" *
На основании этих результатов можно сделать вывод о том, что хотя данный метод является чувствительным к освещению и изменениям ракурса, он экономичен при хранении данных, реализации аппаратных средств и подходит для синхронизации в передачи данных.
ЗАКЛЮЧЕНИЕ
В работе получены следующие основные выводы и результаты: 1. Приведен системный анализ существующих методов синтеза и распознавания трехмерных объектов по фотографиям, создана их класси-
фикация, позволяющая провести систематизацию теоретических основ и математических решений, используемых в данных методах, в результате чего обоснована необходимость дальнейшего совершенствования методологии анализа, обработки и распознавания изображений трехмерных объектов, ориентированной на упрощение аппаратно-программных средств обработки видеоинформации в технических (производство) и социальных (криминалистика) системах.
2. Предложены шаблоны для поиска на контурах опорных точек (мочки уха, крылья носа, вершина подбородка), динамически деформируемый шаблон для выделения уголков рта; нейросетевой алгоритм для поиска уголков глаз.
3. Разработан метод адаптации функционала кривизны с помощью контура профиля для построения полигональной поверхностной модели лица человека по двум фотографиям.
4. Разработан метод распознавания объектов путем сравнения каркасных трехмерных моделей.
5. Разработан метод распознавания объектов по фотографиям на основе представления объектов переменной шириной пульса (ПИШ).
6. Разработана архитектура программной системы и информационная технология дли анализа фотоизображений лица человека, построения и распознавания трехмерных моделей, которая может быть использована для исследования и дальнейшего развития методов обработки видеоинформации в технических и социальных системах.
7. Проведены экспериментальные исследования алгоритмов и программ. Полученные в работе методы и алгоритмы анализа фотоизображений лица человека, восстановления поверхностной трехмерной модели и распознавания объекта позволяют повысить качество и надежность процессов построения и распознавания трехмерных моделей лица.
8. Создана программная система, которая может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ ИЗЛОЖЕНЫ В СЛЕДУЮЩИХ ПУБЛИКАЦИЯХ
1. Al-Akkad MA., AboulNour H. Design and Implementation of a developed bit-synchronizer for synchronous data communication and its computer simulation for testing and development puiposes//Engineeiing Sciences Journal. - Damascus University, 1996. - В 12 ч. - Ч.2. Thesis Abstract с 178.
2. Al-Akkad MA., Kuchuhanov V.N. A framework for building a general 3D пюсЫ//Информационные технологии в инновационных проектах: Труды Международной научно-технической конференции (Ижевск, 29-30
мая, 2003 г.) - В 4 ч. -Ч.4. - Ижевск: Изд-во ИжГТУ, 2003. - с. 105-108.
3. Al-Akkad M.A. Face recognition based on curvature estimation and neural networks/Яруды 14-той Международной конференции по Компьютерной графике и Зрению Графикон-2004 (Москва, 6-10 сентября 2004 г.). -М.: Изд-во ООО "МАКС Пресс", 2004. - С. 139-142.
4. Al-Akkad M.A., Kuchuhanov V.N. 3D Model construction from two orthogonal рhotos//Межaународный форум "Высокие технологии - 2004": Сборник трудов научно-технического форума с международным участием: В 4 ч. - Ч.1. - Ижевск: Изд-во ИжГТУ, 2004. - С. 3-12.
5. Аль Акад М.Айман, Кучуганов В.Н. SHAM: Система адаптивного моделирования синтезированной головы для усовершенствованного построения трехмерной модели и распознавания человеческого ли-иа//Интеллектуальные системы в производстве, №2. - Ижевск: Изд-во ИжГТУ, 2004.-С. 3-25.
6. Al-Akkad M A., AboulNour H. Using curvature and neural networks for recognizing faces/Д печати в журнале Дамасского Университета.
Подписано в печать.Л.в04. Усл. печ. л4^0, I ираж 100 экз Заказ № Отпечатано в типографии Издательства ИжГТУ
Р-- и»
Оглавление автор диссертации — кандидата технических наук Аль Аккад М. Айман
ВВЕДЕНИЕ.
1. СИНТЕЗ И РАСПОЗНАВАНИЕ ТРЕХМЕРНЫХ
ГЕОМЕТРИЧЕСКИХ МОДЕЛЕЙ.
1.1. Методы анализа фотоизображений лица человека для обнаружения достоверных точек.
1.2. Методы восстановления объема по одной и нескольким фотографиям.
14 1.3. Методы распознавания трехмерных объектов.
1.4. Выводы и постановка задачи исследования.
2. АЛГОРИТМЫ ПРЕДВАРИТЕЛЬНОГО АНАЛИЗА
И ВЫДЕЛЕНИЯ ДОСТОВЕРНЫХ ТОЧЕК.
2.1. Извлечение областей глаз и губ.
2.2. Извлечение областей лица и бровей.
2.3. Распознавание опорных точек.
2.3.1. Выравнивание яркости.
2.3.2. Масштабирование.
2.3.3. Выделение контуров на полутоновых изображениях.
2.3.4. Распознавание опорных точек.
2.4. Нейросетевой алгоритм локализации уголков глаз.
2.5. Вычисление и коррекция ракурса с использованием опорных точек.
2.6. Выводы по главе.
3. СИНТЕЗ ТРЕХМЕРНЫХ МОДЕЛЕЙ С ИСПОЛЬЗОВАНИЕМ ЗНАНИЙ.
3.1. Адаптация функционала кривизны поверхности.
3.2. Синтез полигональной модели лица. ф 3.3. Вставка деталей лица и текстурирование трехмерной модели.
3.4. Выводы по главе.
4. ИДЕНТИФИКАЦИЯ МОДЕЛЕЙ ЛИЦА.
4.1. Выделение каркаса полигональной модели.
4.2. Сравнение каркасных моделей и оценка сходства.
4.3. Представление и распознавание моделей переменной шириной пульса.
4.4. Архитектура программной системы.
4.5. Выводы по главе.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Аль Аккад М. Айман
На протяжении долгого времени человеческое лицо является объектом пристального изучения многих отраслей науки, ведь оно несет в себе важную уникальную информацию о поле, возрасте и эмоциях человека. Именно уникальность лица каждого человека предопределяет возможность его использования и в области распознавания и удостоверения.
Распознавание образов уже признано важной отраслью машинного зрения в рамках теории вычислительных машин и систем. В сфере распознавания образов распознавание лиц выделилось в независимую область для научных исследований. Оказалось, что системы распознавания лиц представляют собой особый интерес для целого ряда применений в таких областях, как системы безопасности или индексация больших мультимедийных баз данных. Все больше и больше разработок в области безопасности сконцентрировано на биометрическом решении для того, чтобы избавиться от PIN кодов и карт, которые могут быть украдены или потеряны. Еще одним преимуществом использования биометрических черт лица является низкая стоимость оборудования, в частности, камеры. Изображения типа фотографий для досье (фас и профиль) приняты и широко используются в качестве официального метода удостоверения многими правительствами и институтами.
Распознавание образов и интерпретация, основанная на знаниях - одна из важнейших задач искусственного интеллекта (Осипов Г.С.). Как следует из анализа области искусственного интеллекта и машинного зрения, важной частью решения задачи распознавания образа является задача его представления. Вследствие быстрого развития технологии создания аппаратного и программного обеспечения, в компьютерной графике и распознавании образов были сделаны попытки реализовать автоматическое моделирование трехмерного человеческого лица по видео или фотоснимкам, содержащим изображение лица.
Несмотря на разнообразие методов построения и распознавания трехмерной модели, они все еще обладают такими недостатками, как сложность и дорогостоящее внедрение. В связи с этим возникает необходимость в разработке новых подходов, которые упрощают построение трехмерных моделей лиц и делают распознавание более точным.
Для автоматизированного создания трехмерной модели по фотографии необходимым является определение антропометрических точек лица. Большинство существующих систем автоматизированного построения модели головы по фотографиям используют ручное выделение антропометрических точек лица на изображениях.
Объектом исследования являются методы и средства визуализации, трансформации, анализа и обработки видеоинформации для интеллектуальной поддержки процессов принятия управленческих решений в сложных производственных и социальных системах.
Предметом исследования являются методы выделения области лица, его деталей, и особых точек, использующие априорные знания структуры человеческого лица и цвет кожи как признак его присутствия на изображении, алгоритм восстановления формы поверхности лица, с учетом достоверных точек и контуров, метод представления изображения переменной шириной пульса для распознавания лица человека по двум и большему числу цветных фотоизображений.
Цель работы. Снижение требовательности к условиям съемки и повышение эффективности алгоритмов анализа фотоизображений лица человека при сохранении достаточного уровня качества восстановления трехмерных моделей головы и надежности распознавания.
Для достижения поставленной цели необходимо найти простые алгоритмы и модели, такие, чтобы по фотографиям, полученным в обычных условиях бытовой съемки, сохранить приемлемую степень реалистичности трехмерных моделей, достаточную для визуального определения сходства модели с объектом, при сохранении надежности автоматического распознавания. Таким образом, можно выделить следующие задачи исследования:
1. Исследование методов восстановления формы по изображению и методов распознавания объектов.
2. Выбор и обоснование методов предобработки изображений, анализа, выделения деталей лица и достоверных точек, нормализации изображений по яркости, масштабу, ракурсу съемки.
3. Разработка и исследование метода восстановления форма поверхности по двум фотоизображениям (фас и профиль).
4. Разработка метода распознавания объектов.
5. Разработка и исследование алгоритмов и программ.
Методы исследования. Теоретические исследования выполнены с использованием методологии системного анализа, теории множеств, теории графов, векторной и матричной алгебры, математической логики, математического моделирования, теории сплайнов.
Достоверность и обоснованность полученных в работе результатов и выводов подтверждается корректностью разработанных математических моделей, их адекватностью по известным критериям оценки в рассматриваемой предметной области, использованием известных положений фундаментальных наук, положительными результатами проведенных экспериментов.
На защиту выносятся результаты исследования применения методов предварительного анализа изображения, выделения антропометрических точек и восстановления формы по изображению для построения трехмерной модели лица и распознавания:
- результаты системного анализа методов синтеза и распознавания объобъектов;
- методика предварительного анализа и обработки фотоизображений головы человека для подготовки к решению задач восстановления трехмерной модели и распознавания (идентификации) личности по фронтальному и профильному видам, основанная на известных методах обработки растровых изображений и методах, специально созданных под выбранную стратегию;
- метод выделения уголков глаз на базе нейронных сетей и многослойного персептрона;
- метод адаптации функционала, вычисляющего кривизну поверхности в заданной точке по модели отражения Ламберта, который учитывает кривизну контура профиля, выделенного на профильном виде;
- метод синтеза полигональной модели головы путем построчного сканирования фронтального вида адаптированным функционалом кривизны с учетом типовых сечений головы, модифицируемых с помощью достоверных точек лица, найденных на фронтальном и профильном видах;
- метод выделения каркаса полигональной модели головы с целью сокращения объема информации, которую требуется хранить в базе геометрических моделей и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации;
- метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними;
- метод вычисления оценки сходства образов, который автоматически придает больший вес совпадению тех элементов моделей, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными;
- метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов;
- разработка автоматизированной системы построения трехмерной модели и распознавания по двум фотоизображениям;
- результаты экспериментальных исследований и анализа эффективности.
Научная новизна.
1. Метод адаптации функционала, вычисляющего кривизну поверхноста в заданной точке по модели отражения Ламберта, который учитывает кривизну контура профиля, выделенного на профильном виде.
2. Метод синтеза полигональной модели головы путем построчного сканирования фронтального вида адаптированным функционалом кривизны с учетом типовых сечений головы, модифицируемых с помощью достоверных точек лица, найденных на фронтальном и профильном видах.
3. Метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними.
4. Метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов.
Практическая полезность и реализация.
1. Полученные в работе методы и алгоритмы анализа фотоизображений лица человека, восстановления поверхностной трехмерной модели и распознавания объекта позволяют повысить качество и надежность процессов построения и распознавания трехмерных моделей лица.
2. Предложенные методы и средства визуализации, трансформации, анализа и обработки видеоинформации могут найти применение в качестве средств интеллектуальной поддержки принятия решений в сложных производственных и социальных системах.
3. Созданная программная система может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов.
Реализация результатов работы. Результаты диссертационной работы внедрены в учебный процесс на кафедре "Автоматизированные системы обработки информации и управления" Ижевского государственного технического университета.
Разработанная программная система SHAM для построения и распознавания моделей головы внедрена в Институте права, социального управления и безопасности Удмуртского государственного университета, в фирмах по разработке и сопровождению информационные технологий "Модуль ИТ" (г.Ижевск), PUZANT YACOUBIAN & SONS (г.Дамаск, Сирия).
Апробация работы. Основные положения диссертационной работы докладывались на 3-х международных конференциях: на IV Международной научно-технической конференции (Ижевск, 29 - 30 мая, 2003 г.) на 14-той Международной Конференции по Компьютерной Графике и зрению Графи-кон-2004 (6-10 сентября 2004 г.); Международном Форуме "Высокие Технологии - 2004" (23-26 ноября 2004 г.). Работа многократно обсуждалась на постоянном семинаре "Системный анализ, управление и обработка информации" кафедр "Автоматизированные системы обработки информации и управления" и "Вычислительная техника" Ижевского государственного технического университета.
Публикации. Результаты работы отражены в научных публикациях, в том числе статей в журналах и сборниках, 3 доклада на научно-технических конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 127 машинописных листах с таблицами и иллюстрациями. Список литературы включает 132 наименования.
Заключение диссертация на тему "Разработка и исследование методов анализа и построения трехмерной модели лица по фотографиям"
4.5. Выводы по главе
В данной главе рассмотрены два способа распознавания трехмерных моделей головы человека. Описана программная система построения двухмерных и трехмерных моделей.
1. Описан метод выделения каркаса полигональной модели головы с целью сокращения объема информации, которую требуется хранить в базе геометрических моделей (БГМ) и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации.
2. Предложен метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними. Сокращение перебора объектов из базы данных достигается за счет отбрасывания неудовлетворительных моделей на основе соотношений между антропометрическими точками, которые выделены на этапе предварительного анализа (глава 2).
3. Предложен метод вычисления оценки сходства образов, который автоматически придает больший вес совпадению тех элементов моделей, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными.
4. Предложен метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов.
5. Выполнен анализ эффективности метода представления объектов переменной шириной интервалов постоянных приращений углов полигонов (метод ПШП).
5.1. Хранение в памяти. Поскольку мы собираемся сохранять вектора определенных узлов трехмерной модели лица в графической базе данных, размер данных будет уменьшен как минимум наЗЗ% (от 43 до 29 килобайт для каждой модели), в зависимости от области применения.
5.2. Коммуникации и реализация аппаратных средств. Представление методом ПТИГТ позволяет просто и эффективно реализовывать распознавание в конфигурации аппаратных средств (например в чипах FPGA), свободно посылать данные через среды коммуникации, легко и эффективно и синхронизировать данные между передающим устройством и устройством для приема данных без необходимости посылать информацию о такте. Устойчивость метода к импульсным помехам и флуктуационным помехам показана в работе.
5.3. Распознавание. Результаты эксперимента на 252 изображениях дали надежность распознавания от 99,8% до 88,28% при изменении освещенности от нормальной до ±10% и от 99,8% до 61,11% при изменении ракурса от фронтального до ±10° по всем осям координат.
6. Описана архитектура программной системы построения и анализа модели лица, разработанной на основе предложенных в данной работе методов и алгоритмов, которая может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов.
На данном этапе созданная программная система не является законченным "коммерческим" продуктом. Она представляет собой комплекс для исследования методов и режимов обработки растровых и векторных фотоизображений и трехмерных моделей головы, в котором можно работать как в интерактивном, так и в автоматическом режимах.
ЗАКЛЮЧЕНИЕ
В работе получены следующие основные выводы и результаты:
1. Методы выделения достоверных (опорных, антропометрических) точек основаны на эвристических алгоритмах и, благодаря их узкой специализации, вполне успешно справляются со своими задачами. Выбор тех или иных эвристик зависит от цели и стратегии решения общей задачи, поставленной перед разработчиками.
2. Не смотря на разнообразие методов построения трехмерной модели, они все еще обладают такими недостатками, как сложность и дорогостоящее внедрение. В связи с этим возникает необходимость в разработке новых подходов, которые упрощают построение трехмерных моделей лиц и делают распознавание более точным.
3. Методы распознавания трехмерных объектов: статистические; на основе линейно-дискриминантного анализа; на основе скрытых моделей Маркова; нейросетевые и др. можно разбить на два основных класса: по антропометрическим точкам и признакам, описывающим характерные особенности деталей лица; по поверхностной (трехмерной) модели. Первые, как правило, жестко привязаны к системе выделяемых признаков, другие - предъявляют высокие требования к аппаратуре и условиям съемки.
4 Предложены шаблоны для поиска на контурах опорных точек типа: мочки уха, крылья носа, вершина подбородка.
5 Предложен метод выделения уголков рта с помощью динамически деформируемого шаблона.
6 Предложен метод выделения уголков глаз на базе нейронных сетей и многослойного персептрона.
7. Опорные точки, выделенные на фронтальном и профильном видах позволяют определить пространственное положение объекта и его деталей, а также вычислить соотношения между антропометрическими точками. Эти соотношения необходимы для этапа предварительного распознавания личности.
8. Предложен метод адаптации функционала, вычисляющего кривизну поверхности в заданной точке по модели отражения Ламберта, который учитывает кривизну контура профиля, выделенного на профильном виде.
9. Разработан метод синтеза полигональной модели головы путем посточного сканирования фронтального вида адаптированным функционалом кривизны с учетом типовых сечений головы, модифицируемых с помощью достоверных точек лица, найденных на фронтальном и профильном видах.
10. Описан способ присоединения к модели типовых деталей головы, параметризуемых по соотношениям между достоверными точками, основанный на булевских операциях над полигональными моделями.
11. Описан способ текстурирования модели головы исходными ортогональными фотоизображениями с целью повышения реалистичности модели.
12. Описан метод выделения каркаса полигональной модели головы с целью сокращения объема информации, которую требуется хранить в базе геометрических моделей и по которой можно с минимальными потерями качества восстановить полигональную модель, а также с целью повышения быстродействия алгоритма сравнения трехмерных моделей для их идентификации.
13. Предложен метод распознавания объектов, заключающийся в сравнении каркасных моделей путем поиска общей гомоморфной части графов анализируемой и эталонной моделей, позволяющий повысить надежность распознавания благодаря учету параметров вершин и ассоциативных связей между ними. Сокращение перебора объектов из базы данных достигается за счет отбрасывания неудовлетворительных моделей на основе соотношений между антропометрическими точками, которые выделены на этапе предварительного анализа.
14. Предложен метод вычисления оценки сходства образов, который автоматически придает больший вес совпадению тех элементов моделей, которые в соответствии с заданной гребенкой признаков идентификации считаются более существенными.
15. Предложен метод распознавания объектов по фотографиям на основе представления объектов переменной шириной интервалов постоянных приращений углов полигонов.
16. Выполнен анализ эффективности метода представления объектов переменной шириной интервалов постоянных приращений углов полигонов.
17. Описана архитектура программной системы построения и анализа модели лица, разработанной на основе предложенных в данной работе методов и алгоритмов, которая может найти применение в криминалистике (построение трехмерного фоторобота, идентификация по фотоснимку в произвольном ракурсе), компьютерной анимации персонажей, а также в производстве - для изготовления скульптурных портретов и барельефов.
18. Предложенные методы и средства визуализации, трансформации, анализа и обработки видеоинформации могут эффективно применяться в качестве средств интеллектуальной поддержки принятия решений в сложных производственных и социальных системах, а также для научных исследований и оптимизации методов обработки видеоинформации.
Библиография Аль Аккад М. Айман, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Бутаков Е.А. Обработка изображений на компьютере. М.: Радио и связь, 1987.
2. Кучуганов В.Н., Лопаткин А.Е. Язык описания трехмерных сцен. Версия 2 // Программирование, 1996. -№2. — С. 70-75.
3. Кучуганов В.Н., Харин В.В. Кинематические геометрические модели в концептуальном проектировании // Сб. тр. 13-й междунар. конф. по компьютерной графике и зрению Графикон-2003 (Москва, 5-10 сентября 2003 г.). М.: МГУ им.Ломоносова, 2003. - С. 243-245.
4. Математический энциклопедический словарь / Под редакцией Ю.В. Прохорова. М.: Сов. Энциклопедия, 1988. - 847 с. ил.
5. Семенков О.И. Обработка и вывод информации в растровых графических системах. Минск: Наука и Техника, 1989.
6. Харин В.В. Логический вывод в задачах синтеза и преобразования геометрических моделей // Труды конференции AIS'04. С. 135-141.
7. Abu-Mostafa Y.S., Psaltis D. Optical Neural Computers: Scientific American, Vol. 256, 1987. Pp. 88-95.
8. Akimoto Т., Suenaga Y., Wallace R. Automatic creation of 3D facial models/ЛЕЕЕ Computer Graphics and Applications, 1993. Vol. 13/3. - Pp. 16-22.
9. Al-Akkad M.A. Face recognition based on curvature estimation and neural networks // Труды 14-той Международной конференции по Компьютерной графике и Зрению Графикон-2004 (Москва, 6-10 сентября 2004 г.). М.:
10. Изд-во ООО "МАКС Пресс", 2004. С. 139-142.
11. Al-Akkad М.А. Using curvature and neural networks for recognizing faces / к печати в журнале Дамасского Университета.
12. Al-Akkad М.А., AboulNour Н. Design and Implementation of a developed bit-synchronizer for synchronous data communication and its computer simulation for testing and development purposes. Damascus University, 1996.
13. Alferez R., Wang Y.F. Geometric and Illumination Invariants for Object Recognition // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1999. -Vol. 21.-Pp. 505-536.
14. Ayache N., Lustman F. Fast and Reliable Passive Trinocular Stereovi-sion // Proceedings of the First International Conference on Computer Vision, London, June 1987. Pp. 422-427.
15. Beier Т., Neely S. Feature-based image metamorphosis//In Proceedings SIGGRAPH '92, July 1992. Vol. 26. - Pp. 35^2.
16. Belhumeur P.N., Hespanha J.P., Kriegman D.J. Eigenfaces vs. Fisher-faces: Recognition Using Class Specific Linear Projection // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1997. Vol. 19. - Pp. 711-720.
17. Belhumeur P.N., Kriegman D.J. What is the Set of Images of an Object Under All Possible Lighting Conditions? // IEEE Conference on Computer Visionand Pattern Recognition, 1997. Pp. 52-58.
18. Beymer D.J. Face Recognition Under Vaiying Pose / Technical Report 1461, MIT AI Laboratory, 1993.
19. Beymer D.J., Poggio T. Face Recognition from One Example View // International Conference on Computer Vision, 1995. Pp. 500-507.
20. Bichsel M., Pentland A.P. A Simple Algorithm for Shape from Shading // IEEE Conference on Computer Vision and Pattern Recognition, June 1992. -Pp. 459-465.
21. Bledsoe W.W. Man-Machine Facial Recognition, Tech. Rep. PRL22, Panoramic Res. Inc., Palo Alto, С A, 1966.
22. Blinn J.F. Computer display of curved surfaces. Ph.D. Thesis, University of Utah, 1978.
23. Bookstein F. Morphometry Tools for Landmark Data: Geometry and Biloogy. Cambridge University Press, 1991.
24. Breuckmann GmbH, Data sheet for the topometric 3D-measurement system "optoCAM", Meersburg, 1993. Sales in Switzerland by Newport Instruments AG, Schlieren.
25. Brooks M. J. and Horn В. K. P., Shape and Source from Shading. Number AIM-820. Artificial Intelligence Lab., MIT press, 1985.
26. Brunelli R., Poggio T. Face recognition: Features versus templates, IEEEPAMI15, 1993.-No.10. Pp. 1042-1052.
27. Brunelli R., Poggio T. HyperBF Networks for Gender Classification//In Proceedings DARPA Image Understanding Workshop, 1992. Pp. 311
28. Craw I., Cameron P. Parameterizing images for recognition and reconstruction. Proc. British Machine Vision Conference, 1991. Pp. 367-370.
29. Cyberware, 3Development, Issue 7, Cyberware, Monterey, California,1995.
30. Davis G., Ellis H., Sheferd J. Perceiving and remembering faces. Press Series in cognition and perception. Academic press, London, 1981.
31. Debevec P.E., Taylor C.J., and Malik J. Modeling and rendering architecture from photographs: A hybrid geometry- and image-based approach//In Computer Graphics Proceedings, Annual Conference Series (Proc. SIGGRAPH 96),1996.-Pp. 11-20.
32. Description of MPEG-7 Content Set, N2467, 1998.
33. DiPaola S. Extending the range of facial types. Journal of Visualization and Computer Animation, 1991. Vol. 4/2. Pp. 129-131.
34. Etemad K., Chellappa R. Discriminant Analysis for Recognition of Human Face Images / Journal of the Optical Society of America A, 1997. Vol. 14. Pp. 1724-1733.
35. Fahlman S. E.: "An Empirical Study of Learning Speed in Back-Propagation Networks", Technical Report CMU-CS-88-162, Carnegie Mellon University, Pittsburgh PA June 1988.
36. Farm G. Surface Over Dirichlet Tessellations. Computer Aided Geometric Design, 7, North-Holland, 1990. Pp. 281-292.
37. Feng G.C., Yuen P.C. Variance projection function and its application to eye detection for human face recognition, Pattern recognition Letter, 1998. Vol. 19.- Pp. 899-906.
38. Fisher R.A. The Use of Multiple Measurements in Taxonomic Problems. Annals of Eugenics. Vol. 7. - Pp. 179-188.
39. Freeman W.T., Tenenbaum J.B. bearing Bilinear Models for Two-Factor Problems in Vision // In Proceedings, IEEE Conference on Computer Vision and Pattern Recognition, 1997. Pp. 554-560.
40. Fua P. Reconstructing Complex Surfaces from Multiple Stereo Views // Proceedings of the Fifth International Conference on Computer Vision, London, June 1995. Pp. 1078-1085.
41. Fukunaga K. Statistical Pattern Recognition, New York: Academic Press, 1989.
42. Gordon G. Face Recognition Based on Depth Maps and Surface Curvature, in SPIE Proceedings, Vol. 1570: Geometric Methods in Computer Vision, 1991. Pp.34-247.
43. Grewe L.L., Как A.C. Stereo Vision, in Handbook of Pattern Recognition and Image Processing: Computer Vision, T.Y. Young (Ed.), Academic Press, 1994.-Vol. 2. Pp. 230-317.
44. Gutta S. and Wechsler H., "Face recognition using hybrid classifiers",1997.
45. Hallinan P. A Low-Dimensional Representation of Human Faces for Arbitrary Lighting Conditions // In Proceedings, IEEE Conference on Computer Vision and Pattern Recognition, 1994. Pp. 995-999.
46. Heipke C. Integration of Digital Image Matching and Multi-Image Shape from Shading, Int. Archives of Photogrammetry and Remote Sensing, XXIX, 1992.-Pp. 832-841.
47. Hoffman D.D. Richards W.A. Parts of recognition. Cognition, 1984.1. Vol. 18.-Pp. 65-96.
48. Horn B.K.P. Shape from Shading, a Method for Obtaining the Shape of a Smooth Opaque Object from One View, PIlD. Thesis, MIT, Dept. of Electrical Engineering, Cambridge, MA, 1970.
49. Hu J., Yan H., Sakalli M. Locating head and face boundaries for head-shoulder images, Patter Recognition, 1999. Vol. 32. - Pp 1317-1333.
50. Jeng S.H., Liao H.Y.M., Han C.C., Chern M.Y., Liu Y.T. Facial feature detection using geometrical face model: an efficient approach, Pattern Recognition, 1998. Vol. 31. - No. 3. - Pp.273-282.
51. Kanade T. Picture processing by computer complex and recognition of human feces, Tech. Rep., Dept. Inform. Sci., Kyoto University, 1973.
52. Kanade Т., Okutomi M., Nakahara T. A Multiple-baseline Stereo Method // Proceedings of DARPA Image Understanding Workshop, January 1992. -Pp. 409-426.
53. Kass M., Witkin A., Terzopoulos D. Snakes: Active Contour Models, International Journal of Computer Vision, 321-331, 1988.
54. Kirby M. and Sirovich L., "Application of the Karhunen-Loeve Procedure for the Characterization of Human Faces // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1990. Vol. 12.
55. Kohonen T. Self-Organization and Associative Memory, Berlin: Springer-Verlag, 1988.
56. Lam К. M., Yan H. Fast algorithm for locating head boundaries, J. Electrical Imaging, 1994. Vol. 4/3. - Pp. 351-359.
57. Lam К. M., Yan H. Locating and extracting the eye in human face images, Pattern Recognition, 1996. Vol. 29. - No. 5. - Pp.771-779.
58. Lam K.M., Yan H. An Analytic-to holistic approach for face recognition based on a single frontal view // IEEE Trans. On PAMI, 1998. Vol. 20. - No. 7.1. Pp. 673-686.
59. Lanitis A., Taylor C. J., Cootes T. F. Automatic Interpretation and Coding of Face Images Using Flexible Models // IEEE transactions on pattern analysis and machine intelligence, 1997. Vol. 19. - No. 7. - Pp 743-756.
60. Lee C.H., Rosenfeld A. Improved Methods of Estimating Shape from Shading Using the Light Source Coordinate System, in Shape from Shading, B.K.P. Horn, M.J. Brooks (Eds ), MIT Press, Cambridge, MA, 1989. Pp. 323-569.
61. Lee Y., Terzopoulos D., Waters K. Realistic face modeling for animation // In Proceedings SIGGRAPH '95, 1995. Pp. 55-62.
62. Lewis J.P. Algorithms for solid noise synthesis // Proceedings SIGGRAPH '89, 1989. Vol. 23/3. Pp. 263-270.
63. Li H., Roivainen P., Forchheimer R. 3-D Motion Estimation in Model-Based Facial Image Coding // IEEE Transactions on Patern Analysis and Machine Intelligence, June 1993. Vol. 15/6. Pp. 545-555.
64. Liu T.Y., Hsu W.H., Chen Y.S. Shape Description Via Shading Images, Image and Vision Computing, 1992. Vol. 10/1. Pp. 46-54.
65. Looney C. G.: "Stabilization and Speedup of Convergence in Training Feed-forward Neural Networks", Neuro-computing, 10, 1996, pp. 7-31.
66. Magnenat-Thalmann N., Minh H., de Angelis M., and Thalmann D. Design, transformation and animation of human feces. The Visual Computer, March 1989. Vol. 5(1/2). Pp. 32- 39.
67. Manjunath B.S., Chellappa R., Malsburg C.v.d. A Feature Based Approach to Face Recognition // in Proceedings, IEEE Conference on Computer Visionand Pattern Recognition, 1992. Pp. 373-378.
68. Matsuno K., Lee C., Kimura S., Tsuli S. Automatic recognition of human fecial expressions // Proceedings of ICC V, 1995. Pp. 352-359.
69. Matsuno K., Lee C.W., Tsuji S. Recognition of human fecial expression without feature extraction, in Proc. of ECCV, Stockholm, Sweden, May 1994. -Pp. 513-520.
70. Maurer Т., Malsburg C.v.d. Single-View Based Recognition of Faces Rotated in Depth // In Proceedings, International Workshop on Automatic Face and Gesture Recognition, 1996. Pp. 176-181.
71. Moccozet L., M-Thalmann N. Dirichlet Free Form Deformations and their Application to Hand Simulation // Proc. Computer Animation'97, IEEE Computer Society, 1997. Pp. 93-102.
72. Moghaddam В., Pentland A., "Probabilistic Visual Learning for Object Representation," IEEE Trans, on Pattern Analysis and Machine Intelligence, 1997. -Vol. 19. Pp. 696-710.
73. Moiikawa H., Kondo E., Harashima H. 3D Facial Modeling for Model-Based Coding // IEICE Transactions in Communication, June 1993. Vol. E76-B(6). Pp. 626-633.
74. Nagamine Т., Uemura Т., Masuda I. 3D fecial image analysis for human identification, in Proc. ICPR, Hague, Netherlands, 1992. Vol. 1. - Pp. 324-327.
75. Novak C. Finding fecial features in color images, in CVPR Wkshp on Color Vision, New York, June 1993.
76. Okamoto J., Milanova M., Almeida P. E., and Simoes M. G., "Applications of Cellular Neural Networks for Shape from Shading Problem", 1999.
77. Oliensis J., Dupuis P. Direct Method for Reconstructing Shape from Shading // SPDE Geometric Methods of Computer Vision, San Diego, С A, 1991.
78. O'Toole A.J., Abdi H., Defienbacher K.A., and Bartlett J.C. Classifyingfaces by race and sex using an autoassociative memory trained for recognition, in Proc. of Annual Meeting of the Cog. Sci. Soc., Chicago, 1991. Pp. 847-851.
79. Parke F. Parameterized models for facial animation. IEEE Computer Graphics and Applications, 1982. Vol. 9/2. Pp. 61-68.
80. Patel M., Willis P. FACES: The facial animation construction and editing system. In Eurographics '91, 1991.
81. Pentland A. P. Finding the Illumination Direction / Journal of the Optical Society of America A, April 1982. Vol. 72/4. Pp. 448-455.
82. Pentland A. Recognition by parts / Technical Report 406, SRI International, Menlo Park, С A, 1986.
83. Pentland A, Moghaddam В., and Starner T. View-based and Modular Eigenspaces for Face Recognition // In Proceedings, IEEE Conference on Computer Vision and Pattern Recognition, 1994.
84. Pentland A.P., Bichsel M. Extracting Shape from Shading // In Handbook of Pattern Recognition and Image Processing: Computer Vision, T.Y. Young (Ed.), Academic Press, 1994. Vol. 2. Pp. 161-183.
85. Poelman C., Kanade T.A Paraperspective Factorization Method for Shape and Motion Recovery / Technical Report CMU-CS-92-208, Carnegie Mellon University, 1992.
86. Poggio Т., Girosi F. Networks for Approximation and Learning // Proc. IEEE, 1990. Vol. 78. Pp. 1481-1497.
87. Press W.H., Teukolsky S.A., Vetterling W.T., Flanneiy B.P. Numerical Recipes in C, The Art of Scientific Computing, Cambridge University Press, New York, N.Y., 1992.
88. Reisfeld D., Yeshurun, Robust detection of fecial features by generalized symmetry, in Proc. ICPR, The Hague, 1992. Pp. 117-120.
89. Riechmann W. Fast Object Recording by Means of Structured Light and
90. Photogrammetric Techniques // Proceedings of the ISPRS Intercommission Workshop "From Pixels to Sequences Sensors, Algorithm and Systems", E.P. Baltsavias (Ed.), Zurich, March 1995. Vol. 30(5W1). Pp. 195-200.
91. Rowley H.A., Baluja S., and Kanade Т., "Rotation Invariant Neural Network-Based Face Detection", Proceeding of Computer Vision and Pattern Recognition, 1998.
92. Rowley H. A., Baluja S., and Kanade Т., "Neural network-based face detection", IEEE Trans, on PAMI, Vol 20, No.l, pp.23-38, 1998.
93. Rusbmeier H., Taubin G., Gueziec A. Applying shape from lighting variation to bump map capture. In Eurographics Rendering Workshop Proceedings 1997, pages 35-44,1997.
94. Saber E., Tekalp A.M. Frontal-view face detection and facial feature extraction using color, shape symmetry based cost functions, Pattern Recognition Letter, 1998. Vol. 19. - Pp. 669-680.
95. Sakai Т., Nagao M., Kanade T. Computer analysis and classification of photographs of human faces, Proc. First US A-Japan computer conf., 1986. -Pp. 245-256.
96. Sali E., Ullman S. Recognizing Novel 3-D Objects Under New Illumination and Viewing Position Using a Small Number of Example Views or Even a Single View//In Proceedings IEEE Conference on Computer Vision and Pattern Recognition, pp. 153-161, 1998.
97. Samaria F. Face Identification using Hidden Markov Models. 1st Year Report, Cambridge University Engineering Department, 1992.
98. Samaria F., Fallside F. Face identification and feature extraction using hidden markov models. In G. Vernazza, editor, Image Processing: Theory and Applications, Elsevier, 1993.
99. Shackleton M.A., Welsh W.J. Classification of facial features for recognition, in Proc. CVPR, Hawaii, 1991. Pp. 573-579.
100. Sibson R. A Vector Identity for the Dirichlet Tessellation, Math. Proc. Cambridge Philos. Soc., 87, 1980. Pp. 151-155.
101. Sinha S.S., Jain R. Range Image Analysis // in Handbook of Pattern Recognition and Image Processing: Computer Vision, T.Y. Young (Ed.), Academic Press, 1994. Vol. 2. - 185-237.
102. Sirovich L., Kirby M. Low-dimensional procedure for the characterization of human feces, J. Opt. Soc. Am 4, 1987. Pp. 519-518.
103. Sobottka K. Pitas I. Segmentation and tracking of feces in color images. In Proc. 2nd Int. Conf. On auto Face and Gesture Recogn., Vermont, IEEE Сотр. Soc. Press, 1996. Pp 236-241.
104. Sobottka K., Pitas I. Extraction of fecial regions and features using colour and shape information // Proceeding oflCIP, 1996. Vol. 3. - Pp. 483-486.
105. Sung K.K., Poggio T. Example-based learning for view-base human fece detection // IEEE Trans, on PAMI, 1998. Vol. 20. - No. 1. Pp. 39-51.
106. Swets D.L., Weng J. Discriminant Analysis and Eigenspace Partition Tree for Face and Object Recognition from Views // In Proceedings, International Conference on Automatic Face and Gesture Recognition, 1996. Pp. 192-197.
107. Swets D.L., Weng J. Using Discriminant Eigenfeatures for Image Retrieval // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1996. Vol. 18.-Pp. 831-836.
108. Takacs В., Wechsler H. Detection of feces and facial landmarks using iconic filter banks, Pattern recognition, 1997. Vol. 30. - No. 10. - Pp. 1623-1636.
109. Terzopoulos D., Waters K., "Analysis and Synthesis of Facial Image Sequences Using Physical and Anatomical Models," IEEE Trans, on Pattern Analysis and Machine Intelligence, Vol 15, pp. 569-579, 1993.
110. Tomasi C., Kanade T. Shape and Motion without Depth: A Factorization Method 2. Point Features in 3D Motion, Carnegie Mellon University / Technical Report, No. CMU-CS-91-105, Pittsburg, Pennsylvania, Jan. 1991.
111. Tsoi A. C., S. Lawrence, C. L. Giles and A. D. Back, "Face Recognition: A Convolutional Neural Network Approach", IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, 1998.
112. Turk M.A. Pentland A.P. Face recognition using eigenfaces // In Proc. CVPR, Hawaii, 1991. Pp. 586-591.
113. Turk M., Pentland A. Eigenfaces for Recognition / Journal of Cognitive Neu-roscience, 1991. Vol. 3. - Pp. 72-86.
114. Ullman S., Basri R. Recognition by Linear Combinations of Models // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1991. Vol. 13. -Pp. 992-1006.
115. Vetter Т., Poggio T. Linear Object Classes and Image Synthesis from a Single Example Image // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1997. Vol. 19. - Pp. 733-742.
116. Vezjak M., Stephancic M. An anthropological model for automatic recognition of the male human face / Annals of Human Biology, 1994.- Vol. 21- No 4.-Pp. 363-380.
117. Wiskott L., Fellous J. M., Malsburg C.v.d. Face Recognition by Elastic Bunch Graph Matching // IEEE Trans, on Pattern Analysis and Machine Intelligence, 1997. Vol. 19. - Pp. 775-779.
118. Wolberg G. Image Warping // IEEE Computer Society Press, Los Alamitos CA, 1990.
119. Xie X., Sudhakar R., Zhunag H. On improving eye feature extraction using deformable templates, Pattern Recognition, 1994. Vol. 27. - Pp.791-799.
120. Yang G., Huang T. Human face detection in a scene // In Proc. CVPR, New York, 1993. Pp. 453-58.
121. Yuille A.L., Hallinan P.W., Cohen D.S. Feature extraction from feces using deformable templates IJCVS, 1992. No. 2. Pp. 99-111.
122. Zhang R., Tsai P.S., Cryer J.E., Shah M. Analysis of Shape from Shading Techniques // Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR'94, Seatde, Washington, 1994. Pp. 377-384.
123. Zhao W., "Subspace Methods in Object/Face Recognition," in Proceedings, International Joint Conference on Neural Networks, 1999.
124. Zhao W., Chellappa R. Robust Face Recognition using Symmetric Shape-from-Shading / Technical Report CAR-TR-919, Center for Automation Research, University of Maryland, 1999.
125. Zhao W., Chellappa R. SFS Based View Synthesis for Robust Face Recognition // In Proceedings, International Conference on Automatic Face and Gesture Recognition, 2000.
126. Zhao W., Chellappa R., Krishnaswamy A. Discriminant Analysis of Principal Components for Face Recognition // In Proceedings, International Conference on Automatic Face and Gesture Recognition, 1998. Pp. 336-341.
127. Zhao W., Chellappa R., Nandhakumar N. Empirical Performance Analysis of Linear Discriminant Classifiers // In Proceedings, IEEE Conference on Computer Vision and Pattern Recognition, 1998. Pp. 164-169.
128. Zhao W., Chellappa R., Phillips P.J. Subspace Linear Discriminant Analysis for Face Recognition / Technical Report CAR-TR-914, Center for Automation Research, University of Maryland, 1999.
-
Похожие работы
- Алгоритмы построения трехмерных моделей объектов с регулярной структурой по фотографиям при взаимодействии с пользователем для виртуальных сред
- Архитектурная фотография как инструмент творческой деятельности архитектора
- Модели распознаваемых объектов в системе компьютерного стереозрения реального времени
- Теоретические основы и методическое обеспечение трехмерного проектирования одежды
- Совершенствование метода трехмерного проектирования элементов конструкции плечевой одежды
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность