автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Компьютерный метод локализации лиц на изображениях в сложных условиях освещения
Автореферат диссертации по теме "Компьютерный метод локализации лиц на изображениях в сложных условиях освещения"
На правах рукописи
ПАХИРКА Андрей Иванович
КОМПЬЮТЕРНЫЙ МЕТОД ЛОКАЛИЗАЦИИ ЛИЦ НА ИЗОБРАЖЕНИЯХ В СЛОЖНЫХ УСЛОВИЯХ ОСВЕЩЕНИЯ
05.13.01 - Системный анализ, управление и обработка информации (космические и информационные технологии)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
»1 9 МАЙ 2011
Красноярск - 2011
4847195
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева», г. Красноярск
Научный руководитель:
кандидат технических наук, доцент Фаворская Маргарита Николаевна
Официальные оппоненты:
доктор физико-математических наук, Визильтер Юрий Валентинович
доктор технических наук, профессор Ступина Алена Александровна
Ведущая организация
Учреждение РАН Институт вычислительного моделирования СО РАН, г. Красноярск
Защита состоится 3 июня 2011 года в 14 часов на заседании диссертационного совета Д 212.249.02 при Сибирском государственном аэрокосмическом университете имени академика М.Ф. Решетнева по адресу: 660014, г. Красноярск, пр. им. газеты «Красноярский рабочий», 31
С диссертацией можно ознакомиться в научной библиотеке Сибирского государственного аэрокосмического университета имени акад. М.Ф. Решетнева
Автореферат разослан 29 апреля 2011 г.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Задача локализации лиц имеет множество приложений в таких областях, как биометрия, организация видеоконференций, системы машинного зрения в робототехнике, интеллектуальные системы безопасности и контроля доступа и т.п. Технология идентификации личности на основе изображения лица, в отличие от использования других биометрических показателей (отпечаток пальца, радужная оболочка глаза), не требует физического контакта с устройством и с учетом стремительного развития цифровой техники, является наиболее приемлемой для массового применения.
За последние годы было предложено множество различных алгоритмов обработки, локализации и распознавания лиц такие, как нейронные сети, собственные лица, цепи Маркова и т. д. Все системы распознавания лиц делятся на две широкие категории: системы, использующие 2D изображения, и системы, применяющие 3D изображение лиц. При использовании баз данных 2D лиц на качество распознавания влияют положение лиц на изображении и световые условия, в то время как 3D изображения лиц призваны снять эти ограничения, но получение 3D изображений производится с помощью специальных устройств. К тому же такие системы требуют, чтобы объект был неподвижен несколько секунд в течение сканирования, что является недопустимым для систем, работающих в реальном режиме времени (интерфейс человек компьютер, объектно-ориентированная компрессия видеоданных, видеонаблюдение и т. д.)
Задача локализации лиц людей является сложной ввиду нескольких основных причин: лицо - это динамический объект, имеющий высокую степень изменчивости, например, по форме лица и цвету кожи; различные условия освещенности, определяющиеся типом, направлением и количеством источников света; частичное перекрытие лиц другими объектами сцены; необходимость локализации и распознавания лиц, имеющих произвольные положения в пространстве. В настоящее время наиболее активные разработки в сфере локализации и распознавания лиц проводятся университетами Carnegie Mellon University, University of Texas, University of Wisconsin-Madison, University of Illinois, Michigan State University, Florida State University, California Institute of Technology, Hie Rockefeller University (США), Cambridge, Cardiff University, University of Manchester, Queen Mary University (Англия), Institute of Automation, Chinese Academy of Sciences, Nanjing University (Китай), University of Muenster, Karlsruhe Institute of Technology, University of Siegen, Ruhr-Universitat Bochum (Германия), The University of Queensland (Австралия), Vienna University of Technology (Австрия), University of Sao Paulo (Бразилия), McGill University, University of Ottawa (Канада), University of Zagreb (Хорватия), University of Oulu (Финляндия). Среди российских учреждений, занимающихся данной тематикой
. можно отметить ФГУП «ГосНИИ Авиационных систем» (Желтов С.Ю., Визильтер Ю.В.), Московский государственный университет (Местец-кий JI.M., Крылов A.C.), Санкт-Петербургский государственный университет информационных технологий, механики и оптики, Ярославский государственный университет и ряд других организаций.
Целью диссертационной работы является повышение качества локализации лиц в системах видеонаблюдения и контроля доступа при наличии сложных условий освещения.
Поставленная цель определила необходимость решения следующих
задач:
-Провести анализ существующих методов локализации и распознавания лиц, а также подходов к построению алгоритмов улучшения изображений и систем распознавания лиц.
- Усовершенствовать метод улучшения изображений на основе сжатия динамического диапазона изображений, позволяющий скомпенсировать тени и засвеченные области.
- Разработать метод локализации лиц на изображении или видеопоследовательности в различных цветовых пространствах с выделением биометрических признаков лица на основе методов цветовой сегментации кожи.
- Разработать алгоритм нормализации положения лица на основе антропометрических точек с последующим распознаванием на основе метода главных компонент в сложных условиях освещения.
-Создать экспериментальный программный комплекс по предварительной обработке изображений, локализации и распознаванию лиц (для статических изображений и видеопоследовательностей) и провести экспериментальные исследования.
Область исследования. Работа выполнена в соответствии с пунктами 5 «Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации» и 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации» паспорта специальностей ВАК (технические науки, специальность 05.13.01 -системный анализ, управление и обработка информации).
Методы исследования. При выполнении диссертационной работы использовались методы теории обработки информации, методы идентификации объектов, теория математической морфологии, методы аналитической геометрии, методы объектно-ориентированного программирования.
Научная новизна диссертационной работы состоит в следующем:
1. Усовершенствован метод нелинейного улучшения цветных изображений с модифицированной функцией коррекции яркости и настраиваемым пороговым значением, позволяющий выравнивать яркость не только в теневых, но и в засвеченных участках изображения.
2. Разработан метод локализации лиц и выделения антропометрических точек с использованием цветовой информации и учетом подстройки коэффициентов для различных цветовых пространств, позволяющий выполнять более точную сегментацию регионов кожи.
3. Разработан алгоритм нормализации положения лица по антропометрическим точкам с последующим распознаванием. Реализующая алгоритм программа работает с видеопоследовательностью в реальном режиме времени.
Практическая значимость. Предложенные в диссертационной работе методы и алгоритмы предназначены для практического применения в системах видеонаблюдения и контроля доступа. На основе диссертационных исследований разработана библиотека программных модулей для создания систем обработки, локализации и распознавания изображений лиц.
Реализация результатов работы. Разработанная программа «Локализация лиц, (FaceDetection)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 16 февраля 2009 г. (свидетельство №2009611010), а также программа «Нелинейное улучшение изображений (Nonlinear image enhancement)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 31 марта 2010 г. (свидетельство №2010612360)
Разработанные алгоритмы и программное обеспечение используются в ООО «Клиент-Сервис» (г. Красноярск), а также в учебном процессе при проведении занятий по дисциплинам «Интеллектуальная обработка данных», «Теоретические основы цифровой обработки изображений» в Сибирском государственном аэрокосмическом университете им. академика М. Ф. Решетнева (СибГАУ).
Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на всероссийской конференции «Техническое зрение в системах управления» (Москва, 2011), 11 и 12 международной конференции и выставке «Цифровая обработка сигналов и ее применение» (Москва, 2009, 2010), всероссийской научно-практической конференции «Молодежь и современные информационные технологии» (Томск, 2009), X всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2009), IX международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж, 2008), всероссийской научной конференции молодых ученых «Наука Технологии Инновации» (Новосибирск, 2008), всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Решетневские чтения» (Красноярск, 2006, 2007 гг.), всероссийской конференции творческой молодежи, посвященной дню космонавтики «Актуальные проблемы авиации и космонавтики» (Красноярск, 2007), а также на научных семинарах лаборатории систем цифровой обработки изображений СибГАУ.
Публикации. По результатам диссертационного исследования опубликовано 18 печатных работ, из них 4 статьи в изданиях, рекомендованных ВАК для публикации результатов диссертационных исследований, 12 тезисов докладов, 2 свидетельства, зарегистрированных в Российском реестре программ для ЭВМ.
Структура работы. Работа состоит из введения, трех глав, заключения, библиографического списка. Основной текст диссертации содержит 106 страниц, изложение иллюстрируется 26 рисунками и 8 таблицами. Библиографический список включает 132 наименования.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность работы, сформулирована цель и поставлены задачи исследования, показана научная новизна и практическая ценность выполненных исследований, представлены основные положения, выносимые на защиту.
В первой главе рассмотрены основные подходы, применяемые при локализации и распознавании лиц, приведена классификация известных методов, а также проанализированы характеристики систем распознавания лиц.
Таблица 1
Классификация методов распознавания лиц
Категории Методы
Методы распознавания на основе общего представления лица - Метод главных компонент {Principal Component Analysis, РСА) - Линейный дискриминантный анализ (Linear Discriminant Analysis, LDA) - Метод опорных векторов (Support Vector Machines, SVM) - Эволюционные алгоритмы {Evolutionary algorithm, EA) - Анализ независимых компонент {Independent component analysis, ICA) - Нейронные сети {Neural Networks, NN)
Методы распознавания на основе локальных особенностей - Геометрические методы - Сравнение эластичных графов {Elastic Bunch Graph Matching, EBGM) - Скрытые марковские модели {Hidden Markov Models, HMM) - Активные модели внешнего вида (Active Appearance Models, AAM)
Гибридные методы - Объединение методов на основе общего представления лица и методов на основе локальных особенностей
Методы распознания лиц можно разделить на три широкие категории: методы распознавания на основе общего представления лица, методы распознавания на основе локальных особенностей и гибридные методы
(табл. 1). Первая группа методов рассматривает глобальные свойства изображения лица, стараясь представить данные более эффективно, например как набор собственных векторов ковариационной матрицы. Вторая группа методов использует свойства и геометрические отношения такие, как области, расстояния и углы между особыми точками изображения лица. Третья группа методов является объединением методов первых двух групп.
Большинство данных методов получили свое развитие в различных системах распознавания лиц, как коммерческих, так и свободно распространяемых. Сравнительная характеристика некоторых наиболее известных систем приведена в табл. 2.
Таблица 2
Сравнительная характеристика систем распознавания лиц
Компания Технология Описапис
vAcSys Biometrics» (Канада) 20-захват, основанный на слежении за лицом (FRS Discovery, Vera-Shield, VeraPort) Одна из немногих компаний, использующих нейросе-ти. Нейросетевая технология обучается к изменениям особенностей лица, что делает технологию устойчивой к возрастным изменениям и вариаций косметики.
«А4 Vision» (Канада) ЗД-распознаванис (Face Reader) Захват геометрической модели лица, проецированием на него, структурированного света
«Animetrics» (США) 3£)-распознавание, используются 2D изображения (FaceEngine Forensi-cd) Конвертация 2D изображений 3D модель, технология использует знание о том, что форма головы и изменения в изображении локализованы и отслеживаются.
«Л итога» (Англия) e-Gallery, Identix Engine Приложения разрабатываются специально для силовых структур, сравнения фото преступников
«Cognitec» (Германия) 2D распознавание (FaceVACS) Система работа с ID картами и документами, 2D распознавание особенностей лица с анализом текстур и световой интенсивности
«JSS» (Россия) 2D распознавание (Face-итпектор) Обнаружение лиц с использованием нейросети. Выделение основных признаков лица с помощью анализа контуров. Распознавание на основе проецирования изображения в собственное пространство.
«LI Identity» (США) 2D распознавание (Facelt) Распознавание фронтальных изображений, локализация лиц, если видимы оба глаза, заявленная устойчивость распознавания при повороте не более 35 градусов. Используется текстура кожи, требуются изображения с высоким качеством. Компания «LI Identity» строит алгоритмы на основе Eigenface.
«Neven Vision» (США) 2D распознавание Распознавание лиц на мобильных устройствах
Как видно из табл. 2, существующие на рынке системы, в основном, используют 21) распознавание лиц. Это обусловлено тем, что для захвата ЗО изображения требуются специализированные устройства, пока недос-
тупные для массового использования и накладывающие на систему распознавания ограничение по скорости считывания ЗБ образа.
Во второй главе диссертации представлены методы и алгоритмы нелинейного улучшения изображений на основе сжатия динамического диапазона изображений, локализации лиц на основе цветовой сегментации кожи в различных цветовых пространствах с последующим анализом областей и поиском антропометрических точек лица, распознавания лиц на основе метода главных компонент. Ограничения на входное изображение и их критерии приведены в таблице 3.
Таблица 3
Ограничения, предъявляемые к входным изображениям
Ограничение Критерий
Расстояние между антропометрическими точками > 40 пикселей между центрами глаз
Ориентация по оси 01 (во фронтальной плоскости) +/- 90 градусов
Ориентация по оси ОУ (вглубь сцены) +/- 15 градусов
Перекрытие лица не желательно
Наличие дополнительных артефактов (усы, очки, борода) допустимо с ограничением
Яркостные изменения допускаются, исключая сильные тени
Режим реального времени допускается
Сложность задачи состоит в том, что алгоритм распознавания должен обладать устойчивостью к изменению масштаба и повороту лица, устойчивостью к изменению выражения лица и частичному перекрытию лица другим объектами сцены, а также низкой зависимостью от освещенности.
Метод локализации лиц в сложных условиях освещения можно разделить на следующие этапы:
I этап. Нелинейное улучшение изображения:
- предварительная обработка изображения (устранение шумов);
- сжатие динамического диапазона (логарифмическое выравнивание освещения с повышением контрастности изображения);
II этап. Локализация лиц:
- цветовая сегментация кожи в цветовом пространстве YCbCr;
- морфологическая обработка полученных зон (операции расширения и сжатия);
- поиск связанных областей с последующим анализом полученных областей;
III этап. Локализация антропометрических точек лица:
- поиск глаз на основе классификационного правила в цветовом пространстве YCbCr;
IV этап. Распознавание лица:
- нормализация положения лица на основе данных о положении антропометрических точек;
— распознавание лица на основе метода главных компонент.
Для улучшения изображений применяется алгоритм Multi-Scale Retinex - MSR, имитирующий визуальную систему человека. MSTi-алгоритм сжимает динамический диапазон изображения с сохранением (увеличением) локального контраста в плохо и ярко освещенных областях. Классический многомерный М?Д-алгоритм является взвешенной суммой одномерных <5'5Д-алгоритмов {Single-Scale Retinex) для различных масштабов. Одномерная выходная функция /-го цветового канала R,(x,y,a) вычисляется следующим образом:
R.(x,y,o)=log{/i(xty)}-log{F(x,}',d)*I,(x,y)} ,
где 1\{х,у) - входная функция г-го цветового канала по координатам х и у; а - масштабный коэффициент; знак «*» обозначает свертку функций; F(x,y, а) - гауссиан, определяемый как
Р(х,У,а)=Ке-<х2+у2уп2 .
При этом коэффициент К выбирается таким образом, чтобы выполнялось условие
.[¿_ F( x,y, d]clxdy = 1 ,
где - множество пикселей, принадлежащих всему изображению.
Тогда результирующая выходная функция г'-го цветового канала R>,i.(x,y,w, а) определяется как
N
, (1)
где w=(w;,w2,...,w„) - весовой вектор одномерных выходных функций i-ro цветового канала R,(xj?,a); о=(сту,сТ2,...,сг„), n=\,2,...,N - вектор масштабов
N
одномерных выходных функций. При этом X = 1. Размерность вектора
»-I
масштабов обычно выбирается не меньше трех. При проведении экспериментов они составили 13, 87,180.
Однако классический алгоритм MSR приводит к искажению цвета изображения, т. к. значение каждой цветовой составляющей пикселя (например, в ЛС?5-пространстве) заменяются отношением ее исходного значения к среднему значению данной цветовой составляющей окружающих
пикселей. Существуют несколько решений данной проблемы. Так, некоторое улучшение результатов наблюдается при переходе в другие цветовые пространства с явным разделением яркостной и оттеночной составляющих (HIS-, HSV-, HSL-пространства). Однако лучший эффект достигается при использовании модели нормализованного разделения яркостной составляющей и оттеночной составляющей. Дополнительная обработка выполняется в соответствии с выражением:
R 'u{.x,y,w, (T,b)=Rhli{xj>, w, о) * / '(ху,с) , где Г,{ху,Ь) - нормализованная яркость. Она определяется по формуле:
/'(jc,>;c)=log
1 + с
АЫ
Ь.М
где с - коэффициент, выбираемый из середины диапазона значений [0...255], с=10(й-125.
Из-за характеристик логарифмической функции /Ш7?-алгоритм делает детали изображения более различимыми в теневых областях, чем в засвеченных областях. Чтобы сделать детали различимыми в засвеченных областях можно применить логарифмическую функцию к инвертированному изображению. Построим модифицированную функцию Щ{х,у)), состоящую из прямой и обратной ветви логарифма и зависящую от порогового значения 77г, выбираемого пользователем.
L{l(x.y))-
где
Vlog(/M), l[x,y)<Th
-k2 ■ log (DR - 1{х,у)) + log (DR), I(x,y) > Th '
— ■ \og(DR)
М7й) '
2 1оё(Ш - ТИ) '
где - динамический диапазон изображения, в данном случае DR = 255 (для изображений с 8-ю битами на цветовой канал), к/ и к; - весовые коэф-
фициенты. Пороговое значение 77? было выбрано равное 230. Вид функции Ц1(ху)) приведен на рисунке 1.
0 I DR
Рис 1. Вид функции L(l(x,y)) с Th = 200
Объединение ветвей дает классическому алгоритму MSR возможность повышать контрастность деталей в областях повышенной яркости (для примера на рисунке. 2 область повышенной яркости выделена замкнутым контуром). Использование такого вида логарифмической функции в определенной мере повышает контрастность деталей информативной области типичных распределений яркости (60-200), но значительно в меньшей мере, чем в затененных участках и участках с высокой яркостью.
Однако выходные данные MSR-алгоритма с модифицированной функцией коррекции яркости находятся вне динамического диапазона изображения. Чтобы привести значения к динамическому диапазону изображения [0, 255] сделаем корректировку выходного изображения на основе корректирующего коэффициента и среднего значения яркостей пикселов обработанного изображения.
WO =-+ С,
vv„„
где 1„,(х,у) - яркость пиксела после обработки MSÄ-алгоритмом с модифицированной функцией коррекции яркости, larf,{xy) - среднее значение яркости пикселов обработанного изображения, wcor - корректирующий коэффициент, выбирается экспериментальным путем (wcor = 0.007), за константу С
берется половина динамического диапазона изображения (С = 127.5). На рисунке 2 показан пример работы МЭД-алгоритма с модифицированной функцией коррекции яркости.
а б в
Рис 2. Пример нелинейного улучшения изображений: а) входное изображение, б) изображение с применением модифицированного метода MSR, в) изображение с применением классического метода MSR в редакторе «G/MP»
Далее следует этап локализации лиц на основе цветовой сегментации кожи. Процесс локализации лица на изображении можно разделить на две основные составляющие:
- выделение участков изображения, имеющих цвет, сходный с цветом кожи человека (цветовая сегментация);
- анализ выделенных после сегментации регионов.
Для сокращения областей, в которых производится поиск лиц, определяем регион движения в кадре. Для этого используется метрика MSAD, которая представляет собой усредненную абсолютную разность значений яркостей пикселей в двух сравниваемых кадрах:
».» \Х -Y I MSAD(X,Y)= £ —-- >
м.и тп
где Xg, Yjj - яркости пикселов в сравниваемых кадрах размерностью т><п. Затем в соответствии с установленным порогом по значению метрики оценивается, произошло ли движение в кадре.
Цветовая сегментация кожи человека на изображении требует построение определяющих правил, которые будут разделять пиксели цвета кожи и пиксели, не относящиеся по цвету к коже.
Классификатор пикселов кожи для цветового пространства YCbCr, с распределением цвета кожи представленым на рисунке 3, определяется как:
(Cb.Cr) is classified as skin if.
80 < Cb < 145 and 140 < Cr < 190,
где значения Cb,Cr принадлежат интервалу [0, 255]. После проведения ряда экспериментов было выбрано именно это цветовое пространство, т. к. его использование показало наивысший процент распознавания пикселов кожи для изображений, получаемых с веб-камеры.
YCbCï
250
200
150
и
100
50
50 1 00 150 200 250
СЬ
Рис 3. Распределение цвета кожи для пространства YCbCr
Рис 4. Примеры сегментации кожи при различных условиях освещения: а) входные изображения, б) выделенные участки кожи, в) входные изображения после улучшения, г) выделенные участки кожи для изображений после улучшения
На рисунке 4 представлены примеры сегментации кожи при различных условиях освещения для изображений лиц до и после применения модифицированного метода нелинейного улучшения (база лиц «Caltech Face Database», калифорнийского технологического института).
Сегментированное изображение кожи бинаризуется и подвергается морфологической обработке (сжатие с последующим расширением), которая позволяет разъединить плохо связанные регионы и удалить регионы малого размера (шум). Далее производится маркировка связных областей (рисунок 5), после чего в каждой области ищутся антропометрические точки (глаза, губы).
я»
а) б) в) г) д)
Рис 5. Пример морфологической обработки регионов кожи с последующей маркировкой связных областей: а) входное изображение, б) выделенные участки кожи, в) бинаризованное изображение, г) морфологическая обработка, д) маркировка связных областей
В каждой найденной области происходит поиск глаз. Для локализации глаз (рисунок 6 б) применяется классификационное правило в цветовом пространстве УСгСЬ, карта глаз (ЕуеМар) определяется через компоненты Сг и СЬ данного цветового пространства:
ЕуеМар = ^ | СЬ1) + (Сг)2 + {СЬ/Сг)\
где Сг, СЬ принадлежат [0, 255], Сг инвертированное значение (255 - Сг). Создание данной метрики для нахождения «карты глаз» базируется на том условии, что области глаз обычно имеют высокие значения голубой отте-ночной компоненты СЬ и низкие значения красной оттеночной компоненты Сг. Для проверки того, что найденная область является глазом, вводится два радиуса Д/ и которые выбираются в зависимости от размера предполагаемого региона лица. Берется контрольное количество пикселов на расстояниях Л/ и г2 от центра предполагаемой области глаза. Радиус г2 описывает внутреннюю область глаза, Я/ внешнюю. Контрольные группа пикселов на расстоянии Я/ должна содержать определенное количество пикселов кожи, задаваемое пользователем, также как и вторая контрольная группа пикселов на расстоянии г2 должна содержать определенное количество пикселов, не относящихся по цвету к коже.
а) б) в) г) д)
Рис 6. Пример локализации лиц: а) предполагаемая область лица, б) «карта глаз» с найденными центрами глаз, в) поворот изображения, г) выделение области лица в соответствии с моделью, базирующейся на расстоянии между центрами глаз, д) локализованное и масштабированное изображение лица
Положение каждого найденного лица нормализуется при помощи поворота и масштабирования. Лицо поворачивается на угол в соответствии с формулой:
0 = -агс1ап(&^ 1
1*2 )
где у|) и (х2, уг) координаты центров левого и правого глаз (рисунок 6 в). Поворот и масштабирование лиц осуществляется с помощью билинейной интерполяции средствами, встроенными в среду программирования.
Распознавание лиц осуществляется с помощью метода главных компонент (Principal Components Analysis, РСА) (рисунок 7), который позволяет уменьшить размерность данных с минимизацией потерь информации. Используем подпространство, созданное собственными векторами ковариационной матрицы исследуемых изображений. Собственные векторы, соответствующие ненулевым собственным значениям ковариационной матрицы, формируют ортогональный базис, который отображает изображения в А^-мерное пространство. Каждое изображение сохраняется в векторе X размерностью N:
■к--
(2)
где х, - эталонные изображения. Изображения центрируются вычитанием из каждого вектора усредненного изображения:
1 ''
х' = х - т, где т - — У^х' , (3)
Рис. 7. Распознавание лиц на основе метода главных компонент
Данные векторы объединяются, образуя матрицу данных МхР (где Р - количество изображений, х' - центрированное изображение) следующим образом:
Х = [х' х2 •■• *'] (4)
Рассчитывается ковариационная матрица:
£2=ХХТ (5)
Далее рассчитываются собственные значения и векторы ковариационной матрицы О, а затем сортируются от большего значения к меньшему в соответствии с их собственными значениями. Распознавание изображений осуществляется в три шага:
- Формируется матрица собственных векторов из обучающей выборки (шаг обучения).
- Каждое изображение из эталонной выборки умножается на матрицу собственных векторов. Полученные векторы сохраняются в базе данных (шаг обучения).
- Входное изображение умножается на матрицу собственных векторов и сравнивается с каждым вектором обучающей выборки из базы данных (шаг распознавания).
В рамках шага обучения происходит центрирование данных: каждое изображение центрируется, вычитанием усредненного изображения из каждого эталонного изображения. Усредненное изображение - это вектор-столбец, в который входят средние значения пикселей из всех пикселей эталонных изображений (выражение (3)). Далее создается матрица данных, комбинированием центрированных изображений в матрицу размером NxP (выражение (4)). Из матрицы данных формируется ковариационная матрица (выражение (5)). Затем вычисляются собственные векторы и собственные значения ковариационной матрицы:
QV = AV,
где V набор собственных векторов с собственными значениями Л. Собственные векторы v,eV упорядочиваются в соответствии с их собственными
значениями ЛеЛ от большего значения к меньшему значению. Собственные векторы объединяются в матрицу V:
V = [v, v2 v,]
Далее происходит умножение центрированных изображений из обучающей выборки на матрицу V:
х' =W
В рамках шага распознавания происходит распознавание входного изображения. Каждое входное изображение центрируется вычитанием усредненного изображения и затем умножается на матрицу собственных векторов V.
1 р ~ _ у' = у' -т, гдет =—и у' = УТу
Полученный вектор входного изображения сравнивается со всеми векторами обучающей выборки из базы данных. Степень близости входного изображения и изображений из обучающей выборки проверяется любой метрикой, например евклидовой.
Третья глава посвящена вопросам практического создания приложений на основе разработанных методов и алгоритмов, приведена структурная схема экспериментального программного комплекса по локализации и
распознаванию лиц на изображении, а также представлены методика и результаты тестирования разработанных методов и алгоритмов.
На рисунке 8 показана структурная схема модуля локализации лиц на основе цветовой сегментации кожи с последующим нахождением антропометрических точек лица.
Рис. 8. Структурная схема модуля локализации лиц
В результате практической апробации метода была разработана экспериментальная программа, позволяющая осуществлять распознавание лиц. Программа осуществляет нелинейное улучшение видеоизображений при помощи модифицированного МЖ-алгоритма с составной логарифмической функцией, с последующей локализацией лиц на основе цветовой сегментации кожи и выделением антропометрических точек лица.
Для тестирования модуля локализации лиц и использовались изображения с нормальной освещенностью, затененные изображения и изображения, содержащие области засветки. В качестве экспериментальных данных использовались изображения с разрешением 640х480, получаемые с web-камеры. Зависимость цветовой сегментации кожи от цветового пространства при различных уровнях освещенности (без применения улучшения и с применением нелинейного улучшения) показана на рисунке 9.
Средняя точность сегментации кожи без коррекции освещенности при нормальном освещении составила 86,3% (YCbCr), 75,4% (rg), 68,6% (HSV) и 15,2% (П/V), затененные изображения 59,8% (YCbCr), 68,5% (rg), 19,3% (HSV) и 21,7% (YUV), изображения с областями засветки 71,5% (YCbCr), 73,9% (rg), 52,3% (HSV) и 14 % (YUV). Средняя точность сегментации кожи с коррекцией освещенности при нормальном освещении составила 93,4% (YCbCr), 74,7% (rg), 73,2% (HSV) и 27,5% (YUV), затененные изображения 63,6% (YCbCr), 71,9% (rg), 23,7% (HSV) и 38,1% (YUV), изо-
бражения с областями засветки 78,2% (YCbCr), 75,4% (rg), 53,1% (HSV) и 16,3 % (YUV).
Зависимость выделения цвета кожи от цветового пространства
11 21 31 41 51 61' 71 81 91 101 111 121 131 141 151 161 171 1S1 191 нормальные ; затенменое | с повышенной яркостью
-YCbCr -HSV ■ YUV
Изображения лиц при различных уровнях освещения
Зависимость выделения цвета кожи от цветового пространства (с коррекцией освещенности)
■ТСЬСг -HSV ■ YUV
1 11 21 31 41 SI 61! 71 61 91 101 111 121
i
нормальные ; затенненые
131 141 151 161 171 1S1 191 слов^шенной яркостью
Изобракения лиц при различных уровнях освещения
Рис. 9. Зависимость выделения цвета кожи от цветового пространства
Непосредственное распознавание осуществляется на основе метода главных компонент. Структурная схема модуля распознавания представлена на рисунке 8. В результате исследований было получено, что разработанный метод улучшает цветовую сегментацию кожи в среднем на 3-5%,а распознавания лиц на 5-7%. Высокая точность распознавания достигается для изображений лиц, удовлетворяющих ограничениям на входное изображение, которые указаны в постановке задачи, что показывает эффективность предложенного подхода.
Алгоритм распознавания тестировался на базе лиц «ORL face database», содержащей изображения лиц сорока людей по десять изображений на каждую персону. Обучающая выборка включала по 9 изображений на персону, десятое изображение - тестовое. Для конечного сравнения
применялась, евклидова метрика с различными пороговыми значениями. Максимальная точность распознавания без улучшения изображения составила 85,1%, максимальный процент ложных доступов 29,1 % и максимальный процент ложных отказов 29,8%, в то время как с нелинейным улучшением максимальная точность распознавания составила 94,8%, максимальный процент ложных доступов 11,9% и максимальный процент ложных отказов 28,3%. Ложный доступ - персоны нет в базе данных, но дистанция между тестовым изображением и изображениями из базы меньше порогового значения. Ложный отказ - персона имеется в базе данных, но дистанция между тестовым изображением и изображениями из базы превышает пороговое значение.
В заключении сформулированы основные результаты и выводы, полученные в диссертационной работе.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Усовершенствован метод нелинейного улучшения изображений с увеличением контраста и сжатием динамического диапазона изображений, позволяющий скомпенсировать тени и засвеченные области изображения.
2. Модифицирован метод локализации лиц на изображении или видеопоследовательности на основе предложенных определяющих правил в различных цветовых пространствах, с последующей геометрической нормализацией изображения лица.
3. Реализован алгоритм распознавания лиц на основе метода главных компонент, состоящий из двух этапов: обучения и распознавания. При этом образы объектов обучающей выборки сохраняются в базе данных для дальнейшей идентификации входных образов.
4. Создан экспериментальный программный комплекс по предварительной обработке изображений, локализации и распознаванию лиц в сложных условиях освещения (для статических изображений и видеопоследовательностей).
5. Экспериментальные исследования показали, что усовершенствованный метод нелинейного улучшения изображений позволяет увеличить точность сегментации кожи в среднем 3-5%, а распознавания лиц в среднем на 5-7%. Предложенные определяющие правила в методе локализации лиц повышают точность сегментации кожи до 81-86%. При использовании улучшенных входных изображений лиц алгоритм распознавания показал точность распознавания 86-94%.
Таким образом, разработанные методы и алгоритмы позволяют разрабатывать системы обработки изображений и локализации лиц, повышают эффективность систем видеонаблюдения за счет применения в них метода
нелинейного улучшения изображения с компенсацией теней и засвеченных областей изображений.
Основные положения и результаты диссертационной работы представлены в следующих работах автора (знаком * обозначены работы, опубликованные в издании, включенном в список изданий, рекомендованных ВАК для опубликования результатов диссертационных исследований):
1. * Пахирка А. И., Применение метода улучшения изображений для систем распознавания лиц / А.И. Пахирка, // Вестник Сибирского государственного аэрокосмического университета имени академика М.Ф. Решет-нева. - Вып. 3(29) в 3 частях, Красноярск, 2010. с. 25-29
2. * Пахирка А.И. Модель улучшения цветных изображений на основе адаптивного выравнивания спектральных диапазонов/ М.Н. Фаворская, А.И. Пахирка // Системы управления и информационные технологии / ИПУ РАН, ВГТУ, № 1 (39), М.-Воронеж, 2010. с. 23-26
3. Пахирка А.И., Алгоритм улучшения изображений, основанный на человеческом восприятии / А.И. Пахирка // В материалах всероссийской научной конференции молодых ученых «Наука. Технологии. Инновации. НТИ-2009», Новосибирск, 2009. с. 219 - 221.
4. Пахирка А.И., Применение метода главных компонент при распознавании лиц / А.И. Пахирка // В материалах международной конференции «Цифровая обработка сигналов и ее применение» г. Москва, 2009 г., с. 388— 390.
5. * Пахирка А.И. Методы поиска движения в видеопоследовательностях / М.Н. Фаворская, А.И. Пахирка, A.C. Шилов, М.В. Дамов // Вестник Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнева. - Вып. 1 (22) в 2 частях, Ч. 2, Красноярск, 2009. с. 69-74.
6. Пахирка А.И., Методы понижения размерности данных при распознавании лиц / А.И. Пахирка // В материалах X междунар. науч.-техн. конф. «Теоретические и прикладные вопросы современных информационных технологий», Улан-Удэ, 2009. с. 475-478.
7. Пахирка А.И., Классификация методов распознавания лиц/ А.И. Пахирка II В материалах всероссийской научно-практической конференции «Молодежь и современные информационные технологии» г. Томск, 2009 г., с. 307-309.
8. * Пахирка А.И., Модели локализации лиц на изображениях/ М.Н. Фаворская, А.И., Пахирка // Системы управления и информационные технологии / ИПУ РАН, ВГТУ, № 3.3 (33), М.-Воронеж, 2008. с. 404-408.
9. Пахирка А.И., Локализация лиц людей, основанная на форме и цветовой сегментации / А.И. Пахирка // В материалах межрегиональной
научно-практической конференции «Молодежь Сибири - науке России», СИБУП, Красноярск, 2008 г., с. 53-55.
10. Пахирка А.И., Подход к локализации лиц на изображении / А.И. Пахирка // В материалах всероссийской научной конференции «Наука Технологии Инновации», г. Новосибирск, 2008 г., с. 126-128.
11. Пахирка А.И., Фаворская М.Н., Система локализации лиц на основе цветовой сегментации кожи (FaceDetection). Зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 16 февраля 2009 г. (свидетельство №2009611010).
12. Пахирка А.И., Фаворская М.Н., Система нелинейного улучшения изображений (Nonlinear image enhancement). Зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 31 марта 2010 г. (свидетельство №2010612360).
Отпечатано в отделе копировальной и множительной техники СибГАУ 660014 г. Красноярск, пр. им. газеты «Красноярский рабочий», 31
ПАХИРКА Андрей Иванович
Компьютерный метод локализации лиц на изображениях в сложных условиях освещения
Автореферат
Подписано к печати 28.04.2011 года Формат 60x84/16. Бумага писчая. Печ. л. 1.0 Тираж 100 экз. Заказ №
Оглавление автор диссертации — кандидата технических наук Пахирка, Андрей Иванович
ВВЕДЕНИЕ.
ГЛАВА 1 АНАЛИЗ МЕТОДОВ И СИСТЕМ ЛОКАЛИЗАЦИИ И РАСПОЗНАВАНИЯ ЛИЦ.
1.1 Классификация существующих методов локализации лиц.
1.1.1 Эмпирические методы.
1.1.2 Методы, инвариантные к особенностям лица.
1.1.3 Методы сравнение с шаблоном.
1.1.4 Методы моделирования изображения лица.
1.2 Классификация существующих методов распознавания лиц.
1.2.1 Методы распознавания на основе локальных особенностей.
1.2.2 Методы распознавания на основе общего представления лица.
1.3 Анализ существующих систем локализации и распознавания лиц.
1.4 Выводы по главе.
ГЛАВА 2 НЕЛИНЕЙНОЕ УЛУЧШЕНИЕ ИЗОБРАЖЕНИЙ, ЛОКАЛИЗАЦИЯ И РАСПОЗНАВАНИЕ ЛИЦ.
2.1 Предварительная обработка.
2.1.1 Определение региона движения.
2.1.2 Метод нелинейного улучшения изображения.
2.2 Локализация и распознавание лиц.
2.2.1 Цветовая сегментация кожи.
2.2.2 Нахождение антропометрических точек.
2.2.3 Распознавание лиц.
2.3 Выводы по главе.
ГЛАВА 3 ПОСТРОЕНИЕ ЭКСПЕРИМЕНТАЛЬНОЙ КОМПЛЕКСНОЙ СИСТЕМЫ УЛУЧШЕНИЯ ИЗОБРАЖЕНИЙ С ПОСЛЕДУЮЩЕЙ ЛОКАЛИЗАЦИЕЙ И РАСПОЗНАВАНИЕМ ЛИЦ.
3.1 Структурная схема комплекса локализации и распознавания лиц с нелинейным улучшением изображения.
3.2 Описание основных модулей системы ЕИЛ.
3.3 Результаты экспериментальных исследований.
3.4 Выводы по главе.
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Пахирка, Андрей Иванович
Актуальность работы. Задача распознавания лиц имеет множество приложений-в таких областях, как биометрия, организация видеоконференций, системы машинного зрения в робототехнике, интеллектуальные системы безопасности и контроля.доступа и т. п. Технология идентификации личности на основе изображения лица, в отличие от использования других* биометрических показателей (отпечаток пальца, радужная оболочка глаза), не* требует физического контакта с устройством и с учетом стремительного развития цифровой техники является наиболее приемлемой для массового применения.
За последние годы было предложено множество различных алгоритмов обработки, локализации и распознавания лиц такие, как нейронные сети (Fe-rand, Rowley), собственные лица (Turk, Pentland), цепи Маркова (Slimane) и т. д. Все системы распознавания лиц делятся на две широкие категории: использующие (2D) двухмерные изображения и (3D) трехмерные изображение лиц. При использовании баз данных 2D лиц (Phillips) на качество распознавания влияют положение лиц на изображении и условия освещения, в то время как 3D изображения лиц призваны снять эти ограничения (Tsalakani-dou, Beumier, Acheroy, Hehser, Lu, Bowyer). Однако для получения 3D изображений необходимы профессиональные устройства. К тому же такие системы требуют, чтобы объект был неподвижен несколько секунд в течение сканирования, что является недопустимым для систем, требующих работы в реальном режиме времени (интерфейс человек-компьютер, объектно-ориентированная компрессия видеоданных, видеонаблюдение и т. д.). В настоящее время наиболее активные разработки в сфере локализации и распознавания лиц проводятся университетами Carnegie Mellon University, University of Texas, University of Wisconsin-Madison, University of Illinois, Michigan State University, Florida State University, California Institute of Technology, The Rockefeller University (США), Cambridge, Cardiff University, University of ManЪ
Chester, Queen Mary University (Англия), Institute of Automation, Chinese Academy of Sciences, Nanjing University (Китай), University of Muenster, Karlsruhe Institute of Technology, University of Siegen, Ruhr- Universitat Bochum (Германия), The University of Queensland (Австралия), Vienna University of Technology (Австрия), University of Sao Paulo (Бразилия), McGill University, University of Ottawa (Канада), University of Zagreb (Хорватия), University of Oulu (Финляндия). Среди российских учреждений, занимающихся данной тематикой можно отметить ФГУП «ГосНИИ Авиационных систем» (Желтов С.Ю., Ви-зильтер Ю.В.), Московский государственный университет (Местецкий JI.M., Крылов А.С.), Санкт-Петербургский государственный университет информаI ционных технологий, механики и оптики, Ярославский государственный университет и ряд других организаций.
Задача распознавания лиц является сложной по следующим основным причинам: лицо человека - это динамический объект, имеющий высокую степень изменяемости во внешнем виде (например, по форме и цвету кожи); различные условия освещенности, определяющиеся типом, направлением и количеством источников света; частичное перекрытие лиц другими объектами сцены; необходимость локализации и распознавания' лиц, имеющих произвольные положения в пространстве. Однако существующие системы локализации и распознавания лиц не всегда учитывают данные особенности, что не позволяет достичь приемлемого уровня распознавания на изображениях и видеопоследовательностях.
Целью диссертационной работы является повышение качества локализации лиц в системах видеонаблюдения и контроля доступа при наличии сложных условий освещения.
Поставленная цель определила необходимость решения следующих задач:
-Провести анализ существующих методов локализации и распознавания лиц, а также подходов к построению алгоритмов улучшения изображений и систем распознавания лиц.
- Усовершенствовать метод улучшения изображений на основе сжатия динамического диапазона изображений, позволяющий скомпенсировать тени и засвеченные области.
- Разработать метод локализации лиц в различных цветовых пространствах на изображении или видеопоследовательности с выделением биометрических признаков лица на основе методов цветовой сегментации кожи.
- Разработать алгоритм нормализации положения лица на основе антропометрических точек и распознавания на основе метода главных компонент в сложных условиях освещения.
- Создать экспериментальный программный комплекс по предварительной обработке изображений, локализации и распознаванию лиц (для статических изображений и видеопоследовательностей) и провести экспериментальные исследования.
Область исследования. Работа выполнена в соответствии с пунктами 5 «Разработка специального математического и программного обеспечения* систем анализа, оптимизации, управления, принятия решений и обработки информации» и 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации» паспорта специальностей ВАК (технические науки, специальность 05.13.01 - системный анализ, управление и обработка информации).
Методы исследования. При выполнении диссертационной работы использовались методы теории обработки информации, методы идентификации объектов, теория математической морфологии, методы аналитической геометрии, методы объектно-ориентированного программирования.
Научная новизна диссертационной работы состоит в следующем:
Усовершенствован метод нелинейного улучшения цветных изображений с модифицированной функцией коррекции яркости и настраиваемым пороговым значением, позволяющий выравнивать яркость не только в теневых, но и в засвеченных участках изображения.
2. Разработан метод локализации лиц и выделения антропометрических точек с использованием цветовой информации и учетом подстройки коэффициентов для различных цветовых пространств, позволяющий« выполнять более точную сегментацию регионов кожи.
3. Разработан алгоритм нормализации положения лица по антропометрическим точкам с последующим распознаванием. Реализующая алгоритм программа работает с видеопоследовательностью в реальном режиме времени.
Практическая значимость. Предложенные в диссертационной работе методы и алгоритмы предназначены для практического применениям системах видеонаблюдения и контроля доступа. На основе диссертационных исследований разработана библиотека программных модулей для создания систем обработки, локализации и распознавания изображений лиц.
Реализация результатов работы. Разработанная программа «Локализация лиц, (FaceDetection)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 16 февраля 2009 г. (свидетельство №2009611010), а также программа «Нелинейное улучшение изображений (Nonlinear image enhancement)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 31 марта 2010 г. (свидетельство №2010612360).
Разработанные алгоритмы и программное обеспечение используются в ООО «Клиент-Сервис» (г. Красноярск), а также в учебном процессе при проведении занятий по дисциплинам «Интеллектуальная обработка данных», «Теоретические основы цифровой обработки изображений» в Сибирском государственном аэрокосмическом университете им. академика М. Ф. Решет-нева (СибГАУ).
Основные положения, выносимые на защиту:
1. Метод нелинейного улучшения видеоизображения на основе сжатия динамического диапазона для выравнивания яркости в теневых и засвеченных участках.
2. Метод локализации лиц и выделения антропометрических точек на изображениях и видеопоследовательностях на основе цветовой сегментации кожи в различных цветовых пространствах.
3. Алгоритм нормализации и распознавания лиц на основе метода главных компонентов с занесением и хранением признаков обобщенного лица в базе данных.
Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на всероссийской конференции «Техническое зрение в системах управления» (Москва, 2011), 11 и 12 международной конференции и выставке «Цифровая обработка сигналов и ее применение» (Москва, 2009, 2010), всероссийской научно-практической конференции «Молодежь и современные информационные технологии» (Томск, 2009), X всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2009), IX международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж, 2008), всероссийской научной конференции молодых ученых «Наука Технологии Инновации» (Новосибирск, 2008), всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Решетневские чтения» (Красноярск, 2006, 2007 гг.), всероссийской конференции творческой молодежи, посвященной дню космонавтики «Актуальные проблемы авиации и космонавтики» (Красноярск, 2007), а также на научных семинарах лаборатории систем цифровой обработки изображений СибГАУ.
Публикации. По результатам диссертационного исследования опубликовано 18 печатных работ, из них 4 статьи в изданиях, рекомендованных
ВАК для публикации результатов диссертационных исследований, 12 тезисов докладов, 2 свидетельства, зарегистрированных в Российском реестре программ для ЭВМ.
Структура работы. Работа состоит из введения, трех глав, заключения, библиографического списка и приложения. Основной текст диссертации содержит 106 страницы, изложение иллюстрируется 26 рисунками и 8 таблицами. Библиографический список включает 132 наименования.
Заключение диссертация на тему "Компьютерный метод локализации лиц на изображениях в сложных условиях освещения"
3.4 Выводы по главе
Рассмотрен разработанный экспериментальный комплекс по нелинейному улучшению изображений с последующей локализацией и распознаванием лиц на цветных изображениях. Приведены структурные схемы функционирования основных модулей и их функциональные характеристику Экспериментальный комплекс представляет собой модульное приложение состоящее из трех программных модулей: модуля нелинейного улучшещ^я изображений на основе сжатия динамического диапазона, модуля локализации лиц на основе цветовой информации и модуля распознавания лиц на основе метода главных компонент.
Проведено тестирование модуля локализации лиц на базе лиц Калифорнийского технологического института {Caltech Face Database), данная база включает 450 изображений фронтальных лиц (896x592) двадцати семи людей при различном фоне, условиях освещения и выражениях лиц. Таюьсе для тестирования использовались цветные изображения (640x480) получаемые с веб-камеры при различных условиях освещения. Тестирование проводилось, как с применением нелинейного улучшения изображения, так и без него. В результате исследований было получено, что усовершенствованный метод нелинейного улучшения изображений повышает точность цветовой сегментацию кожи в среднем на 3-5%,а распознавания лиц на 5-7%. Предложенные метрики в методе локализации лиц повышают точность сегментации кожи до 81-86%). При использовании улучшенных входных изображений лиц алгоритм распознавания показал точность распознавания 86-94% для базы лиц «ORL face database».
ЗАКЛЮЧЕНИЕ
В диссертационной работе исследовалась задача обработки, локализации и распознавания лиц в сложных условиях освещения.
Был проведен анализ методов и алгоритмов локализации и распознавания лиц. Были показаны причины, из-за которых локализация и распознавание лиц является сложной задачей машинного зрения, а именно, непрогнозируемые условия захвата изображений, разнообразие в положении и ориентации лиц на изображениях, геометрические и текстурные различия в связи с изменениями в выражении лица, возрастными изменениями, присутствием макияжа, очков, усов, а также частичным перекрытием лиц другими объектами сцены. Методы распознавания лиц делятся на три широкие категории: методы распознавания на основе общего представления лица, методы распознавания на основе локальных особенностей и гибридные методы, объединяющие свойства методов первой и второй категории.
Методы распознавания лиц на основе локальных особенностей используют свойства и геометрические отношения такие, как области, расстояния и углы между особыми точками изображения лица, и поэтому нуждаются в точном определении положения антропометрических точек. На текущий момент автоматические алгоритмы локализации антропометрических точек требуют больших вычислительных ресурсов или не обеспечивают достаточную точность локализации. Методы на основе общего представления лица обучаются с использованием независимого набора изображений лиц, пытаясь представить данный набор более эффективно с помощью перевода в подпространство меньшей размерности, что позволяет эффективно работать с большими базами лиц.
Существующие биометрические системы все больше для локализации и распознавания лиц начинают использовать трехмерные модели изображений лиц, однако для этого требуется применение специализированных устройств захвата, которые накладывают определенные ограничения на способ получения изображения, для некоторых устройств требуется неподвижность объекта во время сканирования, которое может достигать нескольких секунд и нейтральное выражение лица, что является не допустимым для систем, работающих в реальном режиме времени (интерфейс человек—компьютер, объектно-ориентированная компрессия видеоданных, видеонаблюдение и т. д.).
В диссертационной работе предложена модификация метода нелинейного улучшения, цветных изображений, отличающаяся от оригинального метода, применением модифицированной логарифмической функции с настраиваемым пороговым значением, позволяющей выравнивать яркость не только в теневых, но и в засвеченных участках изображения с повышением контраста в данных областях. Приведен способ перехода от логарифмического масштаба к динамическому диапазону изображения с использованием средней яркости улучшенного изображения и корректирующего коэффициента, определяемого экспериментальным путем, а также способ восстановления цветовых компонент пространства RGB для улучшенного изображения с применением яркостей пикселов улучшенного и оригинального изображения.
Также представлен усовершенствованный метод локализации лиц и выделения антропометрических точек, отличающийся использованием цветовой информации с учетом подстройки коэффициентов для различных цветовых пространств, позволяющий выполнять более точную сегментацию регионов кожи. Данный метод включает цветовую сегментацию кожи для улучшенного изображения с использованием определяющих правил для цветовых пространств YCbCr и нормализованного RGB, с последующим анализом полученных областей кожи. Каждая область подвергается морфологической обработке, сжатия с последующим расширением, что позволяет разъединить плохо связанные области с удалением шумов и небольших регионов, не представляющих интереса. В дальнейшем оценивается заполненность регионов пикселами кожи, вследствие чего отбрасываются регионы с малым содержанием пикселов кожи. Представлен процесс нахождение глаз в каждом регионе, с помощью оценки оттеночных цветовых компонент пространства YCbCr. Также предложена процедура нормализации положения лица на основе полученных координат центров глаз и использованием геометрической модели лица. Для распознавания лиц в работе использован; метод главных компонент, который использует статистическую информацию обучающей выборки с понижением размерности данных. Поскольку работа алгоритма осуществляется с изображениями, преобразования которых приводят к получению большой ковариационной матрицы, представлена методика, позволяющая существенно сокращать размерность ковариационной матрицы, вследствие чего уменьшаются вычислительные затраты на нахождение собственных векторов и собственных значений ковариационной матрицы. При этом получаются собственные векторы и значения такие же, как и в оригинальном методе главных компонент.
На основе предложенных методов разработан экспериментальный комплекс нелинейного улучшения изображений с последующей локализацией и распознаванием лиц на цветных изображениях. Комплекс представляет собой модульное приложение, состоящее из трех программных модулей: модуля нелинейного улучшения изображений на основе сжатия динамического диапазона, модуля локализации лиц на основе цветовой информации и модуля распознавания лиц на основе метода главных компонент.
Проведено тестирование модуля локализации лиц на базе лиц Калифорнийского технологического института (Caltech Face Database), данная база включает 450 изображений фронтальных лиц (896x592) двадцати семи людей при различном фоне, условиях освещения и выражениях лиц. Также для тестирования использовались цветные изображения (640x480) получаемые с веб-камеры при различных условиях освещения. Тестирование проводилось, как с применением нелинейного улучшения изображения, так и без него. В результате исследований было получено, что усовершенствованный метод нелинейного улучшения изображений повышает точность цветовой сегментацию кожи в среднем на 3-5%,а распознавания лиц на 5-1%. Предложенные метрики в методе локализации лиц повышают точность сегментации кожи до 81-86%. При использовании улучшенных входных изображений лиц алгоритм распознавания показал точность распознавания 86-94% для базы лиц «ORL face database».
Библиография Пахирка, Андрей Иванович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. База изображений лиц калифорнийского технического института Электронный ресурс. — Электрон, дан. — Режим доступа: http://www.vision.caltech.edu/archive.htrnl Загл. с экрана.
2. База изображений лиц AT&T Электронный ресурс. Электрон, дан. -Режим доступа: http://www.cl.cam.ac.Uk/Researcli/DTG/attarchive:pub/ data/att faces.tar.Z — Загл. с экрана.
3. Бекетова И.В., Каратеев C.JI., Визильтер Ю.В., Бондаренко A.B., Желтое С.Ю. Автоматическое обнаружение лиц на цифровых изображениях на основе метода адаптивной классификации AdaBoost // Вестник компьютерных и информационных технологий. 2007. №8. с.2—6.
4. Богуславский А. С++ и компьютерная графика. М.: КомпьютерПресс, 2003.- 352 с.
5. Борисов В. В., Круглов В. В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия-Телеком, 2001. - 382 с.
6. Брилюк Д.В., Старовойтов В.В. Распознавание человека по изображению лица и нейросетевые методы Электронный ресурс. Электрон, дан. - Режим доступа: http://daily.sec.ru/dailypblshow.cfrn?pid=4425 -Загл. с экрана.
7. Вежневец В.П. Локализация человеческого лица на цветном растровом изображении / В.П. Вежневец // Математические методы распознавания образов (ММРО-Ю):тр.конф. -2001.-е. 71-82
8. Вежневец В. Система управления курсором «мыши» при помощи движений головы пользователя / В. Вежневец, Р. Шоргин, А. Вежневец // Труды конф. по комп. графике и машинному зрению Graphicon-2006. -Новосибирск, 2006. С. 455-^158.
9. Глазунов А. Компьютерное распознавание человеческих лиц Электронный ресурс. — Электрон. дан. Режим доступа: http://\vww.osp.ru/os/2000/Q3/l 77945/ - Загл. с экрана.
10. Ю.Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. -Пер. с англ. М.: Техносфера. - 2006. - 1072 с.
11. П.Горелик A.JL, Скрипкин В.А. Методы распознавания Москва «Высшая школа» 2004 , с. 3-30.
12. Ерош И.Л., Сергеев М.Б., Соловьев Н.В. Обработка и распознавание изображений в системах превентивной безопасности: Учебное пособие. СПб.: ГУАП, 2006. - 153 с.
13. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и распознавание изображений // Распознавание, классификация, прогноз. Математические методы и их применение. Вып. 2. М.: Наука, 1989. - с. 5-72.
14. Иванов А. И. Нейросетевые алгоритмы биометрической идентификации личности. М: Радиотехника, 2004 .— 144 е.: ил.
15. Красильников H.H. Цифровая обработка изображений / H.H. Красиль-ников. М.: Вузовская книга, 2001. - 320 с.
16. Кухарев Г.А. Биометрические системы: Методы и средства идентификации личности человека./Г.А. Кухарев СПб.: Политехника, 2001. -240 с.
17. Местецкий Л.М. Математические методы распознавания образов. Курс лекций. М.: Ф-т ВМиК МГУ, кафедра ММП. - 2002.
18. Никулин Е. Компьютерная геометрия и алгоритмы машинной графики. Серия "Учебное пособие". СПб.: БХВ-Петербург, 2003. - 560 е.: ил.
19. Пахирка А. И. Применение метода улучшения изображений для систем распознавания лиц / А.И. Пахирка, // Вестник Сибирского государственного аэрокосмического университета имени академика М.Ф. Ре-шетнева. Вып. 3(29) в 3 частях, Красноярск, 2010. с. 25-29
20. Пахирка А.И. Модель улучшения цветных изображений на основе адаптивного выравнивания спектральных диапазонов/ М.Н. Фаворская, А.И. Пахирка // Системы управления и информационные технологии / ИЛУ РАН, ВГТУ, № 1 (39), М.-Воронеж, 2010. с. 23-26
21. Пахирка А.И. Алгоритм улучшения изображений, основанный на человеческом восприятии / А.И. Пахирка // Всероссийская научная конференция молодых ученых «Наука. Технологии. Инновации. НТИ-2009», Новосибирск, 2009. с. 219 221.
22. Пахирка А.И. Применение метода главных компонент при распознавании лиц / А.И. Пахирка // Международная конференция «Цифровая обработка сигналов и ее применение» г. Москва, 2009 г., с. 388-390.
23. Пахирка А.И. Методы понижения размерности данных при распознавании лиц / А.И. Пахирка // X междунар. науч.-техн. конф. «Теоретические и прикладные вопросы современных информационных технологий», Улан-Удэ, 2009. с. 475-478.
24. Пахирка А.И. Классификация методов распознавания лиц / А.И. Пахирка // Всероссийская научно-практическая конференция «Молодежь и современные информационные технологии» г. Томск, 2009 г., с. 307309.
25. Пахирка А.И. Модели локализации лиц на изображениях / М.Н. Фаворская, А.И., Пахирка // Системы управления и информационные технологии / ИПУ РАН, ВГТУ, № 3.3 (33), М.-Воронеж, 2008. с. 404-408.
26. Пахирка А.И. Локализация лиц людей, основанная на форме и цветовой сегментации / А.И. Пахирка // Межрегиональная научнопрактическая конференция «Молодежь Сибири науке России», СИБУП, Красноярск, 2008 г., с. 53-55.
27. Пахирка А.И. Подход к локализации лиц на изображении / А.И. Па-хирка // Всероссийская научная конференция «Наука Технологии Инновации», г. Новосибирск, 2008 г., с. 126—128.
28. Пахирка А.И. Разработка алгоритма нахождения лиц людей / А.И. Па-хирка // XII междунар. науч. конф. «Решетневские чтения», СибГАУ, Красноярск, 2008. с. 350-351
29. Пахирка А.И. Сегментация человеческой кожи для локализации лица на изображении / А.И. Пахирка// Всероссийская, науч. конф. «Молодеж и наука третье тысячелетие», II часть, Сост.: Сувейзда В.В.; КРО НС «Интеграция», — Красноярск, 2007. с. 402-406
30. Пахирка А.И. Проблемы сегментации объектов в видеопотоке / А.И. Пахирка, A.C. Шилов // Всероссийская, науч. конф. «Модели и методы обработки изображений ММОИ-2007». Красноярск, 2007. с. 67-70
31. Пахирка А.И. Цветовая сегментация изображений человеческой кожи / А.И. Пахирка, A.C. Шилов// XI междунар. науч. конф. «Решетневские чтения», СибГАУ, Красноярск, 2007.
32. Пахирка А.И. Система захвата и предварительной обработки видеопотока / A.C. Шилов, А.И. Пахирка // XI междунар. науч. конф. «Решетневские чтения», СибГАУ, Красноярск, 2007.
33. Пахирка А.И. Предварительная обработка изображений и их сегментация на основе преобразования Хафа/ A.C. Шилов, А.И. Пахирка // X междунар. науч. конф. «Решетневские чтения», СибГАУ, Красноярск, 2006.
34. Пахирка А.И., Фаворская М.Н., Система локализации лиц на основе цветовой сегментации кожи (FaceDetection). Зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 16 февраля 2009 г. (свидетельство №2009611010).
35. Пахирка А.И., Фаворская М.Н., Система нелинейного улучшения изображений (Nonlinear image enhancement). Зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 31 марта 2010 г. (свидетельство №2010612360).
36. Петров М.Н., Молочков В.П. Компьютерная графика: Учебник для вузов. СПб.: Питер, 2002. - 736 е.: ил.
37. Поляков А. Методы и алгоритмы компьютерной графики в примерах на Visual С++. Серия "Мастер". СПб.: БХВ-Петербург, 2002. - 416 е.: ил.
38. Распознавание лиц Электронный ресурс. Электрон, дан. - Режим доступа: http://face-rec.org/ — Загл. с экрана.
39. Рейнбоу В. Компьютерная графика. Энциклопедия. СПб.: Питер, 2003.-768 е.: ил.
40. Сергиенко А. Цифровая обработка сигналов: Учебник для вузов. — СПб.: Питер, 2002. 608 е.: ил
41. Сойфер В.А. Методы компьютерной обработки изображений. М.: "Физматлит", 2004. - 784 с.
42. Форсайт ДА., Понс Ж. Компьютерное зрение. Современный подход. : Пер. с англ. М: Издательский дом «Вильяме», 2004. - 928 с.
43. Шапиро Л. Компьютерное зрение / Л. Шапиро, Дж. Стокман; пер. с англ. М.: БИНОМ. Лаборатория знаний, 2006, - 752 с.
44. Шмаглит Л. А., Голубев М. Н., Игнатов И. С., Хрящев В. В, Выделение лиц на изображениях в условиях искажений // В материалах 11 международной конференции и выставке «Цифровая обработка сигналов и ее применение», Т.2, 2009. — с. 511—514.
45. Abate, F., Nappi, М., Riccio, D. and Sabatino, G. 2D and 3D face recognition: A survey // Pattern Recognition Letters, Vol.28, pp. 1885-1906, 2007.
46. Ahlberg, J. A system for face localization and facial feature extraction // Report LiTH-ISY-R- 2172, Linkping University, Sweden, 1999
47. Aitkenhead, M.J. and McDonald, A.J.S. A neural network face recognition system //Engineering Applications of Artificial Intelligence, vol. 16, no. 3, pp. 167-176, 2003
48. Barker, S.E., Powell, H.M. and Palmer-Brown, D. High speed face location at optimal resolution // World Congress on Neural Networks, Washington, DC, vol. 2, pp. 536-541, 1995
49. Behnke, S. Face localization in the neural abstraction pyramid // 7th International Conference on Knowledge-Based Intelligent Information and Engineering Systems, Oxford, UK, part II, pp. 139-146, 2003
50. Belhumeur, P.N., Hespanha, J.P. and Kriegman, DJ. Eigenfaces vs. Fisher-faces: recognition using class specific linear projection // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 19, no. 7, pp. 711-720, 1997
51. Bouchaffra, D. and Amira, A. Structural hidden Markov models for biometrics: Fusion of face and fingerprint //Pattern Recognition, Vol.41, pp.852867, 2008.
52. Bruneiii, R. and Poggio, T. Face recognition: features versus templates // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 15, no. 10, pp. 1042-1052, 1993
53. Bruneiii, R. and Poggio, T. Face recognition: features versus templates // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 15, no. 10, pp. 1042-1052, 1993
54. Chai, D., Phung, S.L. and Bouzerdoum, A. Skin color detection for face localization in humanmachine communications // 6th International Symposium on Signal Processing and its Applications, Kuala-Lumpur, Malaysia, 2001
55. Chen, L., Liao, H., Ko, M. and Yu, G. A New LDA-based Face Recognition System Which Can Solve the Small Samples Size Problem // Journal of Pattern Recognition, Vol.33, pp.1713-1726, 2000.
56. Danijela, V. and Maja, P. Fully automatic facial point detection using gabor feature based boosted classifiers // In Proceeding of IEEE International Conference on Systems, Man and Cybernetics, pp. 1692-1698, 2005
57. Delac, K., Grgic, M., Liatsis, P. Appearance-based Statistical Methods for Face Recognition // Proceedings of the 47th International Symposium ELMAR-2005 focused on MultimediaSystems and Applications, Zadar, Croatia, pp. 151-158, 2005
58. Eleyan and Demirel, H. Face Recognition System Based on PCA and Feedforward Neural Networks //in Computational Intelligence and Bioinspired Systems, Vol.3512, Lecture Notes in Computer Science: Springer Berlin / Heidelberg, pp.935-942, 2005
59. Gao, Y. and Leung, M.K.H. Face recognition using line edge map // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 6, pp. 764- 779, 2002
60. Garcia, C., Zikos, G. and Tziritas, G. Face detection in color images using wavelet packet analysis // IEEE International Conference on Multimedia Computing and Systems, Florence, Italy, vol.1, pp. 703-708, 1999
61. Garcia, C., Zikos, G. and Tziritas, G. Wavelet packet analysis for face recognition // Image and Vision Computing, vol. 18, no.,4, pp. 289-297, 2000
62. Hajati, F., Faez, K. and Pakazad, S. K. An efficient method for face localization and recognition in color images // In IEEE Conference on Systems, Man, and Cybernetics, Taipei, Taiwan, pp. 4214-4219, 2006.
63. Hsu, R.-L., Abdel-Mottaleb, M. and Jain, A.K. Face detection in color images // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 5, pp. 696-706, 2002
64. Jebara, T.S. and Pentland, A. Parametrized structure from motion for 3D adaptive feedback tracking of faces //IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Juan, Puerto Rico, pp. 144150, 1997
65. Jing, X. Y., Tang, Y. Y. and Zhang D. A Fourier-LDA approach for image recognition // Pattern Recognition, Vol.38, pp.453-457, 2005
66. Kambhamettu, C., Goldgof, D. B. and He, M. Determination of motion parameters and estimation of point correspondences in small nonrigid deformations // IEEE International Conference on Image Processing, pp 943-946, 1994
67. Kanade, T. Picture Processing System by Computer Complex and Recognition of Human Faces // Kyoto University, Japan, PhD. Thesis, 1973
68. Kepenekci, B. and Tek, F.B. Occluded face recognition based on Gabor wavelets // International Conference on Image Processing, Rochester, NY, vol. l,pp. 293-296, 2002
69. Kim, K. Intelligent Immigration Control System by Using Passport Recognition and Face Verification // in International Symposium on Neural Networks. Chongqing, China, pp. 147-156, 2005
70. Kirchberg, K.J., Jesorsky, O. and Frischholz, R.W. Genetic model optimization for Hausdorff distance-based face localization // International ECCV Workshop on Biometric Authentication, Copenhagen, Denmark, pp. 103111,2002
71. Kobayashi, H., Tange, K. and Hara, F. Real-time recognition of six basic facial expressions // Proceedings of the 4th IEEE International Workshop on Robot and Human Communication, pp 179-186, Tokyo, Japan, 1995
72. Kotropoulos, C. and Pitas, I. Rule-Based Face Detection in Frontal Views // Proc. Int'l Conf. Acoustics, Speech and Signal Processing, vol. 4, pp.253 72540, 1997
73. Kumar, A. P., Das, S., and Kamakoti, V. Face recognition using weighted modular principle component analysis // Neural Information Processing, Vol.3316, Lecture Notes In Computer Science: Springer Berlin / Heidelberg, pp.362-367, 2004
74. Lades, M. , Vorbriggen, J. C. Distortion invariant object recognition in the dynamic link architecture // IEEE Transactions on Computers, 42(3), pp. 300-311, 1993
75. Lawrence, S., Giles, C.L. and Tsoi, A.C. Convolutional neural networks for face recognition. // IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Francisco, CA, pp. 217-222, 1996
76. Leung, T.K., Burl, M.C. and Perona, P. Finding faces in cluttered scenes using random labeled graph matching // 5th International Conference on' Computer vision, Cambridge, MA, pp. 637-644, 1995
77. Li, M. and Yuan, B. 2D-LDA: A statistical linear discriminant analysis for image matrix // Pattern Recognition Letters, Vol.26, pp.527-532, 2005
78. Lien, J. J. Automatic recognition of facial expressions using hidden markov models and estimation of expression intensity // Robotics Institute, Carnegie Mellon Univeristy, Technical Report CMU-RI-TR-98-31, Ph.D. Dissertation, 1998
79. Lienhart, R., Kuranov, A. and Pisarevsky, V. Empirical analysis of detection cascades of boosted classifiers for rapid object detection // Technical report, Microprocessor Intel Research Lab, Santa Clara, CA, 2002
80. Lin, K.-H., Guo, B., Lam, K.-M and Siu, W.-C. Human face recognition using a spatially weighted modified Hausdorff distance // International Symposium on Intelligent Multimedia, Video and Speech Processing, Hong Kong, China, pp. 477-480, 2001
81. Lin, K.-H., Lam, K.-M. and Siu, W.-C. Locating the eye in human face images using fractal dimensions // IEEE Proceedings of Vision, Image and Signal Processing, vol. 148, no. 6, pp. 413-421, 2001
82. Lin, S.-H., Kung, S.-Y and Lin, L.-J. Face recognition/detection by probabilistic decision-based neural network // IEEE Transactions on Neural Networks, vol. 8, no. 1, pp. 114-132, 1997
83. Lin, S.-H., Kung, S.-Y and Lin, L.-J. Face recognition/detection by probabilistic decision-based neural network // IEEE Transactions on Neural Networks, vol. 8, no. 1, pp. 114-132, 1997
84. Liu, C. and Wechsler, H. A Gabor feature classifier for face recognition // 8th IEEE International Conference on Computer Vision, Vancouver, Canada, vol. 2, pp. 270-275, 2001
85. Liu, C. and Wechsler, H. Face recognition using shape and texture // IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Fort Collins, CO, vol. 1, pp. 598-603, 1999
86. Liu, C. and Wechsler, H. Gabor feature based classification using the enhanced Fisher linear discriminant model for face recognition // IEEE Transactions on Image Processing, vol. 11, no. 4, pp 467-476, 2002
87. Liu, C. and Wechsler, H. Independent component analysis of Gabor features for face recognition // IEEE Transactions on Neural Networks, vol. 14, no. 4, pp. 919-928, 2003
88. Liu, Q., Lu, H. and Ma, S. Improving Kernel Fisher Discriminant Analysis for Face Recognition // IEEE Transactions on Circuits and Systems for Video Technology, Vol.14, pp.42-49, 2004
89. Liu, Q., Tang, X., Lu, H. and Ma S. Kernel Scatter-Difference Based Discriminant Analysis for Face Recognition //in Proc. IEEE International Con-ferenceon Pattern Recognition, pp.419-422, 2004
90. Liu, W., Wang, Y., Li, S. Z. and Tan T. Null Space Approach of Fisher Discriminant Analysis for Face Recognition // Biometric Authentication, Vol.3087, Lecture Notes in Computer Science: Springer Berlin / Heidelberg, pp.32-44, 2004
91. Lu, J. W., Plataniotis, K. N. and Venetsanopoulos, A. N. Boosting Linear Discriminant Analysis for FaceRecognition // in Proceedings of IEEE International Conference on Image Processing, Vol.1, pp.657-660, 2003
92. Meng, J. and Zhang, W. Volume measure in 2DPCAbased face recognition // Pattern Recognition Letters, Vol.28, pp. 1203-1208, 2007
93. Monzo, D., Martin, A., Sastre, J. and Albiol, A. Face recognition using HOG-EBGM // Pattern Recognition Letters, Voi.29, pp. 1537-1543, 2008
94. Movellan, J. Visual speech recognition with stochastic networks // Advances in Neural Information Processing Systems, vol. 7, MIT Press, Cambridge, MA, pp 851-858, 1995
95. Nhat, V. D. M. and Lee, S. An Improvement on PCA Algorithm for Face Recognition // Advances in Neural Networks ISNN 2005, Vol.3498, Lecture Notes in Computer Science. Chongqing: Springer, pp. 1016-1021, 2005
96. Pang, Y. W., Zhang, L., Li, M. J., Liu, Z. K. and'Ma W. Y. A novel Gabor-LDA based face recognition method // in Advances In Multimedia Information Processing Pcm 2004, Pt 1, Proceedings, vol. 3331, Lecture Notes In Computer Science, pp.352-3 58, 2004
97. Pigeon, S. and Vandendrope, L. The M2VTS Multimodal Face Database // Proc.lst Int'l Conf. on Audio- and Video-Based Biometric Person Authentication, 1997
98. Sakai, Т., Nagao, M. and Fujibayashi, S. Line Extraction and Pattern Detection in a Photograph // Pattern Recognition, vol. 1, pp. 233-248, 1969
99. Samaria, F. S. and Young S.HMM-based architecture for face identification//Image and Vision Computing, 12(8), pp. 537-543, 1994
100. Samaria, F. S. Face recognition using Hidden Markov Models // Trinity College, University of Cambridge, Cambridge, UK, Ph. D. Thesis, 1994
101. Shen, L.J., Fu, H.C., Xu, Y.Y., Hsu, F.R., Chang, H.T. and Meng, W.Y. A principal component based probabilistic DBNN for face recognition // IEEE International Conference on Image Processing, vol. 3, pp. 499502, 1996
102. Shin, H., Kim, S. D. and Choi, H. C. Generalized elastic graph matching for face recognition // Pattern Recognition Letters, Vol.28, pp.1077— 1082, 2007
103. Sobottka, K. and Pitas, I. Face localization and feature extraction based on shape and color information // Proc. IEEE International Conference on Image Processing, Lausanne, Switzerland, pp. 483-486, 1996
104. Song, F., Zhang, D., Wang, J., Liu, H. and Tao, Q. A parameterized direct LDA and its application to face recognition // Neurocomputing, Vol.71, pp.191-196, 2007
105. Soriano, M., Martinkauppi, B. Adaptive skin color modeling using the skin locus for selecting training pixels // Pattern Recognition, Vol 36, pp. 681-690, 2003
106. Sun, N., Wang, H.-x., Ji, Z.-h., Zou, C.-r. and Zhao, L. An efficient algorithm for Kernel two-dimensional principal component analysis // Neural Computing and Applications, Vol.17, pp.59-64, 2008
107. Tan, K. R. and Chen, S. C. Adaptively weighted subpattern PCA for face recognition // Neurocomputing, Vol.64, pp.505-511, 2005
108. Turk, M.A. and Pentland, A.P. Face recognition using eigenfaces // IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Maui, HI, pp. 586-591, 1991
109. Vasilescu, M. A. O. and Terzopoulos, D. Multilinear Subspace Analysis of Image Ensembles // IEEE Int'l Conf. on Computer Vision and Pattern Recognition, pp.93-99, 2003
110. Vezhnevets, V., Sazonov, V. and Andreeva, A. A survey on pixel-based skin color detection techniques // GraphiCon, Moscow, Russia, pp. 85-92, 2003
111. Viola, P., Jones, M. Robust real-time face detection // International Journal of Computer Vision 57(2), pp. 137-154, 2004
112. Wang, X. and Tang, X. Dual-space Linear Discriminant Analysis for Face Recognition // IEEE International Conference on Computer Vision and Pattern Recognition, pp.564-569, 2004
113. Wijaya, S. L., Savvides, M. and Kumar, B. V. K. V. Illuminationtolerant face verification of low-bitrate JPEG2000 wavelet images with advanced correlation filters for handheld devices // Applied Optics, Vol.44, pp.655-665, 2005
114. Wiskott, L., Fellous, J.-M., Kr?ger, N. and von der Malsburg, C. Face recognition by elastic bunch graphmatching. // Intelligent Biometric Techniques in Fingerprint and Face Recognition, Chapter 11, pp. 355-396, 1999
115. Wu, H., Chen, Q. and Yachida, M. Face detection from color images using a fuzzy pattern matching method // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 21, no. 6, pp. 557-563, 1999
116. Xiong, H. L., Swamy, M. N. S. and Ahmad M. O. Two-dimensional FLD for face recognition // Pattern Recognition, Vol.38, pp.1121-1124,2005
117. Yang, J. and Zhang, D. Two-Dimensional PCA: A New Approach to Appearance-Based Face Representation and Recognition // IEEE Trans. Pattern Analysis and Machine Intelligence, Vol.28, pp.131- 137, 2004
118. Yang, M.-H., Kriegman, D.J. and Ahuja, N. Detecting faces in images: a survey // IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, no. 1, pp. 34-58, 2002
119. Yang, Q. and Ding, X. Q. Symmetrical Principal Component Analysis and Its Application in Face Recognition // Chinese Journal of Computers, Vol.26, pp.1146-1151, 2003
120. Yow, K.C. and Cipolla, R. Feature-based human face detection // Image and Vision Computing, vol. 15, no. 9, pp. 713-735, 1997
121. Yow, K.C. Automatic human face detection and localization,-Doctoral thesis, University* of Cambridge, UK, 1998
122. Yu, H. and Yang, J. A Direct LDA Algorithm for High-dimensional Data with Application to Face Recognition // Pattern Recognition, Vol.34, pp.2067- 2070, 2001
123. Zhang, D., Zhoua, Z.-H. and Chen, S. Diagonal principal component analysis for face recognition // Pattern Recognition, Vol.39, pp. 140-142,2006
124. Zhao, H. and Yuen, P. C. Incremental Linear Discriminant Analysis for Face Recognition // IEEE Transactions on Systems, Man and Cybernetics: PartB, Vol.38, pp.210-221, 2008.
125. Zhao, W., Chellappa, R., Rosenfeld, A. and Phillips, P.J. Face recognition: a literature survey // Technical Report CFAR-TR00-948, University of Maryland, 2002
126. Zhou, D. and Yang, X. Face Recognition Using Direct-Weighted LDA // 8th Pacific Rim International Conference on Artificial Intelligence. Auckland, New Zealand, pp.760-768, 2004
127. Zuo, F. and de With, P.H.N. Automatic human face detection for a distributed video security system // 3rd PROGRESS Workshop on Embedded Systems, Utrecht, the Netherlands, pp. 269-274, 2002
-
Похожие работы
- Распознавание лиц на телевизионных изображениях при наличии искажающих факторов
- Методы и алгоритмы локализации изображений маркировки промышленных изделий на основе рекуррентного поиска усредненного максимума
- Разработка и исследование модели знакового представления данных в задачах распознавания образов
- Алгоритмы распознавания лиц и жестов на основе вейвлет-преобразований и метода главных компонент
- Численные методы и программный комплекс анализа документальных портретных изображений
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность