автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения
Автореферат диссертации по теме "Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения"
О1
На правах рукописи
Голубев Максим Николаевич
РАЗРАБОТКА И АНАЛИЗ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ И КЛАССИФИКАЦИИ ОБЪЕКТОВ НА ОСНОВЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
Специальность 05.12.04 Радиотехника, в том числе системы и устройства телевидения
Автореферат
диссертации на соискание ученой степени кандидата технических наук
2 4 МАЙ 2012
Владимир - 2012
005044768
Работа выполнена на кафедре динамики электронных систем Ярославского государственного университета им. П.Г. Демидова
Научный руководитель:
доктор технических наук, профессор Брюханов Юрий Александрович
Официальные оппоненты: доктор физико-математических наук, профессор
Рау Валерий Георгиевич
кандидат технических наук Бухтояров Сергей Сергеевич
Ведущая организация:
ОАО «Ярославский радиозавод»
Защита диссертации состоится « 7 » июня 2012 г. в 14.00 часов на заседани диссертационного совета Д 212.025.04 при Владимирском государственно; университете имени Александра Григорьевича и Николая Григорьевича Столетовы по адресу: 600000, г. Владимир, ул. Горького, д. 87, ВлГУ, корп. 3, ФРЭМ1 ауд. 301.
С диссертацией можно ознакомиться в библиотеке Владимирског государственного университета имени Александра Григорьевича и Никола Григорьевича Столетовых.
Автореферат разослан« 3 » мая 2012 г.
Отзывы на автореферат, заверенные печатью, просим направлять по адресу: 600000, г. Владимир, ул. Горького, д. 87, ВлГУ, корп. 3, ФРЭМТ.
Ученый секретарь диссертационного совета доктор технических наук, профессор
А.Г. Самойло!
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Современный уровень научно-технического развития требует целенаправленного развития систем компьютерного зрения как одного из важных механизмов обеспечения эффективного взаимодействия техники с человеком. Одним из важнейших направлений компьютерного зрения является задача автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия.
Однако в реальных системах задачу распознавания объектов приходится решать в условиях наличия искажений, связанных с помехами в радиотехнических устройствах и сжатием двумерного сигнала. Поэтому для эффективного решения поставленной задачи требуется применение специализированных алгоритмов цифровой обработки изображений (ЦОИ), которая широко используется в системах телекоммуникаций, радио- и гидролокации, сейсмологии, робототехнике, радиоастрономии, медицине.
В настоящее время для устройств цифровой обработки изображений, характерно постоянное возрастание объема обрабатываемой информации, повышение требований к качеству обработки, работа в сложной сигнально-помеховой обстановке. Все это стимулирует появление новых методов и более сложных алгоритмов, используемых в системах ЦОИ. Среди них можно выделить нелинейные алгоритмы фильтрации и восстановления изображений, вейвлет-обработку, системы, построенные на нечеткой логике, генетических алгоритмах, нейронных сетях. Однако влияние таких алгоритмов на решение последующей задачи распознавания объектов на изображении изучено на сегодняшнем этапе развития данной области весьма слабо.
Основополагающие работы в области теории распознавания и классификации связаны с именами таких известных зарубежных ученых, как Нейман Дж., Пирсон К., Вальд А., Розенблат Ф. и др. Большой вклад в развитие теории распознавания и классификации внесли советские и, в последующем, российские ученые: Айзерман М.А., Браверман Э.М., Розоноэр Л.И. (метод потенциальных функций), Вапник В.Н., Червоненкис А .Я. (статистическая теория распознавания, летод «обобщенный портрет»), Ивахненко А.Г. (метод группового учета фгументов), Журавлев Ю.И., Галушкин А.И.
Среди объектов для распознавания и классификации наиболее развитой и исгуальной задачей является детектирование и классификация человеческих лиц. В шстоящее время эта задача находит применение в различных сферах человеческой 1еятелыюсти (в первую очередь, в системах безопасности). Сферами применения распознавания лиц являются, например, системы охранного телевидения, сравнение фотографий на паспортах или водительских удостоверениях, контроль доступа к ¡езопасным компьютерным сетям и оборудованию в учреждениях, верификация юльзователя при проведении финансовых транзакций, наблюдение за аэропортами I вокзалами для предотвращения террористических актов и многие другие. Во всех »тих приложениях требуется корректно устанавливать личность, как по отдельному :татическому изображению лица, так и на видеопоследовательности. В большинстве
практических ситуаций анализ входного изображения должен осуществляться в режиме реального времени.
Для построения полностью автоматизированных технических систем для распознавания лиц, которые будут анализировать информацию, содержащуюся в изображении лица, требуются робастные и эффективные алгоритмы выделения лиц, учитывающие наличие возможных помех и искажений. Это очень сложная задача, поскольку лицо является неоднородным объектом и обладает высокой степенью изменчивости размера, формы, цвета и текстуры. Поскольку большинство изображений, с которыми работают такие системы, являются цветными, то задача детектирования на таких изображениях может быть решена более уверенно, если использовать информацию из всех цветовых каналов. Кроме того, для увеличения надежности процесса распознавания может быть использована такая дополнительная информация, как возраст, пол, расовая принадлежность, выражение лица.
Основной цслыо работы является разработка и исследование новых алгоритмов детектирования и классификации объектов на полутоновых и цветных изображениях в условиях наличия искажений, связанных с помехами в радиотехнических устройствах.
Для достижения указанной цели в диссертационной работе решаются следующие задачи:
- разработка алгоритмов детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки;
- усовершенствование работы алгоритмов детектирования лиц с использованием информации о цвете;
- разработка новых алгоритмов гендерной классификации по цифровому изображению лица для решения ряда практических задач в области современных систем телевидения.
Объектом исследования являются алгоритмы детектирования и классификации объектов, применяемые в радиотехнических системах распознавания изображений и современных системах телевидения.
Предметом исследования являются модификация, оптимизация и разработка алгоритмов на основе методов машинного обучения с целью эффективного решения задач распознавания.
Методы исследования. При решении поставленных задач использовались современные методы цифровой обработки изображений, распознавания образов, машинного обучения, математического анализа, теории вероятностей. Для практической реализации алгоритмов применялись современные численные методы и методы объектно-ориентированного программирования на языке С#. Научная новизна
В рамках данной работы получены следующие новые научные результаты:
1. Разработаны новые алгоритмы детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки.
2. Разработана модификация алгоритмов детектирования лиц с использованием информации о цвете.
3. Разработан новый алгоритм тендерной классификации по изображению лица на основе адаптивных признаков и метода опорных векторов. Практическая значимость
1. Проведен анализ работы алгоритмов детектирования лиц при наличии искажающих факторов и предложены рекомендации по их устранению, позволившие повысить уровень выделения в среднем на 20-30%.
2. Разработаны модификации алгоритма детектирования лиц на базе бустинга путем использования информации о цвете, позволившие снизить уровень ложных срабатываний более чем в 2 раза.
3. Разработан и исследован алгоритм тендерной классификации на основе адаптивных признаков и метода опорных векторов для решения ряда практических задач в области современных систем телевидения. Результаты работы внедрены в соответствующие разработки
ООО «А-ВИЖИ», ОАО «СеверТрансКом», г. Ярославль. Отдельные результаты диссертационной работы внедрены в учебный процесс ЯрГУ им. П.Г. Демидова в рамках дисциплин «Цифровая обработка изображений» и «Компьютерное зрение», а также в научно-исследовательские работы при выполнении исследований в рамках гранта «Развитие нелинейной теории обработки сигналов и изображений в радиотехнике и связи» (Программа «Развитие научного потенциала высшей школы (2009-2010 годы)», №2.1.2/7067). Все результаты внедрения подтверждены соответствующими актами.
Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.
Апробация работы. Результаты работы докладывались и обсуждались на следующих научно-технических конференциях и семинарах:
- 65-66-я научные сессии, посвященные Дню радио, Москва, 2010-2011.
- Международная научно-техническая конференция «Проблемы автоматизации и управления в технических системах», Пенза, 2009.
- 15-я международная научно-техническая конференция «Радиоэлектроника, электротехника и энергетика», Москва, 2009.
- 11-12 и 14-я международные конференции «Цифровая обработка сигналов и ее применение», Москва, 2009-2010,2012.
- Двадцатая международная конференция по компьютерной графике и зрению «ГрафиКон'2010», Санкт-Петербург, 2010.
- 13-14-я всероссийская научно-техническая конференция «Нейроинформатика», Москва, 2011-2012.
- 9-10-я всероссийская научная конференция «Нейрокомпьютеры и их применение», Москва, 2011-2012.
Публикации. По теме диссертации опубликовано 17 научных работ, из них 2 статьи в журналах, рекомендованных ВАК («Проектирование и технология электронных средств», «Радиотехника») и 15 докладов на научных конференциях. Получено свидетельство о государственной регистрации программ для ЭВМ.
Структура и объем работы. Диссертация состоит из введения, пяти разделов, заключения, сгтска использованных источников, содержащего 247 наименований, и 1 приложения. Она изложена на 206 страницах машинописного текста, содержит 68 рисунков и 22 таблицы.
Основные научные положения и результаты, выносимые на защиту:
1. Алгоритмы детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки.
2. Модификации алгоритмов детектирования лиц с использованием информации о цвете.
3. Алгоритм тендерной классификации на основе адаптивных признаков и метода опорных векторов.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность выбранной темы, сформулироваЕШ цель и задачи исследования, изложены основные положения, выносимые на защиту, показаны научная новизна и практическая значимость работы.
В первой главе проведен обзор существующих методов выделения лиц на неподвижных полутоновых и цветных изображениях.
На современном этапе развития все методы классифицируются на 4 категории. Некоторые методы находятся на границе категорий.
1. Методы, основанные на знаниях. Эти методы основаны на правилах, которые описывают человеческие знания о том, что собой представляет типичное человеческое лицо. Обычно эти правила охватывают взаимосвязи между признаками лица.
2. Методы на основе инвариантных свойств. Целью этих алгоритмов является нахождение структурных признаков, которые сохраняются даже при изменении положения головы, точки наблюдения или условий освещенности, и последующее использование этих признаков для нахождения лиц.
3. Методы сравнения с шаблоном. Несколько стандартных шаблонов лица хранятся для его описания или некоторых его признаков. Для детектирования вычисляется корреляция между входным изображением и хранимыми шаблонами.
4. Методы на основе обучения. В отличие от методов сравнения с шаблоном модели (или шаблоны) получаются путем обучения на наборе тренировочных изображений, который должен охватывать широкий набор возможных изменений лица. Эти обученные модели затем используются для детектирования.
Существуют стандартные наборы изображений для тестирования алгоритмов детектирования лиц. Однако большинство из них содержат полутоновые изображения. Другие наборы являются закрытыми и отсутствуют в свободном доступе. Поэтому для проведения экспериментов была составлена собственная база изображений, состоящая из 50 цветных изображений, разрешения 768x576 пикселей, суммарно содержащая 213 лиц.
Во второй главе рассмотрена задача детектирования лиц в условиях сложной сигнально-помеховой обстановки и делается попытка устранения шумов и помех путем использования фильтрации цифровых изображений с целью повышения уровня выделения.
Для тестирования были выбраны три современных алгоритма выделения лиц на базе обучения. Первый алгоритм, предложенный П. Виолой и М. Джонсом, использует процедуру обучения, основанную на бустинге. Второй алгоритм базируется на обучающей сети SNoW (Sparse Network of Winnows). Третий алгоритм основан на методе опорных векторов (MOB).
Установлено, что на неискаженных изображениях лучший результат по уровню выделения лиц показал алгоритм на базе SNoW - 87,3%. На втором и третьем местах находятся алгоритмы на базе бустинга (82,6%) и MOB (62,4%) соответственно.
На рис. 1 представлены графики зависимостей уровня выделения алгоритмов детектирования лиц от различных искажающих факторов. Рассмотрено влияние трех видов шумов (гауссов, импульсный биполярный, импульсный со случайными значениями импульсов) и сжатие JPEG (артефакты блочности).
Результаты проведенных экспериментов показали, что алгоритм на базе бустинга более устойчив к искажениям всех типов. Он значительно превосходит другие тестируемые алгоритмы по среднему уровню выделения при внесении гауссова и импульсного шумов (~ на 33%), а также при сжатии JPEG (~ на 20%).
к
(В) (Г)
Рис. I. Влияние искажающих факторов на уровень выделения алгоритмов детектирования лиц: (а) гауссов шум; (б) биполярный импульсный шум; (в) импульсный шум со случайными значениями импульсов; (г) сжатие JPEG
(д) Выделение лиц после фильтрации шума (е) Выделение лиц после фильтрации шума
фильтром Винера фильтром на базе МГК
Рис. 3. Визуальное сравнение работы алгоритма выделения лиц на базе 8Ыо\У при различных условиях Сначала в изображения вносился гауссов шум с нулевым математическим ожиданием и различным среднеквадратическим отклонением (СКО) (рис. Зв). Для фильтрации были выбраны следующие алгоритмы: билатеральный фильтр (рис. Зг), фильтр Винера (рис. Зд), фильтр на базе метода главных компонент (МГК) (рис. Зе).
(б) Выделение
(в) Выделение лиц в условиях наличия шума
(т) Выделение лиц после фильтрации шума
цтор тестовых ил>праженни
Внесение ш\ма
НаГтр шнорщлты фил ырации —► Фильтрация ш\ма
■ 11а(>ор шнорньмо» шлделепнк лиц - >■ Пыделсиислии
Анализ работы ■хп оригмок
Рис. 2. Схема тестирования
Проведенный анализ показывает, что наличие шума значительно ухудшает результаты работы алгоритмов выделения лиц на изображениях. Поэтому далее рассматривается возможность
увеличения среднего уровня выделения лиц за счет применения алгоритмов цифровой фильтрации в качестве предобработки. Для тестирования использовалась схема,
Аналогичные исследования проведены для импульсного шума со случайными значениями импульсов. Для фильтрации использовались классический медианный фильтр, направленный взвешенный медианный фильтр и равно групповой фильтр.
В результате фильтрации гауссова шума достигнуто увеличение среднего уровня выделения лиц алгоритма на базе SNoW и алгоритма на базе MOB при использовании фильтра на базе МГК на 31% и 10,5% соответственно. В результате фильтрации импульсного шума достигнуто увеличение среднего уровня выделения лиц алгоритма на базе SNoW и алгоритма на базе MOB при использовании медианного фильтра на 13,5% и 12,6% соответственно; применение направленного взвешенного медианного фильтра и равногруппового фильтра позволяет увеличить средний уровень выделения алгоритма на базе бустинга на 5%.
В третьей главе предложена модификация алгоритма на базе бустинга
(рис. 4), который показал наилучшие результаты на предыдущем этапе
исследований, путем использования информации о цвете.
Выделенные _
изображению
Исходное
изображение ->
Алгоритм Viola-Jones области
:
Детектирование кожи
Лица
Нелица
Рис. 4. Схема работы модифицированного алгоритма на базе бустинга
исходному применяется алгоритм выделения лиц, на выходе которого получается набор выделенных областей. Затем эти области поступают на вход алгоритма детектирования кожи,
который и принимает окончательное решение о том, к какому классу относится та или иная область. Таким образом, делается попытка уменьшить число ошибок второго рода путем использования информации о цвете, которая наряду с информацией о яркости пикселей присутствует в полноцветных изображениях.
В качестве детектора кожи использовались два алгоритма:
Алгоритм 1: Явное задание кластера кожи.
Использует классификатор, который определяется явными численными правилами, ограничивающими кластер цвета кожи в пространстве RGB. Пиксель (R, G, В) относится к коже, если для него выполнены все следующие условия:
™>?—'—т—т—.—•—.—:—V—г; ft >95 (7 >40 И >20 .
Рис. 5. Зависимости уровня выделения и уровня ложных срабатываний от параметра STDR
тах{Я, С, В}-тт{Я, С, В} > 15
Простота классификатора и применение его только к областям-кандидатам позволили сократить количество ошибок второго рода в алгоритме детектирования лиц, практически не увеличив
вычислительную нагрузку.
Доля пикселей, которая должна
быть детектирована как кожа, чтобы алгоритм отнес данное окно к классу лиц, задается в параметре STDR (Skin Tone Detection Rate). Как следует из графиков, представленных на рис. 5, оптимальным является STDR около 0,4.
Алгоритм 2: Непараметрическая модель кожи.
Второй подход использует разработанный автором алгоритм и относится к непараметрическим моделям распределения оттенка кожи. Он основан на вычислении вероятности принадлежности к оттенку кожи каждой точки дискретизированного цветового пространства.
Можно выделить следующие основные этапы работы алгоритма:
1. Масштабирование изображения до размеров 150x150 пикселей.
2. Переход от цветового пространства RGB к пространству KiK2K3, которое представляет собой куб в исходном пространстве, размеры которого в 5 раз меньше исходного.
3. Для каждого пикселя изображения вычисление вероятности того, что он принадлежит одному из оттенков кожи.
4. Сравнение полученных значений с эмпирически найденными порогами.
В табл. 1 представлены результаты сравнения обоих алгоритмов. В скобках
указано количество выделенных областей. Видно, что предлагаемый алгоритм показывает на 9% меньше ложных срабатываний по сравнению с первым алгоритмом при большем уровне детектирования (наЗ%).
Однако база лиц, на которой были получены результаты, представленные в табл. 1, содержит, в основном, лица европейской расы. Для исследования робастносгги детекторов кожи к изменению ее оттенка были составлены три базы лиц, содержащих изображения людей трех расовых ветвей.
Как видно из представленных результатов (табл. 2) алгоритм на основе явного задания кластера кожи успешно справляется со своей задачей на изображениях из первых двух баз (южноазиатской и американской). Его использование приводит к небольшому уменьшению уровня выделения в среднем на 2-3%, однако при этом уровень ложных срабатываний уменьшается ==27,7%. Но на базе представителей африканской, расы он показывает значительно худшие результаты по уровню выделения (уменьшение на 25,2,4%). Это связано с тем, что данный оттенок кожи плохо вписывается в тот кластер кожи, который жестко задан в данном алгоритме. Выигрыш по уровню ложных срабатываний здесь также меньше и составляет 11,71%.
Таблица 1
Сравнепие результатов работы алгоритмов детектирования кожи
Тестируемый алгоритм Уровень выделения Уровень ложных срабатываний
Только яркость 92% (217) 51% (230)
Явное задание кластера кожи 8ТО11 = 0,4 85% (201) 26 %(72)
Непараметрическая модель кожи 88 %(209) П%(44)
Результаты выделения лиц после использования детектора кожи
Таблица 2
База лиц Явное задапие кластера кожи STDR = 0,4 Непараметрическая модель кожи
Уровень выделения Уровень ложных срабатываний Уровень выделения Уровень ложных срабатываний
Южиоазпатская 85,59% (95) 18,80% (22) 89,19% (99) 37,74% (60)
Американская 98,36% (60) 25,00% (20) 100,00% (61) 46,49% (53)
Африканская 66,02% (б8) 28,42% (27) 90,29% (93) 33,57% (47)
Второй алгоритм - на основе непараметрической модели кожи — показал более скромные результаты по уменьшению уровня ложных срабатываний. По всем трем базам выигрыш составил в среднем 7,2%. Это связано с тем, что пороги для всех оттенков кожи были настроены на максимальное сохранение лиц, что и было успешно достигнуто. Для первых двух баз уровень выделения остался тем же, что 5ыл до использования детектора кожи, для третьей базы уменьшение составило менее 1%. Таким образом, данный алгоритм устойчив к изменениям оттенка кожи и позволяет успешно бороться с ложными срабатываниями без негативного влияния на уровень выделения.
В четвертой главе предложен алгоритм распознавания пола на основе адаптивных признаков и метода опорных векторов (АП-МОВ) для работы в современных системах телевидения. Проведено сравнение предложенного алгоритма с другими алгоритмами — классическим методом опорных векторов (MOB) и алгоритмом на базе линейного дискриминантного анализа (KDDA).
Алгоритм АП-МОВ включает в себя следующие шаги (рис. б): преобразование
цветового пространства,
( Входное изображение A^f J
Преобразование RGB-у HSV
X
Масштабирование YxY->NxN
I
п
Вычисление набора признаков
{п™}=jxE-ci-xc; '1
MOB классификатор
i±zll
м
X
Решение (мужчина / женщина) ^
Рис. 6. Схема работы алгоритма АП-МОВ
масштабирование, вычисление набора адаптивных признаков и классификацию методом опорных векторов с применением ядерного преобразования. Данные, необходимые для вычисления признаков и классификации, получаются в результате обучения классификатора. Обучение
классификатора АП-МОВ содержит в себе два независимых этапа:
- генерация признаков;
- формирование и оптимизация классификатора на базе MOB.
Процедура генерации признаков содержит следующие основные шаги:
- преобразование цветового пространства обучающих фрагментов RGB —* HSV (далее все операции выполняются независимо для каждой
цветовой компоненты);
- масштабирование обучающих фрагментов до единого разрешения N х Л';
- генерация по случайному закону матрицы коэффициентов С™";
- вычисление признака для каждого обучающего фрагмента как суммы по строкам и столбцам поэлементного произведения матрицы изображения на матрицу
N N
- вычисление целевой функции оптимизации как отношения квадрата разности средних значений признака, вычисленных для наборов обучающих изображений
„ г ({{пП,)~({пГ}ж)У
«мужчин» и «женщин», к сумме их дисперсии: = —-'—5---!—,
а{П, }м + а{П,у}ж
- далее в цикле итеративно (до достижения фиксированного максимального числа итераций): генерация по случайному закону матрицы С™1'внутри фиксированной окрестности матрицы С,ЯСТ , вычисление признака Дда>'для каждого обучающего фрагмента и вычисление целевой функции Р, переход в новую точку (^-»ЛС-^С), если ?>Р;
- сохранение по истечении некоторого заданного числа итераций матрицы коэффициентов ;
- переход к генерации следующего г + 1 признака.
Для задачи обучения и тестирования тендерного классификатора была составлена собственная база изображений, набранная из различных источников. На рис. 7 показаны примеры изображений из этой базы. На каждом изображении из базы алгоритмом на базе бустинга были выделены лица. Затем вручную были удалены ложные выделения и сформирована база выделенных фрагментов, содержащая 10500 изображений (по 5250 на каждый класс). Эта база была разделена на три независимых выборки: обучающую, контрольную и тестовую.
Рис. 7. Примеры изображений мужчин и женщин из собственной базы лиц
Результаты тестирования
классификаторов АП-МОВ, MOB и KDDA представлены на рис. 8 и в табл. 3. Анализ результатов тестирования показывает, что наиболее эффективным как с точки зрения качества распознавания, так и с точки зрения быстродействия, является классификатор АП-МОВ: он показал самый высокий уровень верного распознавания среди всех трех алгоритмов — 79,6%, и превзошел классификаторы MOB и KDDA по скорости работы в 1,44 раза.
Такое преимущество объясняется тем, что классификатор АП-МОВ работает с небольшим набором адаптивных тризнаков, каждый из которых несет в себе всю необходимую информацию об анализируемых классах, в то время как алгоритмы MOB и KDDA работают с гигантским массивом значений пикселей, каждый из которых несет в себе недостаточную информацию для разделения классов.
Таблица 3
Сравнительный анализ основных показателей тестируемых алгоритмов распознавания пола
-——Алгоритм Параметр ~~~~~___________ ¡/ровень распознавания M Верно OB Неверно Ю Верно IDA Неверно AIT Верно MOB Неверно
Распознано мужчин, % 80 20 75,8 24,2 80 20
Распознано женщин, % 75.5 24,5 65,5 34,5 79,3 20,7
Общий уровень распознавания,% 77,7 22,3 69,7 30,3 79,6 20,4
Пыстродействие, фрагментов / сек 44 45 65
Пятая глава носит практический характер и посвящена описанию научно-исследовательской среды для детектирования и распознавания объектов на цифровых изображениях Recognition. Lab.
Описанные в предыдущих главах алгоритмы детектирования лиц и классификации пола получили программную реализацию в научно-исследовательской среде под названием Recognition.Lab. В качестве объектов четектирования помимо лиц могут выступать также отдельные особенности лица (глаза, нос, рот) и фигура человека. Кроме того, в программе существует гозможность добавления новых классов объектов без необходимости перекомпиляции приложения.
Инструменты Recognition.Lab позволяют:
открывать изображения различных форматов (.bmp, .jpg, .png и др.); оценивать качество работы алгоритмов детектирования объектов;
iCKMWSCGD7oe03;iCC FPU, %
Рис. 8. ROC-кривые тестируемых алгоритмов распознавания пола
- для детектированных объектов класса «Лицо» выполнять классификацию пола;
- проводить исследования в реальном времени, получая изображения с веб-камеры.
Для работы программы (рис. 9а) необходимо предоставить следукщие входные данные:
1) выбрать изображение, на котором будут выделяться объекты;
2) задать объекты, которые требуется выделить на данном изображении;
3) определить параметры детектирования или использовать значения по умолчанию (рис. 96).
Рассмотрена процедура добавления нового класса объектов детектирования на примере детектора объектов класса «Самолет».
Рис. 9. Программа Яесо^гпШопХаЬ: а) основное окно; б) окно параметров для объекта класса «Лицо»
Для обучения каскада используется утилита орепсу_11аа11гатт£. Новые объекты в программу Recognition.Lab добавляются через файл С^отЗеШпцз.хт!. Данный файл создается автоматически при первом открытии окна параметров. Описание объекта класса «Самолет» выглядит следующим образом:
<0е1ес1:1о.пвазе>
<Нате>Самолет</Кате>
<Сазсас1еГ11еНате>Ьаагсазсас[е_а1гр1апе. хт1</СазсасЗеГ11еЫате>
<IsDetectec^>true</IsDetected>
<Ргорег1:±ез>
<Сазсас1еГ:11е8>
<string>haarcascade_airplane. хт1</з1;гд.пд> </СазсайеП1ез>
<FrameColor>
<A>255</A> <R>255</R> <G>20</G> <B>147</B> <ScA>K/ScA> <ScR>l</ScR> <ScG>0.00699541</ScG> <ScB>0. 291770.637</ScB> </FrameColor>
<FrameThicknes s>5</FrameThickness> <Scale>l.1</Scale> </Properties> <Children /> </DetectionBase>
После того как объект прописан в файл Сизгот8еинщ5.хт1, он появляется в окне параметров и может быть детектирован на изображениях (рис. 10).
I ........ ' "' I . . .
Рис. 10. Детектирование нового объекта в программе Recognition.Lab
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
На основании проведенных исследований в области распознавания изображений в работе получены следующие результаты:
1. Проведено сравнение трех современных алгоритмов выделения лиц на изображениях на базе обучения.. Это алгоритмы на базе процедуры бустинга, на базе обучающей сети SNoW и на базе метода опорных векторов. Лучший результат по уровню выделения лиц на неискаженных изображениях показал алгоритм на базе SNoW - 87,3%. На втором и третьем местах алгоритмы на базе бустинга (82,6%) и MOB (62,4%) соответственно.
2. Исследовано влияние на работу тестируемых алгоритмов нескольких типов искажений: гауссов шум, импульсный шум, размытие и сжатие JPEG. Результаты проведенных экспериментов показали, что алгоритм, на базе бустинга более устойчив к искажениям всех типов. Он значительно превосходит другие тестируемые алгоритмы по среднему уровню выделения при внесении гауссова и импульсного шумов (~ на 33%), а также при сжатии JPEG на 20%). При размытии алгоритм на базе бустинга уступает по среднему уровню выделения 6,6% алгоритму
на базе SNoW, однако при этом он допускает в 4 раза меньше ошибок классификации.
3. Разработана модификация для алгоритма выделения лиц на основе детектора пикселей кожи. Применение детектора кожи позволяет уменьшить количество ложных срабатываний на цветных изображениях при небольшом уменьшении уровня выделения. Проведено сравнение двух алгоритмов детектирования кожи. Это алгоритм, использующий явное задание кластера кожи и алгоритм, использующий непараметрическую модель кожи. Алгоритм, использующий явное задание цвета кожи, ограничен одной областью цветовых оттенков. Предлагаемый автором алгоритм является более гибким, и его работа определяется набором обучающих изображений. Он показывает на 9% меньше ложных срабатываний при большем уровне детектирования (на 3%).
4. Предложен алгоритм классификации изображений на базе адаптивных признаков и метода опорных векторов для работы в современных системах телевидения, решающий задачу распознавания пола людей по изображению лица с точностью порядка 80%. Результаты тестирования показывают, что предлагаемый алгоритм превосходит другие рассматриваемые алгоритмы по всем основным параметрам. Его уровень верного распознавания составил 79,6%, что на 1,9% больше, чем у классификатора MOB и на 9,9% больше, чем у алгоритма KDDA. Количество фрагментов, обрабатываемых АП-МОВ в секунду, составило 65, что в 1,44 раза больше по сравнению с другими тестируемыми алгоритмами.
5. Адаптивный характер генерации набора признаков в процедуре обучения АП-МОВ позволяет использовать данный классификатор для распознавания любых других объектов, находящихся на изображении (помимо лиц). Для этого необходимо лишь сформировать обучающий набор фрагментов для каждого рассматриваемого класса и переобучить классификатор в соответствии с методикой, приведенной в работе.
6. Для демонстрации работы описанных алгоритмов и проведения дальнейших исследований по данной тематике создана научно-исследовательская среда для детектирования и распознавания лиц Recognition.Lab.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Статьи в журнала* из перечпя ВАК
1. Приоров А.Л., Игнатов И.С., Голубев М.Н., Хрящев В.В. Разработка и анализ алгоритма выделения лиц на изображениях // Проектирование и технология электронных средств. 2008. №2. С. 58-62.
2. Голубев М.Н., Приоров А.Л., Хрящев В.В. Удаление импульсного шума со случайными значениями импульсов из изображений // Радиотехника. 2010. №5. С. 72-78.
Материалы российских и международных конференций
3. Голубев М.Н., Игнатов И.С., Студенова A.A., Шмаглит Л.А. Повышение эффективности алгоритмов выделения лиц на цифровых изображениях // Сб. тр. научн.-техн. семинара «Системы синхронизации, формирования и обработки сигналов для связи и вещания». Ярославль, 2008. С. 3-5.
4. Тарасова Д.А., Тихонова Т.С., Голубев М.Н. Предварительная обработка изображений в задаче распознавания // Тез. докл. 15-й междунар. науч.-тех. конф. «Радиоэлектроника, электротехника и энергетика». М., 2009. Т. 1. С. 27-28.
5. Шмаглит JI.A., Голубев М.Н., Игнатов И.С., Хрящев В.В. Выделение лиц на изображениях в условиях искажений // Докл. 11-й междунар. конф. «Цифровая обработка сигналов и ее применение». М., 2009. Т. 2. С. 511-514.
6. Голубев М.Н., Хрящев В.В., Шмаглит JI.A. Об одном алгоритме распознавания лиц на изображениях // Тр. междунар. науч.-техн. конф. «Проблемы автоматизации и управления в технических системах». Пенза, 2009. С. 358-362.
7. Голубев М.Н., Апапьков И.В. Устранение ложных срабатываний в алгоритме выделения лиц на изображении // Докл. 12-й междунар. конф. «Цифровая обработка сигналов и ее применение». М., 2010. Т. 2. С. 302-304.
8. Шмаглит J1.A., Голубев М.Н. Использование информации о цвете в алгоритме выделения лиц на изображениях // Матер. 20-й междунар. конф. по компьютерной графике и зрению «ГрафиКон'2010». СПб., 2010. С. 331-332.
9. Апальков И.В., Голубев М.Н., Игнатов И.С. Архивирование изображений па основе стандарта JPEG2000 с возможностью распознавания лиц // Тр. LXV науч. сессии, посвященной Дню Радио. М., 2010. С. 207-209.
10. Тарасова Д.А., Голубев М.Н., Игнатов И.С. Модификация алгоритма выделения лиц на изображениях // Матер, шестьдесят третьей региональной научно-технической конференции студентов, магистров и аспирантов выспгих учебных заведений с международным участием, посвященная 1000-летию Ярославля. Ярославль, 2010. С. 224-225.
11. Голубев М.Н. Сравнительный анализ алгоритмов распознавания лиц на изображениях // Матер. XV всерос. науч.-техн. конф. студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и образовании». Рязань, 2010. С. 357-359.
12. Голубев М.Н. Использование информации о цвете в алгоритме выделения лиц на базе бустинга // Сб. науч. труд. 13-й всерос. науч.-техн. конф. «Нейроинформатика-2011». М., 2011. Ч. 3. С. 55-62.
13. Голубев М.Н., Шмаглит JI.A., Приоров А.Л. Сравнительный анализ алгоритмов выделения лиц на изображениях при наличии нормального шума // Тез. докл. IX всерос. науч. конф. «Нейрокомпьютеры и их применение». М., 2011. С. 37.
14. Голубев М.Н., Брюханов Ю.А. Исследовательская среда PicLab.Signage.Demo: обзор возможностей // Тр. LXVI науч. сессии, посвященной Дню Радио. М., 2011. С. 350-353.
15. Голубев М.Н., Шмаглит Л.А., Ганин А.Н. Разработка и анализ системы автоматического распознавания пола людей по изображению лица // XIV всерос. науч.-техн. конф. «Нейроинформатика-2012». М., 2012. С. 151-159.
16. Голубев М.Н., Ганин А.Н., Шмаглит Л.А. Алгоритм распознавания пола на основе адаптивных признаков и метода опорных векторов // X всерос. науч.-техн. конф. «Нейрокомпьютеры и их применение». М., 2012. С. 33.
17. Шмаглит Л.А., Голубев М.Н., Ганин А.Н., Хрящев В.В. Тендерная классификация по изображению лица // Докл. 14-й междунар. конф. «Цифровая обработка сигналов и се применение». М., 2012. Т. 2. С. 425-428.
Свидетельство о государственной регистрации программ для ЭВМ 18. Голубев М.Н., Аминова Е.А., Ганин А.Н., Хрящев В.В. Научно-исследовательская среда для детектирования и распознавания лиц на цифровых изображениях с целью анализа возраста и пола личности 11еа^пШоп.ЬаЬ // Свидетельство о регистрации в Реестре программ для ЭВМ №2011614271 от 31.05.2011.
Подписано в печать 27.04.2012 Формат 60x84 1/16. Тираж 100 экз.
Отпечатано на ризографе Ярославский государственный университет 150000 Ярославль, ул. Советская, 14.
Оглавление автор диссертации — кандидата технических наук Голубев, Максим Николаевич
ВВЕДЕНИЕ.
1. АЛГОРИТМЫ ДЕТЕКТИРОВАНИЯ ЛИЦ НА ЦИФРОВЫХ ИЗОБРАЖЕНИЯХ.
1.1. Классификация методов.
1.2. Методы, основанные на знаниях.
1.3. Методы на основе инвариантных свойств.
1.3.1. Признаки лица.
1.3.2. Текстура.
1.3.3. Сочетание признаков.
1.4. Методы на основе сравнения с шаблоном.
1.4.1. Предопределенные шаблоны.
1.4.2. Деформируемые шаблоны.
1.5. Методы на основе обучения.
1.5.1. Собственные лица.
1.5.2. Методы на основе вероятностных распределений.
1.5.3. Нейронные сети.
1.5.4. Наивный байесовский классификатор.
1.5.5. Скрытые марковские модели.
1.5.6. Теоретико-информационный подход.
1.5.7. Индуктивное обучение.
1.5.8. Бустинг.
1.5.9. Разреженная сеть просеивающих элементов.
1.5.10. Машина опорных векторов.
1.6. Тестовая база изображений.
1.7. Сравнительный анализ алгоритмов на основе обучения.
1.8. Краткие выводы.
2. АНАЛИЗ АЛГОРИТМОВ ВЫДЕЛЕНИЯ ЛИЦ В УСЛОВИЯХ ИСКАЖЕНИЙ.
2.1. Вводные замечания.
2.2. Модели искажений.
2.2.1. Гауссов шум.
2.2.2. Импульсный шум.
2.2.3. Импульсный шум в цветных изображениях.
2.3. Описание фильтров.
2.3.1. Фильтры для удаления гауссова шума.
2.3.2. Фильтры для удаления импульсного шума.
2.4. Анализ работы алгоритмов в условиях наличия искажений на изображениях.
2.5. Фильтрация зашумленных изображений
2.6. Краткие выводы.
3. ПОСТОБРАБОТКА ВЫДЕЛЕННЫХ ОБЛАСТЕЙ С ЦЕЛЬЮ ФИЛЬТРАЦИИ ЛОЖНЫХ СРАБАТЫВАНИЙ.
3.1. Использование информации о цвете.
3.2. Подходы к детектированию пикселей кожи на изображениях.
3.2.1. Явное определение кластера кожи.
3.2.2. Непараметрические модели распределения оттенков кожи.
3.2.3. Параметрические модели распределения оттенков кожи.
3.3. Фильтрация ложных срабатываний на основе детектора кожи.
3.3.1. Алгоритм 1: Явное задание кластера кожи.
3.3.2. Алгоритм 2: Непараметрическая модель кожи.
3.3.3. Результаты моделирования.
3.4. Использование детектора кожи для лиц людей различных рас.
3.5. Краткие выводы.
4. ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ К ЗАДАЧЕ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ПОЛА ЛЮДЕЙ ПО ИЗОБРАЖЕНИЮ ЛИЦА.
4.1. Вводные замечания.
4.2. Описание алгоритмов.
4.2.1. Линейный дискриминантный анализ.
4.2.2. Метод опорных векторов.
4.2.3. Предлагаемый алгоритм.
4.3. Методика тестирования.
4.4. Результаты тестирования.
4.5. Краткие выводы.
5. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ АЛГОРИТМОВ ДЕТЕКТИРОВАНИЯ И КЛАССИФИКАЦИИ ОБЪЕКТОВ В СРЕДЕ RECOGNITION.LAB.
5.1. Вводные замечания.
5.2. Интерфейс программы.
5.2.1. Основное окно.
5.2.2. Панель управления.
5.2.3. Окно параметров.
5.3. Особенности представления алгоритмов в среде Recognition.Lab.
5.3.1. Изображение.
5.3.2. Алгоритмы детектирования.
5.3.3. Параметры детектирования.
5.4. Процедура добавления нового объекта детектирования.
5.4.1. Обучающая база.
5.4.2. Обучение каскада.
5.4.3. Добавление объекта в Recognition.Lab.
5.5. Краткие выводы.
Введение 2012 год, диссертация по радиотехнике и связи, Голубев, Максим Николаевич
Актуальность темы
Современный уровень научно-технического развития требует целенаправленного развития систем компьютерного зрения как одного из важных механизмов обеспечения эффективного взаимодействия техники с человеком. Одним из важнейших направлений компьютерного зрения является проблема автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия [1-21].
Первые работы в области теории распознавания и классификации появились в 30-х годах прошлого столетия и были связаны с байесовской теорией принятия решений (работы Неймана Дж., Пирсона Э. [22]), применением разделяющих функций к задаче классификации (Фишер Р. [23]), решением вопросов проверки гипотез (Вальд А. [24]). В 50-х годах появились первые нейросетевые модели распознавания (перцептрон Розенблата Ф. [25]), связанные с успехами в моделировании головного мозга. К концу 60-х годов уже были разработаны и детально исследованы различные подходы для решения задач распознавания в рамках статистических, перцептронных моделей и моделей с разделяющими функциями. Итоги данных и последующих исследований были представлены в ряде монографий [25-39, 10, 20]. Большой вклад в развитие теории распознавания и классификации внесли советские и в последующем российские ученые: Айзерман М.А., Браверман Э.М., Розоноэр Л.И. (метод потенциальных функций [27]), Вапник В.Н., Червоненкис А.Я. (статистическая теория распознавания, метод «обобщенный портрет» [10]), Мазуров В.Д. (метод комитетов [40-41, 33]), Ивахненко А.Г. (метод группового учета аргументов [31]), Загоруйко Н.Г. (алгоритмы таксономии и анализа знаний [29, 30]), Лбов Г.С. (логические методы распознавания и поиска зависимостей [32]). Интенсивные исследования проводились с конца 60-х годов в ВЦ АН СССР (в настоящее время ВЦ им. A.A. Дородницына РАН). Еще в начале 60-х академиком РАН Журавлевым Ю.И. был предложен тестовый алгоритм распознавания - логический метод эффективного решения задач распознавания при малом числе обучающих прецедентов [42]. В дальнейшем на базе этого алгоритма Журавлевым был построен новый класс распознающих процедур - алгоритмы вычисления оценок [43], а затем введена и исследована алгебраическая теория распознавания [21, 44]. В этом направлении фундаментальные результаты получили также чл. корр. РАН Рудаков К.В. (общая теория проблемно-ориентированного алгебраического синтеза корректных алгоритмов [45]), чл. корр. РАН Матросов B.JI. (статистическое обоснование алгебраического подхода [46]), Рязанов В.В. (оптимизация моделей классификации [47], коллективные решения задач кластерного анализа [48-49]), ДюковаЕ.В. (асимптотически-оптимальные логические алгоритмы [50,51]), Сенько О.В. (алгоритмы взвешенного статистического распознавания [52]), Асланян JI.A. (логические алгоритмы распознавания [53]), Донской В.И. (решающие деревья [54-55]) и многие другие исследователи России, СНГ и дальнего зарубежья.
В последние годы появились узкоспециализированные системы интеллектуального анализа данных. Для данных систем часто характерна ориентация на узкий круг практических задач, а их алгоритмической основой является какая-либо одна из альтернативных моделей, использующая нейронную сеть, решающие деревья, ограниченный перебор и т.п. [56]. Между тем на настоящем уровне развития методов решения задач анализа данных и распознавания представляется предпочтительным путь создания программных средств, включающих основные существующие разнообразные подходы. В данном случае повышаются шансы подбора из имеющихся алгоритмов такого алгоритма, который обеспечит наиболее точное решение интересующих пользователя задач на новых данных. Другим важным атрибутом систем анализа и классификации должно быть наличие средств автоматического решения задач распознавания и классификации коллективами алгоритмов. Действительно, стандартной ситуацией является наличие нескольких альтернативных алгоритмов или решений, равнозначных для пользователя. Для выбора из них одного наиболее предпочтительного не хватает информации. Тогда естественной альтернативой выбору является создание на базе имеющихся алгоритмов или решений новых, более предпочтительных.
Теоретические основы практической реализации идеи решения задач анализа данных коллективами алгоритмов были разработаны в ВЦ РАН для решения задач распознавания (логическая и алгебраическая коррекция алгоритмов) в 1976-1980 гг. [20,21,44] и комитетного синтеза классификаций для задач кластерного анализа (автоматической классификации) в 1981-1982 годах [48, 49]. Позднее появились исследования в данной области и в других странах.
При таком подходе новые алгоритмы распознавания строятся в виде полиномов над исходными алгоритмами (применение алгебраических корректоров) или в виде специальных булевских функций (логических корректоров). Такой подход позволяет строить алгоритмы, безошибочные на «обучающем» материале или совершающие меньшее число ошибок, чем каждый из исходных алгоритмов.
В 1980-х годах одной из центральных парадигм искусственного интеллекта стало машинное обучение. Некоторое время до этого господствующей тенденцией был поиск неких универсальных механизмов «чистого» мышления, воплощение которых позволило бы создать идеальный интеллект, способный решать любые задачи. Хотя в данном направлении и были достигнуты определенные успехи, они оказались гораздо скромнее, чем исходные ожидания. Неудачные попытки в создании готового идеального интеллекта привели к смещению акцента в сторону построения систем искусственного интеллекта, способных к развитию, совершенствованию, т.е. к обучению. Конечно, здесь имеется в виду стереотипное отношение к проблеме искусственного интеллекта, поскольку и раньше были исследователи, занимавшиеся проблемами адаптивности и обучения (особенно в рамках бионического направления) и обращавшие внимание на социальную природу человеческого интеллекта.
Дать формальное определение обучению крайне затруднительно, но важно то, что обучение - это способность использовать предыдущий опыт для лучшего решения последующих задач. В простейшем случае обучение соответствует простому накоплению данных в процессе функционирования. Например, система машинного обучения, встретившись с задачей, которая уже была ею решена, может воспользоваться старым решением. Однако обучение этим не ограничивается: опыт решения одних задач можно использовать для решения других, для чего нужно обобщить свой опыт.
Машинное обучение - очень обширное направление исследований, перекрывающееся со многими другими областями и включающее рассмотрение различных проблем на основе разных подходов, для которых даже нет устоявшейся классификации. В качестве примера можно привести деление на символьные, коннекционистские (сетевые или на основе связей) и эмерджентные методы обучения [64]. Зачастую методы из одной группы в точности копируют методы другой группы, но сущность подхода выражают в совершенно других терминах, т.е. эта классификация отражает форму методов обучения, но не их алгоритмическое содержание. Все это говорит о том, что область машинного обучения на данный момент является еще не вполне зрелой дисциплиной.
Одним из активно развивающихся направлений машинного обучения является разработка алгоритмов обучения нейронных сетей. Интерес к нейроинтеллекту возник еще на заре развития вычислительной техники. В его основе лежит нейронная организация искусственных систем, которая имеет биологические предпосылки. Способность биологических систем к обучению, самоорганизации и адаптации обладает большим преимуществом по сравнению с современными вычислительными системами. Достоинством компьютерных систем является большая скорость распространения информации и возможность учета большого объема знаний, накопленных человечеством в этой области. Разработка искусственных разумных систем, которые соединяют преимущества биологических существ и современной вычислительной техники, создает потенциальные предпосылки для перехода к качественно новому этапу эволюции в вычислительной технике.
Первые шаги в области искусственных нейронных сетей сделали в 1943 г. В. Маккалох и В. Питтс. Они показали, что при помощи пороговых нейронных элементов можно реализовать исчисление любых логических функций [65]. В 1949 г. Д. Хебб предложил правило обучения [66], которое стало математической основой для обучения ряда нейронных сетей. В 19571962 гг. Ф. Розенблатт предложил и исследовал модель нейронной сети, которую он назвал персептроном. Результаты исследований он обобщил в книге «Принципы нейродинамики», которая имеет большое значение для развития нейронных сетей [67]. В 1959 г. В. Видроу и М. Хофф предложили процедуру обучения для линейного адаптивного элемента - AD ALINE [68]. Процедура обучения получила название «дельта правило». В 1969 г. М. Минский и С. Пайперт опубликовали монографию «Персептроны», в которой был дан математический анализ персептрона, и показали ограничения, присущие ему. Выводы их были довольно пессимистичными, и это сыграло негативную роль для дальнейшего развития исследований в области нейронных сетей. Работы в этой области были практически приостановлены. В 70-е годы появился ряд работ в области ассоциативной памяти. Так, Ж. Андерсон предложил в 1977 г. модель линейной ассоциативной памяти. В этом направлении продолжил исследования Т. Кохонен, который представил модель оптимальной линейной ассоциативной памяти. В 1976 г. С. Гроссберг разработал теорию адаптивного резонанса, которая может быть использована для построения ассоциативной памяти.
В 80-е годы значительно расширяются исследования в области нейройных сетей. Д. Хопфилд в 1982 г. дал анализ устойчивости нейронных сетей с обратными связями и предложил использовать их для решения задач оптимизации. Т. Кохонен разработал и исследовал самоорганизующиеся нейронные сети. Ряд авторов (Д. Румельхарт, Дж. Хинтон, Р. Уильяме) предложил алгоритм обратного распространения ошибки, который стал мощным средством для обучения многослойных нейронных сетей. В 1987 г. под эгидой общества IEEE (Institute Electrical and Electronic Enginneer's) проводится первая международная конференция в области нейронных сетей.
Большой вклад в развитие теории нейронных сетей внесли российские ученые А.И. Галушкин, А.Н. Горбань, В.В. Майоров, М.М. Бонгард, А.Ю. Зиновьевым.
В настоящее время исследования в области искусственных нейронных сетей ориентированы в основном на создание специализированных систем для решения конкретных задач. Разработано большое число нейросистем, применяемых в различных областях: прогнозировании, управлении, диагностике в медицине и технике, распознавании образов и т.д. Рынок продуктов в области нейроинтеллекта стремительно растет. Происходит постепенное накопление критической массы для создания универсальных нейросистем, способных к различного рода интеллектуальной деятельности. В глобальном масштабе задача состоит в создании искусственного разума, обладающего способностью к воспроизводству и эволюции.
Однако в реальных системах задачу распознавания объектов приходится решать в условиях наличия искажений, связанных с помехами в радиотехнических устройствах и сжатием двумерного сигнала. Поэтому для эффективного решения поставленной задачи требуется применение специализированных алгоритмов цифровой обработки изображений (ЦОИ), которая широко используется в системах телекоммуникаций, радио- и гидролокации, сейсмологии, робототехнике, радиоастрономии, медицине.
В настоящее время для устройств цифровой обработки изображений, характерно постоянное возрастание объема обрабатываемой информации, повышение требований к качеству обработки, работа в сложной сигнально-помеховой обстановке. Все это стимулирует появление новых методов и более сложных алгоритмов, используемых в системах ЦОИ. Среди них можно выделить нелинейные алгоритмы фильтрации и восстановления изображений, вейвлет-обработку, системы, построенные на нечеткой логике, генетических алгоритмах, нейронных сетях. Однако влияние таких алгоритмов на решение последующей задачи распознавания объектов на изображении изучено на сегодняшнем этапе развития данной области весьма слабо.
Среди объектов для распознавания и классификации наиболее развитой и актуальной задачей является детектирование и классификация человеческих лиц. В настоящее время эта задача находит применение в различных сферах человеческой деятельности (в первую очередь, в системах безопасности). Сферами применения распознавания лиц являются, например, сравнение фотографий на паспортах или водительских удостоверениях, контроль доступа к безопасным компьютерным сетям и оборудованию в учреждениях, верификация пользователя при проведении финансовых транзакций, наблюдение за аэропортами и вокзалами для предотвращения террористических актов и многие другие [69-72]. Во всех этих приложениях требуется корректно устанавливать личность, как по отдельному статическому изображению лица, так и на видеопоследовательности [73-77]. Естественно, что анализ входной информации должен осуществляться в режиме реального времени [78-79].
Для увеличения надежности процесса распознавания может быть использована такая дополнительная информация, как возраст, пол, расовая принадлежность, выражение лица. Человеческие лица выглядят весьма похожими по своей структуре, отличаясь лишь в деталях для каждого конкретного индивидуума. В классических задачах распознавания образов обычно имеется ограниченное число классов с большим числом обучающих примеров для каждого из них. При распознавании лиц, напротив, мы сталкиваемся с тем, что возможных классов может быть очень много, в то время как число обучающих примеров относительно невелико.
Процесс распознавания лиц может быть разделен на два этапа. На первом из них осуществляется нахождение и выделение лица на изображении - так называемый процесс «детектирования лица» [80-85]. Второй этап представляет собой непосредственно распознавание лица - т.е. установление степени сходства с одним из лиц «известных» системе [85-89].
Для построения полностью автоматизированных технических систем для распознавания лиц, которые будут анализировать информацию, содержащуюся в изображении лица, требуются робастные и эффективные алгоритмы выделения лиц. Имея на входе единственное изображение, цель алгоритма выделения лиц состоит в определении всех областей изображения, содержащих лицо, несмотря на их положение в пространстве, ориентацию и условия освещенности. Это очень сложная задача, поскольку лицо является неоднородным объектом и обладает высокой степенью изменчивости размера, формы, цвета и текстуры.
Дадим определение задачи выделения лица на изображении. При произвольном изображении на входе целью алгоритма выделения лиц является определение того, есть ли на изображении лица, и, если есть, указать положение и размер каждого из них.
С выделением лиц связан ряд схожих задач. Целью задачи локализации лица является определение положения единственного лица на изображении. Это упрощенная задача выделения лиц в предположении, что входное изображение содержит только одно лицо [90-91]. Целью задачи детектирования признаков лица является определение присутствия и положения значимых признаков лица, таких как глаза, нос, ноздри, рот, губы, уши и т.д., в предположении, что присутствует только одно лицо на изображении [92-93]. При распознавании или идентификации лица входное
12 пробное) изображение сравнивается с изображениями из базы (галереи) и между ними устанавливается соответствие, если оно есть [94-96]. Целью аутентификации по лицу является проверка прав доступа человека по входному изображению [97-98], а с помощью методов сопровождения лица выполняется оценка положения и возможно ориентации лица на последовательности изображений в реальном времени [99-101]. Распознавание выражения лица концентрируется на идентификации эмоциональных состояний (счастье, грусть, злость и т.д.) людей. Очевидно, что выделение лиц является первым этапом решения любой из перечисленных выше задач.
Важной задачей является также оценка качества работы алгоритмов, которое оценивается, как правило, в терминах уровней выделения и ложных срабатываний. Под уровнем выделения понимают отношение числа лиц, верно детектированных алгоритмом, и числа лиц, детектированных человеком. Область на изображении, идентифицированная классификатором как лицо, является корректно детектированной, если эта область охватывает больше, чем определенный процент лица на изображении. В основном детекторы могут порождать два типа ошибок: пропущенные области, что в результате приводит к низкому уровню выделения, и ложные срабатывания, т.е. области которые относятся алгоритмом к классу лиц, но при этом лицами не являются. Правильная оценка работы алгоритма должна принимать в расчет эти факторы, поскольку можно настроить параметры метода таким образом, что увеличится уровень выделения, однако при этом возрастет и уровень ложных срабатываний.
При наличии более 150 описанных подходов исследования в области выделения лиц продолжают расширяться. Задача выделения лиц может быть представлена как задача распознавания двух классов, в которой изображение классифицируется как «лицо» или «нелицо». Следовательно, выделение лиц - это одна из попыток распознать по изображениям объекты, которые обладают высокой внутриклассовой изменчивостью, которая только возрастает в условиях изменения положения камеры и освещения.
Проблему усугубляет наличие на изображении различных искажений, таких как наличие шума, артефактов сжатия, размытия и др. Однако поскольку большинство изображений, с которыми работают современные системы, являются цветными, то задача детектирования на таких изображениях может быть решена более уверенно, если использовать информацию из всех цветовых каналов. Таким образом, разработка новых алгоритмов детектирования и классификации объектов, способных работать в режиме реального времени в условиях сложной сигнально-помеховой обстановки, представляет на сегодняшний день актуальную научно-техническую задачу.
Основной целью работы является разработка и исследование новых алгоритмов детектирования и классификации объектов на полутоновых и цветных изображениях в условиях наличия искажений, связанных с помехами в радиотехнических устройствах.
Для достижения указанной цели в диссертационной работе решаются следующие задачи:
- разработка алгоритмов детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки;
- усовершенствование работы алгоритмов детектирования лиц с использованием информации о цвете;
- разработка новых алгоритмов тендерной классификации по цифровому изображению лица для решения ряда практических задач в области современных систем телевидения.
Методы исследования. При решении поставленных задач использовались современные методы распознавания образов, машинного обучения, цифровой обработки изображений, математического анализа,
14 теории вероятностей. Для практической реализации алгоритмов применялись современные численные методы и методы объектно-ориентированного программирования на языке С#.
Достоверность полученных научных результатов. Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.
Научная новизна. В рамках данной работы получены следующие новые научные результаты.
1. Разработаны новые алгоритмы детектирования лиц на полутоновых изображениях в условиях сложной сигнально-помеховой обстановки.
2. Разработана модификация алгоритмов детектирования лиц с использованием информации о цвете.
3. Разработан новый алгоритм тендерной классификации по изображению лица на основе адаптивных признаков и метода опорных векторов.
Практическая ценность
1. Проведен анализ работы алгоритмов детектирования лиц при наличии искажающих факторов и предложены рекомендации по их устранению, позволившие повысить уровень выделения в среднем на 20-30%.
2. Разработаны модификации алгоритма детектирования лиц на базе бустинга путем использования информации о цвете, позволившие снизить уровень ложных срабатываний более чем в 2 раза.
3. Разработан и исследован алгоритм тендерной классификации на основе адаптивных признаков и метода опорных векторов для решения ряда практических задач в области современных систем телевидения.
Результаты работы внедрены в соответствующие разработки ООО «А-ВИЖН», ОАО «СеверТрансКом», г. Ярославль.
Отдельные результаты диссертационной работы внедрены в учебный процесс ЯрГУ им. П.Г. Демидова в рамках дисциплины «Цифровая обработка изображений», а также в научно-исследовательские работы при выполнении исследований в рамках гранта «Развитие нелинейной теории обработки сигналов и изображений в радиотехнике и связи» (Программа «Развитие научного потенциала высшей школы (2009-2010 годы)», №2.1.2/7067).
Все результаты внедрения подтверждены соответствующими актами.
На защиту диссертации выносятся следующие основные результаты:
Заключение диссертация на тему "Разработка и анализ алгоритмов детектирования и классификации объектов на основе методов машинного обучения"
Основные результаты диссертации можно сформулировать в следующем виде.
1. Проведено сравнение трех современных алгоритмов выделения лиц на изображениях на базе обучения. Это алгоритмы на базе процедуры бустинга, на базе обучающей сети SNoW и на базе метода опорных векторов. Лучший результат по уровню выделения лиц на неискаженных изображениях показал алгоритм на базе SNoW - 87,3%. На втором и третьем местах алгоритмы на базе бустинга (82,6%) и МОВ (62,4%) соответственно.
2. Исследовано влияние на работу тестируемых алгоритмов нескольких типов искажений: гауссов шум, импульсный шум, размытие и сжатие JPEG. Результаты проведенных экспериментов показали, что алгоритм на базе бустинга более устойчив к искажениям всех типов. Он значительно превосходит другие тестируемые алгоритмы по среднему уровню выделения при внесении гауссова и импульсного шумов на 33%), а также при сжатии JPEG (~ на 20%). При размытии алгоритм на базе бустинга уступает по среднему уровню выделения 6,6% алгоритму на базе SNoW, однако при этом он допускает в 4 раза меньше ошибок классификации.
3. Разработана модификация для алгоритма выделения лиц на основе детектора пикселей кожи. Применение детектора кожи позволяет уменьшить количество ложных срабатываний на цветных изображениях при небольшом уменьшении уровня выделения.
Проведено сравнение двух алгоритмов детектирования кожи. Это алгоритм, использующий явное задание кластера кожи и алгоритм, использующий непараметрическую модель кожи. Алгоритм, использующий явное задание цвета кожи, ограничен одной областью цветовых оттенков. Предлагаемый автором алгоритм является более
175 гибким, и его работа определяется набором обучающих изображений. Он показывает на 9% меньше ложных срабатываний при большем уровне детектирования (на 3%).
4. Предложен алгоритм классификации изображений на базе адаптивных признаков и метода опорных векторов для работы в современных системах телевидения, решающий задачу распознавания пола людей по изображению лица с точностью порядка 80%. Результаты тестирования показывают, что предлагаемый алгоритм превосходит другие рассматриваемые алгоритмы по всем основным параметрам. Его уровень верного распознавания составил 79,6%, что на 1,9% больше, чем у классификатора МОВ и на 9,9% больше, чем у алгоритма ЮЖА. Количество фрагментов, обрабатываемых АП-МОВ в секунду, составило 65, что в 1,44 раза больше по сравнению с другими тестируемыми алгоритмами.
5. Адаптивный характер генерации набора признаков в процедуре обучения АП-МОВ позволяет использовать данный классификатор для распознавания любых других объектов, находящихся на изображении (помимо лиц). Для этого необходимо лишь сформировать обучающий набор фрагментов для каждого рассматриваемого класса и переобучить классификатор в соответствии с методикой, приведенной в работе.
6. Для демонстрации работы описанных алгоритмов и проведения дальнейших исследований по данной тематике создана научно-исследовательская среда для детектирования и распознавания лиц 11есо^Шоп.ЬаЬ.
ЗАКЛЮЧЕНИЕ
Библиография Голубев, Максим Николаевич, диссертация по теме Радиотехника, в том числе системы и устройства телевидения
1. Файн B.C. Опознавание изображений (основы непрерывно-групповой теории и ее приложения) // М.: «Наука», 1970.
2. Фу К. Структурные методы распознавания образов // М.: Мир, 1977.
3. Фурман Я.А. Юрьев А.Н. Яншин В.В. Цифровые методы обработки и распознавания бинарных изображений // Красноярск: Изд-во Краснояр. ун-та, 1992.
4. Гренандер У. Лекции по теории образов // Под ред. Ю. Журавлева М.: Мир, 1979.
5. Патрик Э. Основы теории распознавания образов // Под ред. Б.Р. Левина М.: Сов. радио, 1980.
6. Прикладные нечеткие системы: Пер. с япон. // К. Асаи, Д. Ватада, С. Иваи и др.: под редакцией Т. Тэранко, К. Асаи, М. Сугэно М.: Мир, 1993.
7. Ту Дж., Гонсалес Р. Принципы распознавания образов // Под редакцией Ю.И. Журавлева М.: Мир. 1978.
8. Пересада В.П. Автоматическое распознавание образов // Л.: «Энергия»,1970.
9. Дуда Р., Харт П. Распознавание образов и анализ сцен // Под редакцией В.Л. Стефанюка, М.: Мир. 1976.
10. Ю.Вапник В.Н., Червоненкис А.Я. Теория распознавания образов (статистические проблемы обучения) // М.: Наука, 1974.
11. П.Журавлев Ю.И., Рязанов В.В., Сенько О.В. Распознавание. Математические методы. Программная система. Практические применения. // М.: Фазис, 2005.
12. Форсайт Д.А., Понс Д. Компьютерное зрение. Современный подход // М.: «Вильяме», 2004.
13. Потапов А.С. Распознавание образов и машинное восприятие: общий подход на основе принципа минимальной длины описания. // СПб.: Политехника, 2007.
14. Николенко С. И., Тулупьев A.JI. Самообучающиеся системы // М.: МЦНМО, 2009.
15. Sammut С., Webb G.I. Encyclopedia of Machine Learning // Springer, 2011.
16. Люгер Дж. Ф. Искусственный интеллект: стратегии и методы решения сложных проблем // М.: «Вильяме», 2003
17. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения // М.: Едиториал УРСС, 2011.
18. Гонсалес Р., Вудс Р. Цифровая обработка изображений // М.: Техносфера, 2005.
19. Методы компьютерной обработки изображений // Под ред. В.А. Сойфера М.: Физматлит, 2001.
20. Журавлев Ю.И. Избранные научные труды // М.: Издательство Магистр, 1998.
21. Журавлев Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации. Проблемы кибернетики // М.: Наука, 1978. Вып. 33. С. 5-68.
22. Neyman J., Pearson E.S. On the problem of the most efficient tests of statistical hypothesis // Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character, 1933. V. 231 P. 289-337.
23. Fisher R.A. The use of multiple measurements in taxonomic problems // Ann. Eugenics, 1936. V. 7, Part II, P. 179-188.
24. Wald A. Contributions to the theory of statistical estimation and testing of hypotheses // Ann.Math.Stat., 1939. V. 10, P. 299-326.
25. Розенблатт Ф. Принципы нейродинамики (перцептрон и теория механизмов мозга) // М.: Мир, 1965.
26. Айвазян С.А. и др. Прикладная статистика: Классификация и снижение размерности // М.: Финансы и статистика, 1989.
27. Айзерман М.А., Браверманн Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин // М.: Наука, 1970.
28. Бонгард М.М. Проблема узнавания // М.: Наука, 1967.29.3агоруйко Н.Г. Методы распознавания и их применение //М.: Сов.радио, 1972.
29. ЗО.Загоруйко Н.Г. Прикладные методы анализа данных и знаний // Новосибирск: Изд-во Института математики, 1999.
30. Ивахненко А.Г. Системы эвристической самоорганизации в технической кибернетике // Киев: Техшка, 1971.
31. Лбов Г.С. Методы обработки разнотипных экспериментальных данных//Новосибирск: Наука, 1981.
32. Метод комитетов в распознавании образов. // Свердловск: ИММ УНЦ АН СССР, 1974.
33. Себастьян Г.С. Процессы принятия решений при распознавании образов // М.: Изд-во «Техника», 1965.
34. Уоссермен Ф. Нейрокомпьютерная техника // М.: Мир, 1992.
35. Фукунага К. Введение в статистическую теорию распознавания образов // М.: Наука, 1979.
36. Fu K.S. Sequential Methods in Pattern Recognition and Machine Learning // Academic Press, New York, 1968.
37. Minsky M., Papert S. Perceptrons: An Introduction to Computational Geometry // MIT Press, Cambridge, Mass., 1969.
38. Nilsson NJ. Learning Machines // McGraw-Hill, New York, 1965.
39. Мазуров В л. Д. Комитеты систем неравенств и задача распознавания // Кибернетика. 1971. №3. С. 140-146.
40. Мазуров Вл.Д., Хачай М.Ю. Комитеты систем линейных неравенств// Автоматика и телемеханика. 2004. Вып. 2, С. 43-54.
41. Дмитриев А.Н., Журавлев Ю.И., Кренделев Ф.П., О математических принципах классификации предметов и явлений // Сб. «Дискретный анализ», Новосибирск, ИМ СО АН СССР, 1966. Вып. 7.
42. Журавлев Ю.И., Никифоров В.В. Алгоритмы распознавания, основанные на вычислении оценок // Кибернетика. 1971. №3. С. 1-11.
43. Журавлев Ю.И. Корректные алгебры над множествами не корректных (эвристических) алгоритмов // Кибернетика. 1977. I. № 4. С. 5-17. , И. Кибернетика, № 6, 1977, III. Кибернетика. 1978. №2. С. 35-43.
44. Рудаков К.В. Об алгебраической теории универсальных и локальных ограничений для задач классификации // Распознавание, классификация, прогноз: Матем. методы и их применение. М.: Наука, 1988. Вып. 1,С. 176-200.
45. Матросов B.JI. Синтез оптимальных алгоритмов в алгебраических замыканиях моделей алгоритмов распознавания// Распознавание, классификация, прогноз: Матем. методы и их применение. М.: Наука, 1988. Вып. 1,С. 229-279.
46. Рязанов В.В. О построении оптимальных алгоритмов распознавания и таксономии (классификации) при решении прикладных задач //
47. Распознавание, классификация, прогноз: Матем. методы и их применение. М.: Наука, 1988. Вып. 1, С. 229-279.
48. Рязанов В.В. Комитетный синтез алгоритмов распознавания и классификации // ЖВМ и МФ. 1981. Том 21, №6. С.1533-1543.
49. Рязанов В.В. О синтезе классифицирующих алгоритмов на конечных множествах алгоритмов классификации (таксономии) // ЖВМ и МФ, 1982. Том 22, №2. С.429-440.
50. Дюкова Е.В. Асимптотически оптимальные тестовые алгоритмы в задачах распознавания//Проблемы кибернетики. М.: Наука, 1982. Вып. 39. С. 165-199.
51. Дюкова Е.В. Алгоритмы распознавания типа "Кора": сложность реализации и метрические свойства// Распознавание, классификация, прогноз (матем. методы и их применение). М.: Наука, 1989. Вып.2. С. 99-125.
52. Сенько О.В. Использование процедуры взвешенного голосования по системе базовых множеств в задачах прогнозирования// М. Наука, Ж. вычисл. матем. и матем. физ. 1995, т. 35, № 10, С. 1552-1563.
53. Aslanyan L., Zhuravlev Yu. Logic Separation Principle // Computer Science & Information Technologies Conference, Yerevan, September 17-20, 2001, 151-156.
54. Донской В.И. Алгоритмы обучения, основанные на построении решающих деревьев// Журнал выч. мат. и матем. физики. 1982, т. 22, №4, с. 963-974.
55. Донской В.И., Башта А.И. Дискретные модели принятия решений при неполной информации // Симферополь: Таврия, 1992.
56. Дюк В., Самойленко A. Data Mining: учебный курс // СПб: Питер, 2001.
57. Голубев М.Н., Шмаглит Л.А., Ганин А.Н. Разработка и анализ системы автоматического распознавания пола людей по изображению лица // XIV Всероссийская научно-техническая конференция «Нейроинформатика-2012».
58. Makinen Е., Raisamo R. An experimental comparison of gender classification methods // Pattern Recognition Letters 29, 2008. № 10, P. 1544-1556.
59. Burges C. A Tutorial on Support Vector Machines for Pattern Recognition // Data Mining and'Knowledge Discovery, 1998. V. 2, P. 121-167.
60. Gao H., Davis J. Why direct LDA is not equivalent to LDA // Pattern Recognition Letters 39, 2006. № 5, P. 1002-1006.
61. Голубев M.H., Брюханов Ю.А. Исследовательская среда PicLab.Signage.Demo: обзор возможностей // Тр. LXVI науч. сессии, посвященной Дню Радио. Москва, 2011. С. 350-353.
62. Тарасова Д.А., Тихонова Т.С., Голубев М.Н. Предварительная обработка изображений в задаче распознавания // Тез. докл. 15-ой междунар. науч.-тех. конф. «Радиоэлектроника, электротехника и энергетика». Москва. 2009. Т.1, С. 27-28.
63. Вайнцвайг М.Н. Алгоритм обучения распознаванию образов «Кора» // Алгоритмы обучения распознаванию образов. М.: Сов.радио, 1973. С. 8-12.
64. Mcculloh, Pitts A logical calculus of the ideas immanent in nervous activity
65. Bulletin of Mathematical Biophysics, 1943. №5, P. 115-133.182
66. НеЬЬ D.O. Organisation of Behavior // John Wiley & Sons, New York, 1949.
67. Розенблатт Ф. Принципы нейродинамики: Перцептроны и теория механизмов мозга // М.: Мир, 1965.
68. Widrow В., Hoff М. Adaptive switching circuits // IRE WESCON Convention Record, 1960. Part 4. P. 96-104.
69. Kotropoulos C., Pitas I. Rule-Based Face Detection in Frontal Views // Proc. Int'l Conf. Acoustics, Speech and Signal Processing, 1997. V. 4, P. 2537-2540.
70. Sakai Т., Nagao M. Fujibayashi S. Line Extraction and Pattern Detection in a Photograph // Pattern Recognition, 1969. V. 1, P. 233-248.
71. Craw I., Ellis H., Lishman J. Automatic Extraction of Face Features // Pattern Recognition Letters, 1987. V. 5, P. 183-187.
72. Govindaraju V. Locating Human Faces in Photographs // Int'l J. Computer Vision, 1996. V. 19, P. 129-146.
73. Sobottka K., Pitas I. A novel method for automatic face segmentation, facial feature extraction and tracking // Signal Processing: Image Communication, 1998. Vol. 12, P. 263-281.
74. Smeraldi F., Carmona O., Bigun J. Saccadic search with Gabor features applied to eye detection and real-time head tracking // Image Vision Comput. 18, 2000. P. 323-329.
75. De Silva L.C., Aizawa K., Hatori M. Detection and tracking of facial features by using a facial feature model and deformable circular template // IEICE Trans. Inform. Systems EZ8-D(9), 1995. P. 1195-1207.
76. Vezhnevets V. Face and Facial Feature Tracking for Natural HumanComputer Interface. Moscow, 2002.
77. Bradski G. Computer Vision Face Tracking For Use in a Perceptual User Interface, Intel Technology Journal Q2, 1998.
78. Yang J., Waibel A. A Real-time Face Tracker // IEEE Proc. of the 3rd Workshop on Applications of Computer Vision, Florida, 1996.
79. Froba B., Kublbeck. C. Real-time Face Detection Using Edge-orientation Matching // Audio- and Video-based Biometric Person Authentication (AVBPA'2001), Halmstad, Sweden, 2001, P 78-83.
80. Yang M.-H., Ahuja N., Kriegman D. Face Detection Using Multimodal Density Models // Computer Vision and Image Understanding (CVIU), 2001. V. 84, P. 264-284.
81. Sung K.-K., Poggio T. Example-Based Learning for View- Based Human Face Detection // IEEE Trans. Pattern Analysis and Machine Intelligence, 1998. V. 20, P. 39-51.
82. Jochen Maydt, Rainer Lienhart. Face Detection with Support Vector Machines and a Very Large Set of Linear Features // IEEE ICME 2002, Lousanne, Switzerland, 2002.
83. Roth D., Yang M.-H., Ahuja N. A SNoW-based face detector // In Advances in Neural Information Processing Systems 12 (NIPS 12), MIT Press, Cambridge, MA, 2000. P. 855-861.
84. Juell P., Marsh R. A hierarchical neural network for human face detection // Pattern Recog. 29, 1996. P. 781-787.
85. Rowley H.A., Baluja S., Kanade T. Neural network-based face detection // IEEE Trans. Pattern Anal. Mach. Intell. 20, 1998. P. 23-38.
86. Lin S.-H., Kung S.-Y., Lin L.-J. Face recognition/detection by probabilistic decision-based neural network // IEEE Trans. Neural Networks 8, 1997. P. 114-132.
87. Edwards G.J., Taylor C.J., Cootes T.F. Interpreting Face Images using Active Appearance Models // Int. Conf. on Face and Gesture Recognition 1998. P. 300-30.
88. Stan Z. Li, Anil K. Jain. Handbook of Face Recognition // Springer Science+Business Media, 2005.
89. Belhumeur P.N., Hespanha J.P., Kriegman D.J. Eigenfaces vs. Fisherfaces: Recognition using class specific linear projection // IEEE Transactions on pattern analysis and machine intelligence, 1997, V. 19, № 7.
90. Lam K., Yan H. Fast Algorithm for Locating Head Boundaries // J. Electronic Imaging, 1994 V. 3, № 4, P. 351-359.
91. Moghaddam B., Pentland A. Probabilistic visual learning for object representation // IEEE Trans. Pattern Anal. Mach. Intell. 19(1), 1997. P. 696-710.
92. Craw I., Tock D., Bennett A. Finding Face Features // Proc. Second European Conf. Computer Vision, 1992, P. 92-96.
93. Graf H.P., Chen T., Petajan E., Cosatto E. Locating Faces and Facial Parts // Proc. First Int'l Workshop Automatic Face and Gesture Recognition, 1995, P. 41-46.
94. Turk M., Pentland A. Eigenfaces for Recognition // J. Cognitive Neuroscience, 1991, V. 3, № 1, P. 71-86.
95. Samal A., Iyengar P.A. Automatic Recognition and Analysis of Human Faces and Facial Expressions: A Survey // Pattern Recognition, 1992, V. 25, № 1, P. 65-77.
96. Chellappa R., Wilson C.L., Sirohey S. Human and Machine Recognition of Faces: A Survey // Proc. IEEE, 1995, V. 83, № 5, P. 705-740.
97. Tefas A., Kotropoulos C., Pitas I. Variants of Dynamic Link Architecture Based on Mathematical Morphology for Frontal Face Authentication //
98. Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1998, P. 814819.
99. Kotropoulos C., Tefas A., Pitas I. Frontal Face Authentication Using Variants of Dynamic Link Matching Based on Mathematical Morphology // Proc. IEEE Int'l Conf. Image Processing, 1998, P. 122-126.
100. Crowley J.L., Berard F. Multi-Modal Tracking of Faces for Video Communications // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 640-645.
101. Edwards G.J., Taylor C J., Cootes T. Learning to Identify and Track Faces in Image Sequences // Proc. Sixth IEEE Int'l Conf. Computer Vision, 1998, P. 317-322.
102. Darrell T., Gordon G., Harville M., Woodfill J. Integrated Person Tracking Using Stereo, Color, and Pattern Detection // Int'l J. Computer Vision, 2000, V. 37, № 2, P. 175-185.
103. Yang G., Huang T.S. Human Face Detection in Complex Background // Pattern Recognition, 1994. V. 27, P. 53-63.
104. Leung T.K., Burl M.C., Perona P. Finding Faces in Cluttered Scenes Using Random Labeled Graph Matching // Proc. Fifth IEEE Int'l Conf. Computer Vision, 1995, P. 637-644.
105. Yow K.C., Cipolla R. Feature-Based Human Face Detection // Image and Vision Computing, 1997, V. 15, № 9, P. 713-735.
106. Dai Y., Nakano Y. Face-Texture Model Based on SGLD and Its Application in Face Detection in a Color Scene // Pattern Recognition, 1996, V. 29, № 6, P. 1007-1017.
107. McKenna S., Gong S., Raja Y. Modelling Facial Colour and Identity with Gaussian Mixtures // Pattern Recognition, 1998, V. 31, № 12, P. 18831892.
108. Oliver N., Pentland A., Berard F. LAFER: Lips and Face Real Time Tracker // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 123-129.
109. Lanitis A., Taylor C.J., Cootes T.F. An Automatic Face Identification System Using Flexible Appearance Models // Image and Vision Computing, 1995, V. 13, №5, P. 393-401.
110. Osuna E., Freund R., Girosi F. Training Support Vector Machines: An Application to Face Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 130-136.
111. Schneiderman H., Kanade T. Probabilistic Modeling of Local Appearance and Spatial Relationships for Object Recognition // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1998, P. 45-51.
112. Rajagopalan A., Kumar K., Karlekar J., Manivasakan R., Patil M., Desai U., Poonacha P., Chaudhuri S. Finding Faces in Photographs // Proc. Sixth IEEE Int'l Conf. Computer Vision, 1998, P. 640-645.
113. Lew M.S. Information Theoretic View-Based and Modular Face Detection // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 198-203.
114. Colmenarez A.J., Huang T.S. Face Detection with Information-Based Maximum Discrimination // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 782-787.
115. Kanade T. Picture Processing by Computer Complex and Recognition of Human Faces // PhD thesis, Kyoto Univ., 1973.
116. Sobottka, Pitas I. Segmentation and Tracking of Faces in Color Images // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 236-241.
117. Canny J. A Computational Approach to Edge Detection // IEEE Trans.
118. Pattern Analysis and Machine Intelligence, 1986, V. 8, № 6, P. 679-698.187
119. Chetverikov D., Lerch A. Multiresolution Face Detection 11 Theoretical Foundations of Computer Vision, 1993, V. 69, P. 131-140.
120. Amit Y., Geman D., Jedynak B. Efficient Focusing and Face Detection // Face Recognition: From Theory to Applications, Wechsler H., Phillips P.J., Bruce V., Fogelman-Soulie F., Huang T.S., eds., 1998, V. 163, P. 124-156.
121. Amit Y., Geman D., Wilder K. Joint Induction of Shape Features and Tree Classifiers // IEEE Trans. Pattern Analysis and Machine Intelligence, 1997, V. 19, № 11, P. 1300-1305.
122. Breiman L., Friedman J., Olshen R., Stone C. Classification and Regression Trees. Wadsworth, 1984.
123. Samaria F.S. Face Recognition Using Hidden Markov Models // PhD thesis, Univ. of Cambridge, 1994.
124. Augusteijn M.F., Skujca T.L. Identification of Human Faces through Texture-Based Feature Recognition and Neural Network Technology // Proc. IEEE Conf. Neural Networks, 1993, P. 392-398.
125. Haralick R.M., Shanmugam K., Dinstein I. Texture Features for Image Classification III IEEE Trans. Systems, Man, and Cybernetics, 1973, V. 3, №6, P. 610-621.
126. Fahlman S., Lebiere C. The Cascade-Correlation Learning Architecture // Advances in Neural Information Processing Systems 2, Touretsky D.S., ed., 1990, P. 524-532.
127. Kohonen T. Self-Organization and Associative Memory // Springer, 1989.
128. Chai D., Ngan K.N. Locating Facial Region of a Head-and-Shoulders Color Image // Proc. Third Int'l Conf. Automatic Face and Gesture Recognition, 1998, P. 124-129.
129. Hotta K., Kurita T., Mishima T. Scale Invariant Face Detection Method Using Higher-Order Local Autocorrelation Features Extracted from Log
130. Polar Image // Proc. Third Int'l Conf. Automatic Face and Gesture Recognition, 1998, P. 70-75.
131. Chen Q., Wu H., Yachida M. Face Detection by Fuzzy Matching // Proc. Fifth IEEE Int'l Conf. Computer Vision, 1995, P. 591-596.
132. Wu H., Yokoyama T., Pramadihanto D., Yachida M. Face and Facial Feature Extraction from Color Image // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 345-350.
133. Wu H., Chen Q., Yachida M. Face Detection from Color Images Using a Fuzzy Pattern Matching Method // IEEE Trans. Pattern Analysis and Machine Intelligence, 1999, V. 21, № 6, P. 557-563.
134. Sinha P. Object Recognition via Image Invariants: A Case Study // Investigative Ophthalmology and Visual Science, 1994, V. 35, № 4, P. 1735-1740.
135. Sinha P. Processing and Recognizing 3D Forms // PhD thesis, Massachusetts Inst, of Technology, 1995.
136. Papageorgiou C., Poggio T. A Trainable System for Object Recognition // Int'l J. Computer Vision, 2000, V. 38, № 1, p. 15-33, 2000.
137. B. Scassellati, "Eye Finding via Face Detection for a Foevated, Active Vision System," Proc. 15thNat'l Conf. Artificial Intelligence, 1998.
138. C. Breazeal and B. Scassellati, "A Context-Dependent Attention System for a Social Robot," Proc. 16th Int'l Joint Conf. Artificial Intelligence, 1999, V. 2, P. 1146-1151.
139. Yuille A., Hallinan P., Cohen D. Feature Extraction from Faces Using Deformable Templates // Int'l J. Computer Vision, 1992, V. 8, № 2, P. 99111.
140. Kwon Y.H., N. da Vitoria Lobo Face Detection Using Templates // Proc. Int'l Conf. Pattern Recognition, 1994, P. 764-767.
141. Kass M., Witkin A., Terzopoulos D. Snakes: Active Contour Models // Proc. First IEEE Int'l Conf. Computer Vision, 1987, P. 259-269.
142. Leymarie F., Levine M.D. Tracking Deformable Objects in the Plan Using an Active Contour Model // IEEE Trans. Pattern Analysis and Machine Intelligence, 1993, V. 15, № 6, P. 617-634.
143. Kirby M., Sirovich L. Application of the Karhunen-Loe've Procedure for the Characterization of Human Faces // IEEE Trans. Pattern Analysis and Machine Intelligence, 1999, V. 12, № 1, P. 103-108.
144. Karhunen K. Uber Lineare Methoden in der Wahrscheinlichkeitsrechnung // Annales Academiae Sciientiarum Fennicae, Series AI: Mathematica-Physica, 1946, V. 37, P. 3-79, 1946.
145. Loe've M.M. Probability Theory // Princeton, N.J.: Van Nostrand, 1955.
146. Fukunaga K. Introduction to Statistical Pattern Recognition // New York: Academic, 1972.
147. Sung K.-K. Learning and Example Selection for Object and Pattern Detection // PhD thesis, Massachusetts Inst, of Technology, 1996.
148. Oren M., Papageorgiou C., Sinha P., Osuna E., Poggio T. Pedestrian Detection Using Wavelet Templates // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 193-199.
149. Kervrann C., Davoine F., Perez P., Li H., Forchheimer R., Labit C. Generalized Likelihood Ratio-Based Face Detection and Extraction of Mouth Features // Proc. First Int'l Conf. Audio- and Video-Based Biometric Person Authentication, 1997, P. 27-34.
150. Agui T., Kokubo Y., Nagashashi H., Nagao T. Extraction of Face Recognition from Monochromatic Photographs Using Neural Networks // Proc. Second Int'l Conf. Automation, Robotics, and Computer Vision, 1992, V. 1,P. 18.8.1-18.8.5.
151. Propp M., Samal A. Artificial Neural Network Architectures for Human Face Detection // Intelligent Eng. Systems through Artificial Neural Networks, V. 2.
152. Waibel A., Hanazawa T., Hinton G., Shikano K., Lang K. Phoneme Recognition Using Time-Delay Neural Networks // IEEE Trans. Pattern Analysis and Machine Intelligence, 1989, V. 37, № 3, P. 328-339.
153. Rowley H., Baluja S., Kanade T. Neural Network-Based Face Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1996, P. 203208.
154. Rowley H., Baluja S., Kanade T. Human Face Detection in Visual Scenes // Advances in Neural Information Processing Systems 8, Touretzky D.S., Mozer M.C., and Hasselmo M.E., eds., 1996, P. 875-881.
155. Vaillant R., Monrocq C., Le Cun Y. An Original Approach for the Localisation of Objects in Images // IEE Proc. Vision, Image and Signal Processing, 1994, V. 141, P. 245-250.
156. Burel G., Carel D. Detection and Localization of Faces on Digital Images // Pattern Recognition Letters, 1994, V. 15, № 10, P. 963-967.
157. Rowley H., Baluja S., Kanade T. Rotation Invariant Neural Network-Based Face Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1998, P. 38-44.
158. Schneiderman H., Kanade T. A Statistical Method for 3D Object Detection Applied to Faces and Cars // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 2000, V. 1, P. 746-751.
159. Rikert T., Jones M., Viola P. A Cluster-Based Statistical Model for Object Detection // Proc. Seventh IEEE Int'l Conf. Computer Vision, 1999, V. 2, P. 1046-1053.
160. Rabiner L.R., Jung B.-H. Fundamentals of Speech Recognition // Prentice Hall, 1993.
161. Qian R.J., Huang T.S. Object Detection Using Hierarchical MRF and MAP Estimation // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1997, P. 186-192.
162. Cover T., Thomas J. Elements of Information Theory // Wiley Interscience, 1991.
163. Fukunaga F., Koontz W. Applications of the Karhunen-Loe've Expansion to Feature Selection and Ordering // IEEE Trans. Computers, 1970, V. 19, №5, P. 311-318.
164. Pentland A., Moghaddam B., Starner T. View-Based and Modular Eigenspaces for Face Recognition // Proc. Fourth IEEE Int'l Conf. Computer Vision, 1994, P. 84-91.
165. Quinlan J.R. C4. 5: Programs for Machine Learning // Kluwer Academic, 1993.
166. Huang J., Gutta S., Wechsler H. Detection of Human Faces Using Decision Trees // Proc. Second Int'l Conf. Automatic Face and Gesture Recognition, 1996, P. 248-252.
167. Duta N., Jain A.K. Learning the Human Face Concept from Black and White Pictures // Proc. Int'l Conf. Pattern Recognition, 1998, P. 1365-1367.
168. Mitchell T. Machine Learning // McGraw Hill, 1997.
169. Viola P., Jones M. Rapid object detection using a boosted cascade of simple features // Proc. Int. Conf. on Computer Vision and Pattern Recognition. 2001. № 1. P. 511-518.
170. Баринова О.В., Ветров Д.П. Оценки обобщающей способности бустинга с вероятностными входами // Материалы 14-й Всероссийской конференции «Математические методы распознавания образов», Суздаль, 2009. С. 81-84.
171. Crowley J.L., Bedrune J.M. Integration and Control of Reactive Visual Processes // Proc. Third European Conf. Computer Vision, 1994, V. 2, P. 47-58.
172. Jordan M.I., Jacobs R.A. Hierarchical mixtures of experts and the EM algorithm // Neural Computation. 1994. № 6. P. 181-214.
173. Miller D., Uyar H. A mixture of experts classifier with learning based on both labeled and unlabeled data // Neural information processing systems. 1996. №9. P. 571-577.
174. Roth D. Learning to Resolve Natural Language Ambiguities: A Unified Approach // Proc. 15th Nat'l Conf. Artificial Intelligence, 1998, P. 806-813.
175. Carleson A., Cumby C., Rosen J., Roth D. The SNoW Learning Architecture // Technical Report UIUCDCS-R-99-2101, Univ. of Illinois at Urbana-Champaign Computer Science Dept., 1999.
176. Littlestone N. Learning Quickly when Irrelevant Attributes Abound: A New Linear-Threshold Algorithm // Machine Learning, 1988, V. 2, P. 285318.
177. Hallinan P. A Deformable Model for Face Recognition Under Arbitrary Lighting Conditions // PhD thesis, Harvard Univ., 1995.
178. Phillips P.J., Moon H., Rizvi S.A., Rauss P.J. The FERET evaluation methodology for face-recognition algorithms // IEEE Transactions on pattern analysis and machine intelligence, 2000, V. 22, № 10.
179. Nilsson M., Nordberg J., Claesson I. Face Detection Using Local SMQT Features and Split Up SNoW Classifier // Proceedings of IEEE Int. Conf. ICASSP 2007, V. 2, P. 589-592.
180. Nilsson M., Dahl M., Claesson I. The successive mean quantization transform // Proceedings of IEEE Int. Conf. ICASSP, 2005, V. 4, P. 429432.
181. Roth D. The SNoW Learning Architecture // Technical Report UIUCDCS-R-99-2102, UIUC Computer Science Department, 1999.
182. Sung K.-K., Poggio T. Example-Based Learning for View-Based Human Face Detection // Technical Report AI Memo 1521, Massachusetts Inst, of Technology AI Lab, 1994.
183. Papageorgiou C., Oren M., Poggio T. A General Framework for Object Detection // Proc. Sixth IEEE Int'l Conf. Computer Vision, 1998, P. 555562.
184. Kienzle W., Bakir G., Franz M., Scholkopf B. Face Detection Efficient and Rank Deficient // Adv. in Neural Inf. Proc. Systems, 2005. V.17, P. 673-680.
185. Метод опорных векторов // Цифровая библиотека лаборатории компьютерной графики и мультимедиа при факультете ВМиК МГУ, (http ://library .graphicon.ru/catalog/217).
186. Yang M.-H., Ahuja N., Kriegman D. Mixtures of Linear Subspaces for Face Detection // Proc. Fourth Int'l Conf. Automatic Face and Gesture Recognition, 2000, P. 70-76.
187. Provost F., Fawcett T. Robust Classification for Imprecise Environments
188. Machine Learning, 2001. V. 42, P. 203-231.194
189. Приоров А.Л., Игнатов И.С., Голубев М.Н., Хрящев В.В. Разработка и анализ алгоритма выделения лиц на изображениях // Проектирование и Технология Электронных Средств, 2008. № 2. С. 58-62.
190. Голубев М.Н. Разработка и анализ алгоритмов выделения лиц на изображениях // Материалы 3-й Международной научн.-техн. конф. «Инфокоммуникационные технологии в науке, производстве и образовании» (Инфоком-3). Кисловодск, 2008. С. 277-282.
191. Шмаглит Л.А., Голубев М.Н., Игнатов И.С., Хрящев В.В. Выделение лиц на изображениях в условиях искажений // Докл. 11-й междунар. конф. «Цифровая обработка сигналов и ее применение» (DSPA-2009), Москва, 2009. Т.2. С. 511-514.
192. Yang М.Н., KriegmanD.J., AhujaN., Detecting faces in images: A survey // IEEE Trans. Pattern Analysis and Machine Intelligence, 2002. V. 24, P. 34-58.
193. Hjelmas E., LowB.K., Face detection: A survey // Journal of Computer Vision and Image Understanding, 2001. V. 83, P. 236-274.
194. Голубев М.Н., Шмаглит Л.А., Игнатов И.С., Хрящев В.В. Сравнительный анализ алгоритмов выделения лиц на изображениях // Труды XVII международной научно-технической конференции «Информационные средства и технологии». Москва, 2009. Т.2. С. 20-25.
195. Голубев М.Н., Приоров А.Л., Хрящев В.В. Удаление импульсного шума со случайными значениями импульсов из изображений // Радиотехника, 2010. №5. С. 72-78.
196. Muresan D. D., Parks Т. W. Adaptive principal components and image denoising//Proc. IEEE Int. Conf. Image Processing, 2003. V. 1. P. 101104.
197. Chen Т., Wu H. Adaptive impulse detection using center-weighted median filters // IEEE signal processing letters. 2001. V. 8, № 1. P. 1-3.
198. Апальков И.В., Хрящев В.В. Исследовательская среда PicLab: текущие возможности и перспективы развития // Докл. 10-й межд. конф. «Цифровая обработка сигналов и ее применение». Москва. 2008. Т. 2, С. 467-470.
199. Арляпов С.А., Приоров А.Л., Хрящев В.В. Модифицированный критерий оценки качества восстановленных изображений // Цифровая обработка сигналов. 2006. № 2. С. 27-33.
200. Wallage G. The JPEG Still Picture Compression Standard // Communications of the ACM, 1991. V. 34, №4. P. 31-44.
201. Tomasi C., Manduchi R. Bilateral Filtering for Gray and Color Images // Proc. Int. Conf. on Computer Vision and Pattern Recognition, 1998. P. 839846.
202. Волохов В., Сергеев E. Удаление аддитивного белого гауссова шума из цифровых изображений на основе анализа главных компонент // Тр.конф. ГрафиКон'2010, 2010. С. 342-343.196
203. Голубев М.Н. Анализ искажений при передаче изображений по каналам связи // Сб. конкурсных работ Всероссийского смотра-конкурса научн.-техн. творчества студентов вузов «Эврика-2007». Новочеркасск, 2007. С. 15-17.
204. Зараменский Д.А., Голубев М.Н., Шмаглит JI.A. Уменьшение артефактов блочности в JPEG-изображениях // Сборник трудов 63-й научной сессии, посвященной Дню радио, Москва, 2008. С. 228-230.
205. Vezhnevets V., Sazonov V., Andreeva A. A survey on pixel-based skin color detection techniques // Труды конференции ГрафиКон'2003. 2003. P. 85-92.
206. Wang J., Tan T. A New Face Detection Method Based on Shape Information // Pattern Recognition Letters, 2000, P. 463-471.
207. Alboil A., Torres L., Delp E. An Unsupervised Color Image Segmentation Algorithm for Face Detection Applications. Spain, 2000.
208. Zuo F. Fast Human Face Detection Using Successive Face detectors with Incremental Detection Capability. Eindhoven, the Netherlands, 2002.
209. Garcia C., Tziritas G. Face Detection in Color Images Using Wavelet Packet Analysis // Proc. IEEE Intern. Conf. Multimedia Computing and Systems, Florence, V. I, June 1999, P. 703-708.
210. Garcia C., Tziritas G. Face Detection Using Quantized Skin Color Regions Merging and Wavelet Packet Analysis // Proc. IEEE Intern. Conf. Multimedia Computing and Systems, Florence, 1999. V. 1 №3, P. 264-277.
211. Peer P., Kovac J., Solina F. Human skin colour clustering for face detection // In submitted to EUROCON 2003 International Conference on Computer as a Tool, 2003.
212. Ahlberg J. A system for face localization and facial feature extraction // Tech. Rep. LiTH-ISY-R-2172, Linkoping University, 1999.
213. Fleck M., Forsyth D.A., Bregler C. Finding naked people // In Proc. of the ECCV, 1996, V. 2, P. 592-602.
214. Jordao L., Perrone M., Costeira J., Santos-Victor J. Active face and feature tracking // In Proceedings of the 10th International Conference on Image Analysis and Processing, 1999, P. 572-577.
215. Gomez G., Morales E. Automatic feature construction and a simple rule induction algorithm for skin detection // In Proc. of the ICML Workshop on Machine Learning in Computer Vision, 2002, P. 31-38.
216. Brand J., Mason J. A comparative assessment of three approaches to pixellevel human skin-detection. In Proc. of the International Conference on Pattern Recognition, 2000, V. 1, P. 1056-1059.
217. Gomez G. On selecting colour components for skin detection // In Proc. of the ICPR, V. 2, P. 961-964.
218. Zarit B.D., Super B.J., Quek F.K.H. Comparison of five color models in skin pixel classification // In ICCV'99 Int'l Workshop on recognition, analysis and tracking of faces and gestures in Real-Time systems, 1999, P. 58-63.
219. Schumeyer R., Barner K. A color-based classifier for region identification in video // In Visual Communications and Image Processing 1998, 1998, SPIE, V. 3309, P. 189-200.
220. Sigal L., Sclaroff S., Athitsos, V. Estimation and prediction of evolving color distributions for skin segmentation under varying illumination // In
221. Proc. IEEE Conf. on Computer Vision and Pattern Recognition, 2000, V. 2, P. 152-159.
222. Soriano M., Huovinen S., Martinkauppi B., Laaksonen M. Skin detection in video under changing illumination conditions // In Proc. 15th International Conference on Pattern Recognition, 2000, V. 1, P. 839-842.
223. Birchfield S. Elliptical head tracking using intensity gradients and color histograms // In Proceedings of CVPR '98, 1998, P. 232-237.
224. Jones M.J., Rehg J.M. Statistical Color Models with Application to Skin Detection // Proc. IEEE Conf. Computer Vision and Pattern Recognition, 1999, V. 1,P. 274-280.
225. Chai D., Bouzerdoum A. A bayesian approach to skin color classification in YCbCr color space // In Proceedings IEEE Region Ten Conference (TENCON'2000), 2000, V. 2, P. 421-424.
226. Trees H.L.V. Detection, Estimation, and Modulation Theory // Wiley V.I., 1968.
227. Brown D., Craw I., Lewthwaite J. A SOM based approach to skin detection with application in real time systems // In Proc. of the British Machine Vision Conference, 2001.
228. Menser B., Wien M. Segmentation and tracking of facial regions in color image sequences // In Proc. SPIE Visual Communications and Image Processing, 2000, P. 731-740.
229. Hsu R.-L., Abdel-Mottaleb M., Jain A.K. Face detection in color images // IEEE Trans. Pattern Analysis and Machine Intelligence, 2002, 24, 5, P. 696706.
230. Yang M.-H., Ahuja N. Detecting Human Faces in Color Images // Proc. IEEE Int'l Conf. Image Processing, 1998, V. 1, P. 127-130.
231. Saber E., Tekalp A.M. Frontal-View Face Detection and Facial Feature Extraction Using Color, Shape and Symmetry Based Cost Functions // Pattern Recognition Letters, 1998, V. 17, № 8, P. 669-680.
232. Yang M.-H., Ahuja N. Gaussian Mixture Model for Human Skin Color and Its Application in Image and Video Databases // Proc. SPIE: Storage and Retrieval for Image and Video Databases VII, 1999, V. 3656, P. 458466.
233. Phung S.L., Bouzerdoum A., Chai D. A novel skin color model in YCbCr color space and its application to human face detection // In IEEE International Conference on Image Processing (ICIP'2002), 2002, V. 1, P. 289-292.
234. Lee J.Y., Yoo S.I. An elliptical boundary model for skin color detection // In Proc. of the 2002 International Conference on Imaging Science, Systems, and Technology, 2002.
235. Yang J., Lu W., Waibel A. Skin-color modeling and adaptation // In Proceedings of ACCV 1998, 1998, P. 687-694.
236. Stern H., Efros B. Adaptive color space switching for face tracking in multi-colored lighting environments // In Proc. of the International Conference on Automatic Face and Gesture Recognition, 2002, P. 249-255.
237. Storring M., Andersen H. Skin colour detection under changing lighting condition // In Araujo and J. Dias (ed.) 7th Symposium on Intelligent Robotics Systems, 1999, P. 187-195.
238. Martinkauppi B., Laaksonen M., Soriano M. Behavior of skin color under varying illumination seen by different cameras at different color spaces // In Machine Vision Applications in Industrial Inspection IX, Proceedings of
239. SPIE, 2001, V. 4301, P. 102-112.200
240. Голубев М.Н., Апальков И.В. Устранение ложных срабатываний в алгоритме выделения лиц на изображении // Докл. 12-й междунар. конф. «Цифровая обработка сигналов и ее применение» (Б8РА-2010), Москва, 2010. Т.2. С. 302-304.
241. Шмаглит Л.А., Голубев М.Н. Использование информации о цвете в алгоритме выделения лиц на изображениях // Материалы 20-й Международной Конференции по Компьютерной Графике и Зрению «ГрафиКон'2010», 2010. С. 331-332.
242. Голубев М.Н. Использование информации о цвете в алгоритме выделения лиц на базе бустинга // Сб. науч. труд. 13-й всероссийской научно-технической конф. «Нейроинформатика-2011», Москва, 2011. Ч. 3. С. 55-62.
243. Голубев М.Н., Павлов Е.А. Разработка и анализ алгоритмов распознавания лиц на изображениях в программной среде РюЬаЬ // Тезисы докладов XVII Международной студенческой конференции-школы-семинара-М.: МИЭМ, 2009. С. 140-141.
244. Голубев М.Н., Хрящев В.В., Шмаглит Л.А. Об одном алгоритме распознавания лиц на изображениях // Тр. междунар. науч.-техн. конф. «Проблемы автоматизации и управления в технических системах», Пенза, 2009. С. 358-362.
245. Апальков И.В., Голубев М.Н., Игнатов И.С. Архивирование изображений на основе стандарта 1РЕ02000 с возможностью распознавания лиц // Тр. ЬХУ науч. сессии, посвященной Дню Радио. Москва, 2010. С. 207-209.
-
Похожие работы
- Разработка и анализ алгоритмов распознавания лиц на телевизионных изображениях для биометрической идентификации
- Разработка и анализ системы распознавания автомобильных регистрационных знаков
- Методы автоматической идентификации личности по изображениям лиц, полученным в неконтролируемых условиях
- Повышение безопасности промышленных объектов на основе совершенствования методов и средств дистанционного детектирования газовых утечек
- Выделение и предобработка сигналов в системах автоматического распознавания речевых команд
-
- Теоретические основы радиотехники
- Системы и устройства передачи информации по каналам связи
- Радиотехника, в том числе системы и устройства телевидения
- Антенны, СВЧ устройства и их технологии
- Вакуумная и газоразрядная электроника, включая материалы, технологию и специальное оборудование
- Системы, сети и устройства телекоммуникаций
- Радиолокация и радионавигация
- Механизация и автоматизация предприятий и средств связи (по отраслям)
- Радиотехнические и телевизионные системы и устройства
- Оптические системы локации, связи и обработки информации
- Радиотехнические системы специального назначения, включая технику СВЧ и технологию их производства