автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Система неадаптивного распознавания образов в условиях ограниченного количества информации
Автореферат диссертации по теме "Система неадаптивного распознавания образов в условиях ограниченного количества информации"
Рожков Максим Михайлович
СИСТЕМА НЕАДАПТИВНОГО РАСПОЗНАВАНИЯ ОБРАЗОВ В УСЛОВИЯХ ОГРАНИЧЕННОГО КОЛИЧЕСТВА ИНФОРМАЦИИ
Специальность 05.13.01 - Системный анализ, управление и обработка информации (в промышленности)
10 НОЯ 2011
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Владимир-2011
Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых» (ВлГУ) на кафедре «Физика и прикладная математика».
Научный руководитель:
Официальные оппоненты:
доктор физико-математических наук, профессор,
Аракелян Сергей Мартиросович
доктор технических наук, профессор,
Садыков Султан Сидыкович
кандидат физико-математических наук, доцент,
Аверин Александр Петрович
Ведущая организация:
ГНИИ ИТТ «Информика»
Защита диссертации состоится «25» ноября 2011 г. в 14:00 в ауд. 211, корп. 1 на заседании диссертационного совета Д.212.025.01 ВлГУ по адресу: 600000, Владимир, ул. Горького, 87.
С диссертацией можно ознакомиться в научной библиотеке ВлГУ.
Автореферат разослан « ¿У » (О 2011г.
Ученый секретарь диссертационного совета доктор технических наук, доцент
Давыдов Н.Н.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы.
Современный уровень информатизации, кибернетики и роботостроения требует целенаправленного развития систем компьютерного зрения как одного из важных механизмов обеспечения эффективного взаимодействия техники с человеком. Одним из важнейших направлений компьютерного зрения является задача автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства систем, способных интеллектуально оценивать внешнюю среду и выполнять в ней те или иные действия.
Задача распознавания образов имеет общий характер. Во-первых, потому что распознаваемый объект может иметь различную природу: человек, животное, машина, механизм, строение и т.д. Во-вторых, потому что область применения этой задачи весьма обширна: военное дело, кибернетика, работа спецслужб, автоматизированная обработка информации и т.д. И, в-третьих, потому что у человека алгоритм распознавания объектов универсален и основан на сравнении воспринимаемого объекта с образами, извлекаемыми из памяти.
В рамках настоящей работы разрабатываются методы и модели автоматизированного распознавания образов исследуемые в частной задаче: распознавание лиц людей для их идентификации. Методы и модели проверяются на двух различных задачах: распознавание лиц и распознавание промышленных изделий. В силу общности задачи распознавания образов для распознавания лиц не исследуется структура образа. А производится попарное сравнение образа с набором шаблонов (эталонов) в рамках предлагаемой неадаптивной модели при помощи специализированных методов. Разрабатываемые алгоритмы и методы носят общий характер. И могут применяться для распознавания широкого круга объектов.
В связи с актуальностью проблемы в настоящее время ВлГУ по заказу Федерального агентства по науке и инновациям проводит исследования в рамках опытно-конструкторской работы по теме «Разработка технических средств распознавания образов по анализу видеоизображения для автоматизации работы оператора» (Государственный контракт №02.524.11.4010). Разрабатывается опытный образец и технологическая документация для промышленного производства программно-аппаратного комплекса обнаружения, слежения и распознавания людей.
Одной из ключевых подсистем комплекса является подсистема распознавания образов, успешное алгоритмическое решение которой является необходимым условием для целесообразности и возможности производства комплекса.
Важным условием Федерального агентства является требование успешности распознавания при наличии в системе только по одной фотография-эталону для каждого разыскиваемого человека. Таким образом, комплекс должен работать в условиях ограниченного количества информации в рамках
проблемы одного эталонного изображения. Это требование вполне согласуется с архитектурой предлагаемой модели, использующей принципы попарного сравнения
Цель работы заключается в разработке математических моделей, алгоритмов и методов для повышения достоверности распознавания образов в условиях ограниченного количества информации (при наличии в системе только одного эталона для каждого распознаваемого образа). Конечным результатом работы является алгоритмическая база для производства систем распознавания.
Методы исследования
Достоверность полученных в работе результатов обеспечивается применением методов системного анализа, теории распознавания образов, теории множеств, теории алгоритмов, теории вероятности, математической статистики и подтверждены результатами экспериментов, проведенных с помощью специально созданного программного обеспечения.
Научная новизна
Научную новизну работы определяют следующие положения: 1. Предложена модель системы распознавания образов, позволяющая совместно использовать несколько методов распознавания различного типа.
Главными особенностями системы являются:
• Система является неадаптивной. Она не адаптирована для распознавания какого-то конкретного типа объектов. И может применяться для распознавания различных образов.
• Система распознавания имеет модульную структуру. Что позволяет расширять или улучшать систему путем добавления, исключения или замены подсистем верхнего уровня.
• Взаимодействие подсистем верхнего уровня основано на сотрудничестве: система принимает решение о наличии распознаваемого образа в эталонной базе, если хотя бы одна из подсистем определила такое соответствие.
• Взаимодействие подсистем нижнего уровня основано на конкуренции. Для принятия подсистемой верхнего уровня решения о наличии в базе распознаваемого образа необходимо чтобы все подсистемы нижнего уровня, входящие в нее, определили ближайшим соседом одинаковое эталонное изображение.
• В качестве подсистем нижнего уровня может использоваться любой алгоритм, использующий принцип ближайшего соседа и реализующий попарное сравнение распознаваемого изображения с эталонными.
• Система может использовать большое количество разнообразных алгоритмов, что позволяет исследовать изображения различными методами. И таким образом более полно использовать ограниченную информацию, содержащуюся в одном изображении.
2. Предложен метод каскадного применения процедур преобразования распознаваемого изображения по схеме: построение производной карты -сканирование волновым пакетом. Метод позволяет:
• использовать для распознавания различные производные карты исходного изображения;
• уменьшить количество хранимых в системе данных и как следствие ускорить поиск в них.
3. Предложен алгоритм распознавания, использующий порядковые гистограммы. Алгоритм учитывает мелкотекстурные особенности изображения распознаваемого объекта. И может использоваться для правильного распознавания образов, отличающихся по ракурсу от имеющихся в системе.
Практическая ценность, реализация и внедрение результатов
Разработанные в настоящей работе алгоритмы и методы повышают достоверность распознавания образов в условиях ограниченного количества информации и могут использоваться в качестве алгоритмической базы для производства систем распознавания объектов.
Разработанные в диссертации принципы, алгоритмы, математические модели и программные средства легли в основу подсистемы распознавания в рамках выполнения госбюджетной опытно-конструкторской работы «200904-2.4-15-03» по теме: «Разработка технических средств распознавания образов по анализу видеоизображения для автоматизации работы оператора».
Разработанная система реализована и успешно функционирует на опытном образце комплекса. Это обстоятельство делает целесообразным и возможным промышленное производство данного комплекса.
Головной исполнитель ОКР Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых признал эффективность разработанной системы распознавания для серийного производства комплекса.
Комплекс демонстрировался на международном салоне «Комплексная безопасность 2011» во Всероссийском выставочном центре. Его эффективность была отмечена дипломом салона и медалью ВВЦ.
Соисполнитель ОКР, Федеральное казенное предприятие "Государственный лазерный полигон "Радуга" предоставил заключение о целесообразности применения системы распознавания, разработанной в настоящей работе, для использования ее в составе разрабатываемого комплекса.
Институт проблем лазерных и информационных технологий РАН (ИЛ-ПИТ РАН) предоставил заключение о возможности применения разработанной системы в промышленном производстве комплексов распознавания.
Апробация работы
Основные результаты работы докладывались на следующих научно-технических и научно-практических конференциях:
• XVII Всероссийская научно-методическая конференция «Телематика-2010», Санкт-Петербург, 21-24 июня 2010 г.
• II Международная научно-практическая конференция «Прогрессивные технологии и перспективы развития», Тамбов, 5 ноября 2010 г.
• Международная научная конференция «Технические науки: проблемы и перспективы», Санкт-Петербург, март 2011 г.
• Международный салон «Комплексная безопасность 2011», Москва, ВВЦ, 17-20 мая 2011 г.
• Семинар кафедры Информационных систем Муромского института ГОУ ВПО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, 24 мая 2011 г.
На защиту выносятся следующие положения:
1. Система распознавания образов, позволяющая совместно использовать несколько алгоритмов распознавания различного типа.
2. Набор алгоритмов, обеспечивающих работоспособность, предложенной системы.
3. Результаты экспериментов по распознаванию лиц предложенной системой.
Публикации
Основные результаты работы представлены в 9 публикациях, в том числе в 3 статьях журналов из перечня ВАК и одной монографии, а также в научно-технических отчетах ОКР, выполненных по заданию Федерального агентства по науке и инновациям.
Объем и структура диссертации
Текст диссертационной работы изложен на 145 стр. машинописного текста. И дополнен четырьмя приложениями на 28 стр. Содержательная часть включает введение, четыре главы и заключение. Список использованных источников содержит 92 наименования. Таблиц - 22, рисунков - 65.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационной работы, сформулированы цель и основные задачи исследования, защищаемые положения и их практическая значимость, а также приводится краткое содержание по главам.
В первой главе обосновывается актуальность проблемы. Отмечается, что одним из важнейших направлений компьютерного зрения является задача автоматизированного распознавания образов. Успешное решение задачи необходимо для разработки и производства интеллектуальных систем, способных самостоятельно оценивать внешнюю среду и выполнять в ней полезные действия.
Делается акцент на общем характере задачи распознавания. Во-первых, потому что распознаваемый объект может иметь различную природу. Во-вторых, потому что область применения этой задачи весьма обширна: военное дело, кибернетика, работа спецслужб, автоматизированная обработка
информации и т.д. Кроме того, у человека алгоритм распознавания объектов также универсален.
Рассматриваются различные виды задач распознавания. Отмечается, что среди направлений распознавания особое место занимает проблема одного эталонного изображения. Решение данной проблемы вызывает ряд трудностей. В частности, многие имеющиеся алгоритмы распознавания значительно ухудшают свои показатели работы, если системе доступно лишь по одному эталону. Многие имеющиеся алгоритмы, требующие обучения системы, неприменимы в принципе в рамках данной проблемы. Проблема одного изображения является очень актуальной сегодня. В этом направлении ведутся многочисленные исследования. Об этом можно судить по количеству свежих статей, посвященных данной проблематике.
Далее приводится подробный обзор наиболее распространенных алгоритмов распознавания, проводится их классификация. Имеющиеся методы распознавания разделяются на общие и специализированные. Общие методы характеризуются универсальностью применения. Они могут в принципе использоваться не только для распознавания лиц, но и других объектов. Специализированные методы оперируют с признаками характерными именно для человеческих лиц. Они разработаны для решения этой узкой задачи и, как правило, принципиально неприменимы для распознавания других объектов. Среди общих методов рассматриваются: метод главных компонент, линейный дискриминантный анализ, оптический поток, скрытые Марковские модели, нейросетевые методы распознавания. Среди специализированных методов рассматриваются: методы, основанные на геометрических характеристиках лица, методы сравнения эталонов, методы сравнения ЗО-моделей лица, методы сравнения эластичных графов.
По результатам обзора ни один из рассматриваемых методов распознавания не может в полной мере решить поставленную задачу. Основными их недостатками являются:
• недостаточно высохие показатели корректности распознавания в рамках проблемы одного эталона;
• высокая алгоритмическая сложность, ведущая к невозможности применять эти методы в условиях реального времени с большим количеством образов в базе;
• необходимость точного центрирования и масштабирования распознаваемых изображений, усложняющая алгоритмы;
• принципиальная неприменимость в случае одного эталона;
• недостаточная общность метода.
В настоящей работе не рассматриваются методы восполнения недостатка информации и синтез дополнительных ракурсов распознаваемого объекта. Синтез, так или иначе, основывается на априорном знании о характере распознаваемого объекта, что лишает такие методы универсальности. Также он неизбежно ведет к возникновению дополнительных ошибок восстановления
дополнительных ракурсов. И в целом не увеличивает информацию, используемую для распознавания.
Вместо этого будем пытаться применять для распознавания одновременно несколько методов. Главная цель совместного применения различных методов - как можно большее использование имеющейся ограниченной информации из единственного изображения. Для реализации совместной работы нескольких методов распознавания необходимо разработать систему, позволяющую использовать разнотипные процедуры распознавания. Разработанная система должна быть неадаптивной, то есть универсальной, пригодной для распознавания различных типов объектов.
Кроме того, необходимо предложить рад методов распознавания для использования их в системе. Эти методы должны соответствовать следующим принципам:
1. Возможность использования с образами различных объектов. Так как предусматривается их использование в неадаптивной системе. Следовательно, исключается использование специализированных алгоритмов.
2. Для увеличения полезного использования ограниченной информации методы должны использовать различные процедуры обработки изображения. Это позволит производить распознавание одновременно с позиций различных преобразований.
3. Методы должны иметь единый внешний интерфейс и работать автономно. Это необходимо для объединения методов в систему.
Отдельное внимание необходимо уделить вопросам вычислительной сложности применяемых алгоритмов. Так как система распознавания может иметь достаточно большую базу образов. Следовательно, необходимо предусмотреть возможность ускорения процедур распознавания при наличии в базе достаточно большого количества образов (порядка 1000 и более).
Вторая глава посвящена описанию математической модели предлагаемой системы распознавания и набору алгоритмов, которые предполагается использовать в системе.
Разработанная система распознавания имеет два уровня подсистем: подсистемы верхнего уровня (ПВУ) и подсистемы нижнего уровня (ПНУ). Система распознавания состоит из нескольких ПВУ, автономных друг от друга. Каждая ПВУ включает несколько ПНУ, также работающих автономно.
Все рассматриваемые нами изображения образуют некоторое множество. Это множество в общем случае может быть произвольным: изображения могут отображать разных людей, в то же время некоторые люди могут быть запечатлены на нескольких изображениях. Назовем классом набор изображений, соответствующих одному и тому же человеку. Тогда все множество изображений разбивается на непересекающиеся классы.
Образуем эталонную базу (ЭБ) - набор изображений для некоторых классов. Класс в эталонной базе может представляться одним или несколькими изображениями. Эталонная база является частью системы распознавания. Она содержит классы, которые система должна распознавать. В рамках проблемы одного эталона в нашей эталонной базе каждый класс представлен
единственным эталонным изображением. Изображение из эталонной базы будем называть эталонным изображением (ЭИ).
Итак, для распознавания поступает некоторое распознаваемое изображение (РИ). Требуется ответить на следующие вопросы:
Содержится ли в эталонной базе класс, соответствующий данному РИ. Если содержится, то какой именно это класс.
Вводятся следующие обозначения. Обозначим через С - пространство изображений. Предположим, что оно разбито на классы. Выделим в нем подмножество Е — {ег,..., е^}, которое будем использовать как эталонную базу. При этом предполагаем, что нумерация соответствует разбиению на классы; то есть, п - номер класса (п = 1, ...,Л'). По построению ЭБ, она содержит по одному эталонному изображению для каждого класса.
Из изображений, не вошедших в ЭБ, образуем распознаваемую базу (РБ).
Введем набор параметризованных весов следующим образом:
{(и^О;...;^^*)}^ 1.....К, где 1 = и/г> м2> - > > = 0, а параметры (натуральные числа) удовлетворяют условиям 51 + + 4- % = 5 « где N - количество ракурсов в эталонной базе.
Подсистема нижнего уровня представляет собой параметризованный t ев алгоритм, который присваивает ЭИ веса из множества Другими словами, ПНУ это отображение
ПНУе:5 -»{1 = ...,и/к1мк+х = 0}
Назовем главным списком множество ЭИ, которому ПНУ присваивает максимальный вес В главном списке присутствует ровно 51 эталонных изображения.
Назовем полным списком 5 - множество ЭИ с ненулевым весом. В полном списке присутствует = 5 эталонных изображения.
Пусть имеется N подсистем нижнего уровня {ПНУ/}, I = 1,..., Ы, N > 2
Тогда подсистемой верхнего уровня (ПВУ) назовем соотношение: ПВУе = £?=1 ' ПНУД где коэффициенты а, > 0,У1 и £ а; = 1.
Система распознавания может состоять из нескольких ПВУ. В том числе и из одной. Следовательно, ПВУ является минимально возможной системой распознавания, предлагаемой в настоящей работе. Таким образом, ПВУ должна иметь критерий, по которому она определяет, содержится ли в эталонной базе класс, соответствующий распознаваемому изображению.
Рассмотрим критерий распознавания (КР), по которому ПВУ будет определять присутствие в ЭБ класса, соответствующего РИ.
Пусть 1Укр некоторое пороговое значение 0 < и'кр < 1
Образуем множество ЭИ, называемое рекомендательным списком (РС) следующего вида: {е: ПВУ((е) >и'кр}. Рекомендательный список строится для некоторого распознаваемого изображения из эталонных изображений. Если рекомендательный список не пуст, система принимает решение о наличии в ЭБ класса, соответствующего РИ.
Рассмотрим подробнее подсистему нижнего уровня. Она имеет два основных функциональных элемента: метрика и алгоритм вычисления вектора признаков.
Правила присвоения весов эталонным изображениям могут быть основаны на различных принципах. Однако, наиболее популярным является принцип ближайшего соседа, который мы также намерены использовать. Он, как правило, основан на применении метрического подхода. Поэтому будем использовать различные метрики.
В разрабатываемой здесь системе, метрика вводится, не непосредственно на пространстве ИЧЛ С, а на некоторых производных от него пространствах - пространствах векторов признаков Н. Переход от ИЧЛ к его вектору признаков осуществляется в ПНУ и представляет собой алгоритм, ставящий в соответствие ИЧЛ д 6 б элемент Л 6 Я.
Элемент к £ Н в дальнейшем будем называть вектором признаков (ВП).
Итак, имеем Р: С -* И, где Р - алгоритм вычисления ВП для ИЧЛ.
То есть, понятие «расстояние между ИЧЛ» является не вполне корректным. Потому что для его задания, необходимо: во-первых, осуществить переход в пространство ВП; во-вторых, собственно определиться с метрикой, используемой в этом пространстве. Для простоты изложения в дальнейших рассуждениях, будем считать, что метрика £> определена на пространстве С. Упоминание о пространстве ВП будем опускать, при этом четко понимая, что его наличие подразумевается.
Итак, пусть б метрическое пространство с метрикой £>. Для построения главного и полного списков предлагается использовать принцип ближайшего соседа. Пусть I е С, расположим эталоны в порядке возрастания расстояния отРИ г, а именно: < £>(г,еП2) 2 - < < •■• < 0(1,еПд,).
Далее рассмотрим взаимодействие ПВУ в рамках системы распознавания. Каждая ПВУ автономна от других ПВУ и согласно критерию распознавания принимает решение о наличии в ЭБ класса, соответствующего распознаваемому изображению. ПВУ между собой сотрудничают. Это значит, что система принимает решение о наличии в ЭБ класса, соответствующего распознаваемому изображению, если хотя бы в одной ПВУ выполнился критерий распознавания. Сотрудничество ПВУ ведет к уменьшению ошибки первого рода и к увеличению ошибки второго рода.
Далее рассматриваются алгоритмы построения векторов признаков, которые планируется использовать в предлагаемой системе. Среди них: дискретное косинусное преобразование, моменты Лежандра, инварианты Цернике, текстурные карты Лавса, детектор краев на масках Собеля, порядковые гистограммы, использующие базис Фрея-Чена.
Третья глава посвящена исследованию подсистем нижнего уровня. Исследование направлено на выявление параметров подсистем, при которых достигаются наилучшие результаты распознавания. Для такого исследования разрабатывается специальный эксперимент. А также реализуется специальное программное обеспечение.
Для проведения экспериментов использовались фотографии, полученные из наборов fa, fb базы изображений лиц COLORFERET. Из оригинальных изображений вырезалась область, ограниченная следующим прямоугольником: от 50 точек левее левого глаза до 50 точек правее правого глаза; от 50 точек выше верхнего глаза до 50 точек ниже рта. Координаты глаз и рта были взяты из xml-файлов описания. В испытаниях использовались изображения для 847 людей. Всего в экспериментах участвовало 2*847 = 1694 изображения. Положим, что множество фотографий типа fa - это эталонная база. А множество фотографий fb - это распознаваемая база. Заметим, что для каждого распознаваемого изображения в ЭБ имеется эталонное изображение того же класса.
В рамках ПНУ производится предварительная обработка фотографии. Типичные операции предобработки таковы:
• Приведение к серому полутоновому. Производится, если изображение, поступающее на вход алгоритма распознавания, цветное. Преобразование осуществляется по формуле
1{х,у) = 0.299 ■ R{x,у) + 0.587 ■ G(x,y) + 0.114 • В(х,у)
• Масштабирование. На этом этапе все входные изображения приводятся к единому размеру: 256 пикселей на 256 пикселей. Масштабирование производится при помощи бикубической интерполяции.
Для выявления параметров алгоритмов построения ВП, при которых достигается лучшая корректность ПНУ, используется априорная информацию о принадлежности эталонных и распознаваемых изображений к конкретным классам. Будет определяться корректность ПНУ при некоторых значения параметров построения ВП и строиться зависимость корректности от параметров.
Эксперименты проводятся с использованием эталонной базы и распознаваемой базы по следующей методике:
1. Фиксируется параметр алгоритма
2. Для всех изображений е 6 Е эталонной базы и t 6 Г распознаваемой базы вычисляются вектора признаков /ie,/ic для заданного параметра f. Причем вектора /iefl fr^.Vt вычислены для изображений одного класса (то есть одного человека). Таким образом, имеем два множества векторов: Не = {ке},Н1 = {№}.
3. Выбирается некоторый вектор признаков
4. При помощи метрики Dfö.h.') вычисляется минимальное расстояние между вектором №/ и всеми векторами hej. Определяется вектор hej, для которого достигается минимальное значение Dfö^h'j).
5. Если i = j, то считаем, что ПНУ для РИ t, работает корректно.
6. Повторяем шаги 3-5 для всех hc 6 Н'. При этом подсчитываем число РИ, для которых ПНУ работает корректно (шаг 5).
7. Среди всех РИ вычисляем долю РИ, для которых ПНУ работает корректно. Это число Ч* будет являться корректностью ПНУ при данном параметре.
8. Выбирается другое значение параметра £ алгоритма. Для него повторяются шаги 2-7.
Перебирая значения параметров, опытным путем устанавливается зависимость корректности ПНУ от этих параметров. Результаты экспериментов для реализуемых методик представлены на графиках ниже.
Рис. 1. Результаты ПНУ на базе ДК11 Рис. 2. Результаты ПНУ на моментах Лежандра
.............................——....................................................................... 1
_______].........................................МЯШ.......................... ............. 1
1
3
I
I
• 1
. J вв I
i= г
...............................*.....
* -----—__
-
1
II
1
........
Рис. 5. Результаты ПНУ на порядковых гисто- Рис. 6. Результаты ПНУ иа масках Собеля граммах
Как видно из графиков, корректность различных ПНУ может значительно отличаться. Так лучшая ПНУ (Карта Лавса Е5Е5) показала результат 84,18%, что является весьма хорошим результатом для алгоритмов работающих в рамках проблемы одного эталона. В то время как худшие результаты (на моментах Цернике) составляют 58,09%. Это обстоятельство, безусловно, имеет большое значение при использовании только одной подсистемы для распознавания. Однако в предлагаемой модели распознавания даже подсистема с невысокими показателями может дать существенный прирост для системы распознавания в целом если она корректно работает иа фотографиях людей отличных от корректно обрабатываемых более успешными методиками.
Отдельно остановимся на процедуре каскадного применения дискретного косинусного преобразования к картам Лавса. Оно не дает выигрыша в кор-
ректности ПНУ. И главное его предназначение здесь - уменьшение размерности вектора признаков. С увеличением числа коэффициентов корректность ПНУ медленно асимптотически приближается к верхней границе (Рис. 4).
График же зависимости корректности ПНУ, использующей маски Собеля, от количества ДКП-коэффициентов (Рис. 6) имеет ярко выраженный экстремум. Высокочастотные коэффициенты ДКП уже начинают мешать и снижают корректность ПНУ. Аналогичная ситуация наблюдается и в подсистеме, основанной только на ДКП (Рис. 1), а также и в моментах Лежандра (Рис. 2). В них высокочастотные коэффициенты также начинают мешать, ухудшая корректность ПНУ.
Каскадное применение ДКП к картам Лавса и маскам Собеля, а также ПНУ на базе ДКП и моментов Лежандра дает основание предположить, что в распознавании образов наиболее важной является среднечастотная составляющая изображения. Видимо в низкочастотной составляющей еще недостаточно информации для распознавания. А в высокочастотной составляющей начинает появляться шум, мешающий распознаванию. Так как маски Собеля являются высокочастотными масками, то количество ДКП-коэффициентов, при которых достигается лучшая корректность ПНУ, больше. То есть максимум графика зависимости "У (О смещается в них в сторону высокочастотных коэффициентов по сравнению с ПНУ, использующей только ДКП. Тем не менее, и там и там основную роль играют среднечастотные коэффициенты, число которых определяется индивидуально.
В четвертой главе в соответствии с моделью системы распознавания, предложенной во второй главе, необходимо проанализировать совместную работу ПНУ, необходимо из них составить подсистемы верхнего уровня. А также подобрать несколько ПВУ в систему распознавания так, чтобы система была достаточно эффективной при имеющихся условиях. Для рассмотрения совместной работы ПНУ необходимо разработать специальный эксперимент и получить для него результаты. Для исследования совместной работы подсистем нам понадобятся два эксперимента.
Рассмотрим распознаваемую базу Т = {£!, состоящую из N распо-
знаваемых изображений. И эталонную базу Е = (еи ...,ен}, состоящую из N эталонных изображений. Каждая база содержит по одному изображению для каждого из N классов. Для определенности положим, что ЭИ и РИ занумерованы так, что индекс изображения определяет его класс. То есть, изображения одного класса.
Каждая из подсистем нижнего уровня строит для некоторого распознаваемого изображения главный список -^(¿О — е; 2. —}•
Экспериментом с эталоном назовем эксперимент, в котором для построения главного списка = {е(д,сг,2,...} используется вся эталонная база Е. То есть вц 6 Е.
Экспериментом без эталона назовем эксперимент, в котором для построения главного списка ^ (¿¡3 = {еи,еа,...} используется эталонная база
Е с изъятым из нее соответствующим эталонным изображением е,- для распознаваемого £(. То есть вц 6 Я\б[.
Результатами каждого из экспериментов для некоторой ПНУ являются N главных списков - для каждого распознаваемого изображения Главные списки состоят из номеров ЭИ в эталонной базе. Эксперименты ставятся для каждой рассматриваемой ПНУ с параметрами, при которых достигается лучшая корректность ПНУ.
Допустим, необходимо исследовать работу ПВУ, состоящей из двух ПНУ. Для этого будем использовать результаты двух экспериментов для каждой ПНУ. Веса элементов главного списка равны между собой и составляют 1. Определим пороговое значение критерия распознавания и/кр = 2. Это означает, что для выполнения критерия распознавания для некоторого РИ необходимо чтобы пересечение главных списков этих двух ПНУ было не пустым.
Размер ошибки первого рода будет определяться как отношение числа выполнений КР в эксперименте с эталоном к общем)' числу распознаваемых изображений. Введем обозначение РКЯ - размер ошибки первого рода.
N — количество выполнений КР в эксперименте с эталоном
FRR = ■
N
где N - число элементов РБ.
Размер ошибки второго рода будет определяться как отношение числа выполнений КР в эксперименте без эталона к общему числу распознаваемых изображений. Введем обозначение FAR - размер ошибки первого рода.
количество выполнений КР в эксперименте без эталона
™ =----N-------
где N - число элементов РБ.
Табл. 1. Результаты работы системы при распознавании яиц
Состав ПВУ
ПВУ №1
FRR
35,48%
FAR
1,52%
Моменты Лежандра, полное изображение
Карты Лавса. Сегментированное изображение (верхняя половнма)
Карты Лавса Сегментированное изображение (вторая четверть)
ПВУ №2
46,02%
1,76%
Маски Собеля, полное изображение
Порядковые гистограммы., полное изображение
Дискретное косинусное преобразование, полное изображение
ПВУ №3
25,53%
3,63%
Карты Лавса. Сегментированное изображение (левая половина)
Карты Лавса. Сегментированное изображение (правая половина)
Карты Лавса. Сегментированное изображение (верхняя половина)
ПВУ №4
33.02%
! ,29%
Порядковые гистограммы, полное изображение
Карты Лавса. Сегментированное изображение (верхняя половина)
Карты Лавса. Сегментированное изображение (правая половина)
Система в целом
18,»3%
7,03%
Анализ совместной работы подсистем нижнего уровня показал целесообразность использования модели распознавания, состоящей из вырожденных подсистем верхнего уровня. Пусть ПВУ состоит из п ПНУ. Каждая ПНУ имеет весовой коэффициент равный - и фор-
мирует главный список из одного эталонного изображения. Установим пороговое значение для выполнения критерия распознавания равным wKp = 1. Он будет постоянным и неизменным.
После проведения анализа результатов экспериментов для всех ПНУ было составлено четыре ПВУ, каждая из которых состоит из трех ПНУ. Состав и результаты работы ПВУ представлен в таблице (Табл. 1).
Сравним результаты работы предлагаемой системы с другими алгоритмами. Рассмотрим алгоритмы, представленные рамках программы Face Recognition Vendor Test (FRVT'2006). Здесь представлены алгоритмы, имеющие изменяющееся пороговое значение похожести изображений. Изменяя этот порог можно менять значение ошибок первого рода. Однако при этом, как правило, обратно пропорционально меняется и ошибка второго рода. На графиках мы видим эти зависимости (Рис. 7).
В нашей же системе величины ошибок фиксированы. Поэтому предлагаемая система на графике выглядит точкой. Точка, соответствующая значениям ошибок, полученным в настоящей работе, (FRR=0,1803 и FAR=0,0703) на графике отмечена четырехконечной звездой. Наглядно видно, что настоящая система превосходит все представленные на графике алгоритмы (точка лежит ближе к координатным осям). Некоторые намного превосходит, а некоторые незначительно.
Проводилось исследование распознавания предлагаемой системы при внедрении на фотографии различных шумов. Выявлены следующие закономерности работы системы:
» Структура системы обуславливает низкий уровень ошибки второго рода практически при любом из рассмотренных вариантов помех;
» Устойчивое распознавание достигается при использовании фотографий с разрешением от 128*128 точек и выше;
• Размытие только распознаваемых изображений крайне негативно сказывается на работе системы. Однако при симметричном размытии фотографий (и распознаваемых и эталонных) система вполне устойчива и работоспособна;
• Применение сжатия (в частности jpeg) практически не оказывает влияния на распознавание;
в Маскировка предъявляемых фотографий увеличивает ошибку первого рода. И это увеличение происходит практически линейно.
Для проверки универсальности предлагаемой системы распознавания, ее неадаптивностн проводились эксперименты по распознаванию промышленных изделий. В качестве экспериментального набора фотографий объектов
Рис. 7. Сравнение с другими системами
Рис 8. Эталонные и распознаваемые изображения промышленных изделий (взято из АЬ01).
Исследование работы системы для таких исходных данных проводилось аналогично исследованию при распознавании фотографий лиц людей. Доля ошибок системы на представленной базе промышленных изделий в сравнении с распознаванием лиц представлена в таблице ниже (Табл. 2).
Табл. 2. Результаты распознавания промышленных из-
Шдсистема Ошибка I рода Ошибка It рода
лица ¡изделия JilHU 1 'Н.и'.ч™
ПВУШ 35,48% 43,70% 1,52% 2,40%
ТШУМЙ 46,02% ? .60% 1,76% 4,80%
. ИВУ №3 25,53% 33,20% 3,63% ! 2,30%
ПВУ №4 33,02% г~32,80% 1,29% 2,40%
Вся система 18,03% 1,31)% 7,03% 8,70%
Сравнивая результаты распознавания промышленных изделий с результатами распознавания лиц, отметим значительное снижение ошибки распознавания первого рода. Она уменьшилась с 18,03% до 1,3%. Такое существенное улучшение распо-
для распознавания использовалась общедоступная база изображений объектов Amsterdam Library of Object Images (ALOI). Эта база содержит фотографии 1000 объектов, сфотографированных как при различном освещении, так и при различных углах съемки. В качестве объектов выступают различные промышленные изделия (Рис. 8). Для экспериментов использовались фотографии объектов, снятые при углах съемки, отличающихся на 10 градусов. Фотография объекта в фас использовалась в качестве эталонного изображения. А фотография объектов под углом 10 градусов использовалась в качестве распознаваемого изображения. Таким образом, в эксперименте участвовало всего 2000 фотографий.
знавания можно объяснить тем, что промышленные изделия являются более простыми с точки зрения распознавания объектами. В то время как лица являются более сложными в этом смысле.
Подводя итоги экспериментов по распознаванию промышленных изделий можно сделать следующие выводы.
• Система распознавания подтвердила универсальность своего применения. В экспериментах по распознаванию принципиально других объектов, а именно промышленных изделий, она продемонстрировала очень низкие ошибки распознавания.
• Успешность настоящих экспериментов обуславливается неадаптивностью структуры системы распознавания и применяемых в ней подсистем. В основе подсистем распознавания лежат не механизмы исследования структуры распознаваемых образов, а принцип равной реакции подсистем на эти образы. Подсистемы нижнего уровня преобразуют карту яркости распознаваемого изображения и извлекают из нее набор атрибутов — вектор атрибутов. Дальнейшее исследование соотношения векторов атрибутов производится средствами векторной алгебры в пространствах таких векторов.
• Наиболее простые подсистемы (на моментах Лежандра и на ДКП) продемонстрировали улучшение корректности работы. В то время как некоторые наиболее сложные (на картах Лавса) наоборот чаще ошибались: самая неуспешная подсистема на картах Лавса показала корректность работы в 48,2%.
• Подсистема распознавания на порядковых гистограммах также продемонстрировала улучшение корректности распознавания. Несмотря на то, что достаточно большую часть фотографий занимает подложка черного цвета с одной и той же текстурой.
• Сравнивая работу системы при распознавании лиц и классификации промышленных изделий, заметим что корректность подсистем может зависеть от типа распознаваемых объектов. Подсистемы на картах Лавса, являясь самыми успешными подсистемами при распознавании лиц, продемонстрировали ухудшение корректности работы при распознавании изделий. И наоборот подсистемы на базе ДКП гораздо лучше распознают промышленные изделия, чем лица. В целом же система является достаточно сбалансированной: ухудшение работы одних подсистем компенсируется улучшением работы других. Различные алгоритмы преобразований изображений и построения векторов признаков, используемые в подсистемах, позволяют распознавать разнотипные объекты.
В заключении формулируются основные результаты работы, а именно: 1. Осуществлен обзор и анализ существующих алгоритмов распознавания.
Сделаны выводы о недостаточной эффективности или проблематичности
применения рассмотренных алгоритмов в задаче распознавания образов
по единственному изображению.
2. Установлена актуальность исследования, связанная с потребностями развития систем компьютерного зрения для обеспечения более эффективного взаимодействия техники и человека.
3. Предложена формальная математическая модель распознавания, отличающаяся следующим:
а) Она позволяет эффективно работать в условиях ограниченного количества информации: с одним эталоном на класс в системе и с одной фотографией для распознавания.
б) Она является неадаптивной, то есть не адаптированной для распознавания определенного типа объектов. Обладает универсальностью применения.
в) Она масштабируема. В рамках системы может использоваться большое количество различных алгоритмов распознавания и обработки изображений. Это позволяет извлекать из единственного эталонного и единственного распознаваемого изображений как можно больше разнообразных данных. И использовать эти данные для распознавания. Таким образом позволяя всесторонне исследовать изображение объекта.
4. Определён конкретный набор алгоритмов распознавания, использующихся в предложенной модели. Алгоритмы используют принцип ближайшего соседа и основаны на различных процедурах обработки изображений. В том числе предложены следующие новые процедуры распознавания:
а) Предложен метод каскадного применения алгоритмов обработки изображений. Метод позволяет использовать для распознавания различные производные карты яркости изображений. А также позволяет уменьшить количество элементов векторов признаков, что ускоряет работу алгоритмов.
б) Для распознавания предложен метод, основанный на порядковых гистограммах, использующий ортонормированный базис Фрея-Чена. Особенностью метода является статистическое исследование мелкотекстурных особенностей распознаваемого объекта, а не его контуров. Что делает метод более устойчивым к ракурсу съемки распознаваемого объекта.
5. Проведены эксперименты, направленные на исследование предложенных алгоритмов распознавания и определение лучших режимов их работы. Эксперименты проводились при помощи специально разработанного программного обеспечения.
6. Построена модель распознавания. В ходе анализа совместной работы подсистем нижнего уровня предложено конкретное наполнение модели подсистемами. Используемые в модели ПНУ работают в режимах, с которыми они показали лучшие результаты.
7. Проведены эксперименты для расчета ошибок работы системы. Осуществлено сравнение этих ошибок с результатами работы других алгоритмов распознавания. Экспериментально выявлено:
а) Преимущество предложенной модели над другими алгоритмами, выражающееся в более низких значениях ошибок.
б) Подтвержден высказанный теоретически принцип сотрудничества подсистем верхнего уровня. Четыре ПВУ, которыми была наполнена модель распознавания, совместно показали более низкую ошибку первого рода нежели по отдельности.
8. Создан экспериментальный макет модели распознавания.
9. Проведены эксперименты на устойчивость модели к различным искажениям распознаваемых изображений. В ходе экспериментов выявлено:
а) Предложенная модель не допускает значительных ошибок второго рода в условиях различных искажений. Следовательно, сравнительно низкая ошибка второго рода является свойством предложенной модели.
б) В условиях различных искажений ошибка первого рода может сильно расти. Что определяется в первую очередь эффективностью работы конкретных подсистем в тех или иных условиях.
в) Экспериментальный макет достаточно успешно работает при разрешении фотографий начиная со 128*128 точек. То есть успешно работает даже с фотографиями среднего качества.
Ю.Проведены эксперименты на универсальность применения модели для распознавания различных объектов. В ходе экспериментов получены следующие результаты:
а) Подтверждена неадаптивность предлагаемой системы - она успешно распознает не только лица, но и промышленные изделия. Лица людей гораздо более сложные объекты, а рассмотренные детали более простые. Система успешно распознает и те, и другие.
б) При распознавании объектов различного рода корректность подсистем нижнего уровня может изменяться. Однако в целом система является достаточно сбалансированной. Ухудшение работы одних подсистем компенсируется улучшением работы других.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в журналах ВАК
1. Прокошев, В.Г. Проблема автоматического распознавания лиц с одним эталонным изображением / В.Г. Прокошев, М.М. Рожков, П.Ю. Шамин // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Серия «Информатика. Телекоммуникации. Управление». — СПб, 2010. — №5. — С. 13-18.
2. Рожков, М.М. Использование текстурных карт Лавса и дискретного косинусного преобразования в задаче распознавания лиц / Рожков М.М. // Прикладная информатика — М, 2011. — №1 (31). — С. 98-103. — ISSN 1993-8314.
3. Прокошев, В.Г. Построение подпространств атрибутов на базе одного эталона для обеспечения устойчивости работы в перспективных системах автоматического распознавания лиц. / Прокошев В.Г., Рожков М.М., Шамин П.Ю., Голубев A.C. //Прикладная информатика — М, 2011.—Ks2 (32). — С. 100-107. — ISSN 1993-8314.
Публикации в других изданиях
4. Рожков, М.М. Система неадаптивного распознавания образов в условиях ограниченного количества информации: монография / М.М. Рожков [и др.]; Владим. гос. ун-т. — Владимир: Изд-во владим. гос. ун-та, 2011. — 120 е. —ISBN 978-5-9984-0212-8.
5. Рожков, М.М. Некоторые вопросы распознавания лиц в ситуации одного эталонного изображения / Рожков М.М., Звягин М.Ю., Шамин П.Ю. // Материалы И-ой международной научно-практической конференции студентов, аспирантов и молодых ученых «Прогрессивные технологии и перспективы развития». — Тамбов, 2010. — С. 53-55. — ISBN 978-5-90503903-4.
6. Рожков, М.М. К вопросу использования текстурных карт Лавса для распознавания лиц в рамках проблемы одного эталонного изображения / М.Ю. Звягин, М.М. Рожков, П.Ю. Шамин // Труды Владимирского государственного университета. — Владимир, 2010. — Выпуск 7, Физико-математические основы индустрии наносистем и материалов. — с. 90-92. — ISBN 978-5-9984-0115-2.
7. Рожков, М.М. Актуальность 2D алгоритмов в определенных задачах автоматического распознавания человека / Рожков М.М. // Материалы научной конференции «Технические науки: проблемы и перспективы» — СПб, 2011, —С. 145-146. —ISSN 2072-0297.
8. Прокошев, В.Г. Модульная программа идентификации человека по растровому двумерному изображению лица / В.Г. Прокошев, М.Ю. Звягин, A.B. Лоханов, П.Ю. Шамин, A.C. Голубев, М.М. Рожков, К.О. Боченина II Зарегистрированная программа для ЭВМ. — Свидетельство о государственной регистрации программы для ЭВМ № 2011611917.
9. Аракелян, С.М. Программа тестирования и обработки алгоритмов распознавания / С.М. Аракелян, М.Ю. Звягин, Д.С. Квасов, П.Ю. Шамин, A.C. Голубев, М.М. Рожков // Зарегистрированная программа для ЭВМ. — Свидетельство о государственной регистрации программы для ЭВМ № 2011611918.
Подписано в печать 07.10.11. Формат 60x84/16. Усл. печ л. 1,16. Тираж 100 экз. Заказ Издательство Владимирского государственного университета имени Александра Григорьевича и Николая Григорьевича Столетовых 600000, Владимир, ул. Горького, 87.
Оглавление автор диссертации — кандидата технических наук Рожков, Максим Михайлович
СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ.
ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР ЗАДАЧИ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ ЛИЦ.
1.1 Актуальность разработки системы.
1.2 Решаемая задача и исходные данные.
1.3 Обзор методов распознавания.
1.3.1 Общие методы.
1.3.2 Специализированные методы.
1.4 Оценка рассмотренных методов распознавания.
1.5 Выводы по главе.
ГЛАВА 2. ОПИСАНИЕ ПРЕДЛАГАЕМОЙ СИСТЕМЫ.
2.1 Общая схема предлагаемой системы.
2.1.1 Подсистема нижнего уровня.
2.1.2 Подсистема верхнего уровня.
2.1.3 Ошибки распознавания I и II рода.
2.1.4 Требования к подсистемам нижнего уровня.
2.1.5 Функциональные элементы подсистем нижнего уровня.
2.1.6 Сегментация изображений.
2.1.7 Схема модели системы распознавания.
2.1.8 Структура изображения.
2.2 Подсистемы распознавания, базирующиеся на преобразовании Фурье.
2.2.1 Подсистема, использующая дискретное косинусное преобразование.
2.3 Подсистемы распознавания, инвариантные к аффинным преобразованиям.
2.3.1 Подсистема, использующая моменты Лежандра.
2.3.2 Подсистема, использующая инварианты Цернике.
2.4 Текстурные подсистемы распознавания.
2.4.1 Подсистема, основанная на энергетических Картах Лавса.
2.4.2 Подсистема, основанная на порядковых гистограммах.
2.4.3 Подсистема, использующая детектор краев на масках Собеля.
2.5 Сходство и различие в алгоритмах построения векторов признаков.
2.6 Выводы по главе.
ГЛАВА 3. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ПОДСИСТЕМ РАСПОЗНАВАНИЯ.
3.1 Постановка эксперимента.
3.1.1 Экспериментальная база изображений.
3.1.2 Описание эксперимента.
3.2 Эксперименты и выявление наилучших режимов работы подсистем.
3.2.1 Предварительная обработка фотографий.
3.2.2 Эксперимент с подсистемой на базе ДКП.
3.2.3 Эксперимент с подсистемой на базе моментов Лежандра.
3.2.4 Эксперимент с подсистемой на базе инвариантов Цернике.
3.2.5 Эксперимент с подсистемой, использующей карты Лавса.
3.2.6 Эксперимент с подсистемой, использующей порядковые гистограммы.
3.2.7 Эксперимент с подсистемой, использующей маски Собеля.
3.3 Выводы по главе.
ГЛАВА 4. ПРОЕКТИРОВАНИЕ И ИСПЫТАНИЕ СИСТЕМЫ РАСПОЗНАВАНИЯ.
4.1 Цели и задачи проектирования.
4.2 Анализ совместного функционирования подсистем.
4.2.1 Описание экспериментов.
4.2.2 Представление результатов экспериментов.
4.2.3 Проведение анализа.
4.2.4 Соображения о предельном случае ошибок.
4.3 Предлагаемая конфигурация системы как результат анализа совместной работы подсистем.
4.3.1 Вырожденная подсистема верхнего уровня.
4.3.2 Состав системы и результаты ее работы.
4.3.3 Сравнение с аналогичными системами.
4.4 Испытание устойчивости системы распознавания.
4.4.1 Набор помех.
4.4.2 Результаты системы с помехами.
4.4.3 Сравнение ошибок системы, без помех и ошибок возникающих в результате действия помех.
4.4.4 Выводы об устойчивости системы к различным помехам.
4.5 Эксперименты по распознаванию промышленных изделий.
4.5.1 Постановка экспериментов.
4.5.2 Сравнение результатов распознавания системой промышленных изделий и лиц.
4.6 Выводы по главе.
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Рожков, Максим Михайлович
Предмет исследования
В последние годы происходит всё более широкое внедрение методов распознавания образов. Рост интереса к таким методам объясняется, с одной стороны, возрастающей потребностью в них (в отраслях роботостроения и приборостроения, в правоохранительных органах), с другой же — расширяющимися возможностями вычислительной техники.
Рост производительности' вычислительной техники повышает эффективность систем распознавания за счёт возможности осуществлять более быстрый поиск в больших базах данных и возможности в реальном времени реализовывать всё более сложные и эффективные алгоритмы распознавания. В настоящее время ведутся интенсивные исследования, направленные на решение задач распознавания.
Одним из проблемных направлений распознавания образов является задача распознавания в условиях ограниченного количества информации. Когда система имеет лишь по одному изображению объектов в своей базе. И для распознавания она получает только одно изображение. Существующие алгоритмы демонстрируют в таких условиях сравнительно низкие результаты работы.
Предметом настоящего исследования является улучшение корректности распознавания образов в условиях ограниченного количества информации.
Цели и задачи исследования
Цель работы заключается в разработке системы распознавания, улучшающей эффективность распознавания образов в условиях ограниченного количества информации: при наличии в системе только одного изображения для каждого распознаваемого объекта.
Для достижения поставленной цели решались следующие задачи:
• Проводилось изучение существующих алгоритмов распознавания, их классификации, выявление преимуществ и недостатков.
• Разрабатывалась формальная математическая модель системы распознавания.
• Исследовался ряд алгоритмов обработки изображений на применимость к решению задачи распознавания образов.
• Улучшались исследованные и разрабатывались новые алгоритмы распознавания образов для их последующего использования в предложенной системе.
• Разрабатывалось специальное программное обеспечение, на базе которого экспериментально проверялись алгоритмы распознавания в отдельности и при совместной работе в системе распознавания.
• По результатам экспериментов проектировалось наполнение предложенной системы набором алгоритмов распознавания.
• Проводился анализ работы системы распознавания. Анализ включал сравнение результатов работы системы с работой аналогичных систем распознавания. А также проверялось влияние различных искажений распознаваемых образов на результаты работы системы.
Методы исследования
Достоверность полученных в работе результатов обеспечивается применением методов системного анализа, теории распознавания образов, теории множеств, теории алгоритмов, теории вероятности, математической статистики и подтверждены результатами экспериментов, проведенных с помощью специально созданного программного обеспечения.
Научная новизна
Научную новизну работы определяют следующие положения:
1. Предложена модель системы распознавания образов, позволяющая совместно использовать несколько методов распознавания различного типа. Главными особенностями системы являются:
• Система является неадаптивной. Она не адаптирована для распознавания какого-то конкретного типа объектов. И теоретически может применяться для распознавания различных образов.
• Система распознавания имеет модульную структуру. Что позволяет расширять или улучшать систему путем» добавления, исключения или замены подсистем верхнего уровня.
• Взаимодействие подсистем верхнего* уровня основано на сотрудничестве: система принимает решение- о наличии распознаваемого образа в эталонной базе, если хотя бы одна из подсистем.определила такое соответствие.
• В качестве подсистем нижнего уровня может использоваться^ любой алгоритм, использующий принцип ближайшего , соседа и реализующий попарное сравнение распознаваемого изображения с эталонными.
• Взаимодействие подсистем нижнего уровня основано на конкуренции. Для принятия подсистемой верхнего уровня решения о наличии в базе распознаваемого образа необходимо чтобы все подсистемы нижнего уровня, входящие в нее, определили ближайшим соседом одинаковое эталонное изображение.
• Система может использовать, большое количество разнообразных алгоритмов, что- позволяет исследовать изображения различными методами. И таким образом более полно использовать ограниченную информацию, содержащуюся в одном изображении.
2. Предложен метод каскадного применения процедур преобразования распознаваемого изображения по схеме: построение производной карты — сканирование волновым пакетом. Метод позволяет:
• использовать для распознавания различные производные карты исходного изображения;
• уменьшить количество хранимых в системе данных и как следствие ускорить поиск в них.
3. Предложен алгоритм распознавания, использующий порядковые гистограммы. Алгоритм учитывает мелкотекстурные особенности изображения распознаваемого объекта. И может использоваться' для-правильного распознавания образов, отличающихся по ракурсу от имеющихся в системе.
Практическая ценность и реализация результатов
Разработанные в? настоящей, работе система и методы распознавания повышают достоверность распознавания образов в условиях ограниченного количества информации. Благодаря масштабируемости системы распознавания можно последовательно улучшать- результаты* ее работы за счет добавления или совершенствования её отдельных подсистем.
Разработанные в диссертации алгоритмы, математические модели и программные средства легли в основу подсистемы распознавания в рамках выполнения госбюджетной опытно-конструкторской работы.«2009-04-2.4-15-03» по теме: «Разработка технических средств распознавания образов по анализу видеоизображения для автоматизации работы, оператора». Предложенная система реализована и успешно функционирует на опытном образце комплекса. Это обстоятельство делает целесообразным и возможным промышленное производство данного комплекса.
Апробация работы
Основные результаты работы докладывались на следующих научно-технических и научно-практических конференциях, семинарах и салонах:
• XVII Всероссийская научно-методическая конференция «Телематика-2010», Санкт-Петербург, 21-24 июня 2010 г.
• II Международная научно-практическая конференция «Прогрессивные технологии и перспективы развития», Тамбов, 5 ноября 2010 г.
• Международная научная конференция «Технические науки: проблемы и перспективы», Санкт-Петербург, март 2011 г.
• Международный салон «Комплексная безопасность 2011», Москва, ВВЦ, 17-20 мая 2011 г. .
• Семинар кафедры Информационных систем Муромского института ГОУ ВПО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых», Муром, 24 мая 2011 г.
Положения, выносимые на защиту
Основные научные результаты диссертации, выносимые на защиту, заключаются в следующем:
1. Система распознавания образов, позволяющая совместно использовать несколько алгоритмов распознавания различного типа.
2. Набор алгоритмов, обеспечивающих работоспособность, предложенной системы.
3. Результаты экспериментов по распознаванию лиц предложенной системой.
Публикации
Основные результаты работы представлены в 9 публикациях, в том числе в 3 статьях журналов из перечня ВАК и одной монографии, а также в научно-технических отчетах ОКР, выполненных по заданию Федерального агентства по науке и инновациям.
Объем и структура диссертации
Текст диссертационной работы изложен на 145 стр. машинописного текста. И дополнен четырьмя приложениями на 28 стр. Содержательная часть включает введение, четыре главы и заключение. Список использованных источников содержит 92 наименования. Таблиц - 22, рисунков - 65.
В главе 1 обосновывается актуальность работы. Описывается постановка задачи и исходные данные. Дается подробный обзор наиболее распространенных алгоритмов распознавания, проводится их классификация, рассматриваются сильные и слабые стороны. Производится оценка рассмотренных алгоритмов с точки зрения- их пригодности для решения поставленной задачи. Делаются выводы о том, что рассмотренные алгоритмы не могут в полной мере решить её. В выводе описывается- идеология, которая будет применяться для*распознавания, и основные требования к алгоритмам.
Глава 2* посвящена- разработке математических моделей и методов распознавания. Формально описывается математическая модель неадаптивной системы. Рассматриваются ошибки распознавания, возникающие в системе (первого и второго рода). Вводятся понятия подсистем верхнего и нижнего уровней. Определяются формальные требования к подсистемам. Описываются механизмы их взаимодействия в рамках системы. Предлагается ряд алгоритмов распознавания, которые могут применяться в качестве подсистем. Вводятся понятия векторов признаков и расстояния между ними. Для каждого предлагаемого алгоритма детально описываются процедуры построения векторов признаков и расчета расстояния между ними. А также определяются параметры, изменяя которые можно улучшать работу этих алгоритмов.
В главе 3 приводятся результаты экспериментального исследования выбранных алгоритмов распознавания. Для этого дается формальное описание эксперимента. И приводятся результаты этого эксперимента, полученные для каждого выбранного алгоритма при помощи специально разработанного программного обеспечения. Результаты экспериментов позволяют определить значения параметров, при которых достигаются лучшие показатели безошибочности работы рассматриваемых алгоритмов.
Четвертая глава посвящена проектированию распознающей системы. Проводится анализ совместной работы подсистем распознавания нижнего уровня на предмет ошибок первого и второго рода. Предлагается конкретное наполнение системы распознавания подсистемами верхнего и нижнего уровней. Также проводятся эксперименты для определения влияния различных искажений распознаваемых изображений на результаты ее работы. Делаются оценки работы и сравнение с другими системами.
Каждая глава завершается кратким обобщением изложенного материала и формулировкой основных выводов.
В заключении приводятся выводы по диссертационной работе.
Заключение диссертация на тему "Система неадаптивного распознавания образов в условиях ограниченного количества информации"
4.6 Выводы по главе
В настоящей главе был создан макет предлагаемой модели распознавания. Система распознавания была наполнена конкретными подсистемами. Среди этих подсистем имеются такие, которые используют весьма простые или распространенные процедуры обработки изображений (такие как ДКП, моменты Лежандра, маски Собеля). Однако даже в случае наполнения системы распознавания такими незамысловатыми, подсистемами она продемонстрировала превосходство над рядом других алгоритмов.
Это обстоятельство делает саму модель весьма перспективной для задач распознавания образов с использованием единственного эталона. Ведь наполняя ее более эффективными алгоритмами можно достичь улучшения результатов её работы.
Система распознавания также- подверглась, исследованиям на универсальность применения и на устойчивость в зависимости от различных помех, накладываемых на изображения. В ходе исследования была обнаружена следующая особенность модели: система распознавания не допускает значительного роста ошибки второго рода ни при каких помехах. При этом ошибка первого рода может быть различной. Что определяется в первую очередь эффективностью работы конкретных подсистем в тех или иных условиях.
Предложенная система и используемые в ней подсистемы достаточно успешно работают при разрешении фотографий начиная со 128*128 точек. То есть предложенная модель может работать с обычными камерами широкого распространения. И использовать для распознавания фотографии среднего качества.
Заключение
В настоящей диссертационной работе были проведены следующие действия.
1. Осуществлен обзор и анализ существующих алгоритмов распознавания, показавший следующее: а) метод главных компонент демонстрируют невысокие показатели корректности распознавания в условиях ограниченного количества информации (в рамках проблемы одного эталонного изображения); б) линейный дискриминантный анализ очень критичен к точному центрированию изображений, что накладывает дополнительные ограничения на алгоритмы захвата изображения лица; в) алгоритмы оптического потока требуют огромного количества вычислений, причем с ростом эталонной базы количество вычислений растет быстрее линейной зависимости; г) алгоритмы, использующие СММ и ИНС требуют обучения на многих эталонах для эффективной работы; д) специализированные алгоритмы спроектированы для решения узкой задачи - распознавание лиц, и характеризуются недостаточной общностью применения; е) Трехмерные- модели и эластичные графы будет проблематично правильно построить, имея в наличии единственное эталонное изображение.
2. Установлена актуальность исследования, связанная с потребностями развития систем компьютерного зрения для, обеспечения более эффективного взаимодействия техники и человека. Задача распознавания образов является одним из важнейших направлений компьютерного зрения. Её успешное решение необходимо для разработки и производства систем; способных интеллектуально оценивать внешнюю среду и выполнять в ней необходимые действия.
3. Предложена формальная математическая модель распознавания, отличающаяся следующим: а) Она позволяет эффективно работать в условиях ограниченного количества информации: с одним эталоном на класс в системе и с одной фотографией для распознавания. б) Она является неадаптивной, то есть не адаптированной для распознавания определенного типа объектов. Обладает универсальностью применения. в) Она масштабируема. В рамках системы может использоваться большое количество различных алгоритмов распознавания и обработки изображений. Это позволяет извлекать из единственного эталонного и единственного распознаваемого изображений как можно больше разнообразных данных. И использовать эти данные для распознавания. Такими образом позволяя всесторонне исследовать изображение объекта.
4. Определён конкретный набор алгоритмов распознавания, использующихся в предложенной модели. Алгоритмы используют принцип ближайшего соседа и основаны на различных процедурах обработки изображений. В том числе предложены следующие новые процедуры распознавания: а) Предложен метод каскадного применения алгоритмов обработки изображений. Метод позволяет использовать для распознавания различные производные карты яркости изображений. А также позволяет уменьшить количество элементов векторов признаков, что ускоряет работу алгоритмов. б) Для распознавания предложен метод, основанный на порядковых гистограммах, использующий ортонормированный базис Фрея-Чена. Особенностью метода является статистическое исследование мелкотекстурных особенностей распознаваемого объекта, а не его контуров. Что делает метод более устойчивым к ракурсу съемки распознаваемого объекта.
5. Проведены эксперименты, направленные на исследование предложенных алгоритмов распознавания и определение лучших режимов их работы. Эксперименты проводились при помощи специально разработанного программного обеспечения [А32].
6. Построена модель распознавания. В ходе анализа совместной работы подсистем нижнего уровня предложено конкретное наполнение модели подсистемами. Используемые в модели ПНУ работают в режимах, с которыми они показали лучшие результаты.
7. Проведены эксперименты для расчета ошибок работы системы. Осуществлено сравнение этих ошибок с результатами работы других алгоритмов распознавания. Экспериментально выявлено: а) Преимущество предложенной модели над другими алгоритмами, выражающееся в более низких значениях ошибок. б) Подтвержден высказанный теоретически принцип сотрудничества подсистем верхнего уровня. Четыре ПВУ, которыми была наполнена модель распознавания, совместно показали более низкую ошибку первого рода нежели по отдельности.
8. Создан экспериментальный макет модели распознавания [А28]. Для макета использовалось библиотеки обработки изображений, а также специально разработанное программное обеспечение (Приложение 2).
9. Проведены эксперименты на устойчивость модели к различным искажениям распознаваемых изображений. В ходе экспериментов выявлено: а) Предложенная модель не допускает значительных ошибок второго рода в условиях различных искажений. Следовательно, сравнительно низкая ошибка второго рода является свойством предложенной модели. б) В условиях различных искажений ошибка первого рода может сильно расти. Что определяется в первую очередь эффективностью работы конкретных подсистем в тех или иных условиях. в) Сжатие исходных изображений по алгоритму jpeg не оказывает значительного влияния на результаты распознавания. г) Экспериментальный макет достаточно успешно работает при разрешении фотографий начиная со 128*128 точек. То есть успешно работает даже с фотографиями среднего качества.
10.Проведены эксперименты на универсальность применения модели для распознавания различных объектов. В ходе экспериментов получены следующие результаты: а) Подтверждена неадаптивность предлагаемой системы - она успешно распознает не только лица, но и промышленные изделия. Лица людей гораздо более сложные объекты, а рассмотренные изделия, как правило, более простые. Система успешно распознает и те, и другие. б) При распознавании объектов различного рода корректность подсистем нижнего уровня может изменяться. Однако в целом система является достаточно сбалансированной. Ухудшение работы одних подсистем компенсируется улучшением работы других.
Библиография Рожков, Максим Михайлович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Алгоритмы идентификации человека по фотопортрету на основе геометрических преобразований: автореферат дис. . канд. техн. наук: 05.13.01. / Самаль Дмитрий Иванович. — Минск, 2002. — 22 с.
2. Анисимов, Б.В. Распознавание и цифровая обработка изображений: Учеб. пособие для студентов вузов. / Анисимов Б.В., Курганов В.Д., Злобин В.К. — М.: Высш.,шк., 1983. — 295 с.
3. Брилюк, Д.В: Распознавание человека, по изображению лица нейросетевыми, методами. / Брилюк Д.В., Старовойтов В.В. — Предпринт.— Минск: Ин-т техн. кибернетики HAH Беларуси, 2002. — 54 С.
4. Вапник, В.Н., Теория распознавания образов. Статистические проблемы обучения / В.Н. Вапник, АJL Червоненкис. — М.: Наука; 1974. — 416 С.
5. Василенко, О.Н., Теоретико-числовые алгоритмы в криптографии / О.Н. Василенко. — М.: МЦНМО, 2003. — 328 С.
6. Введение в контурный' анализ. Приложения к обработке изображений и сигналов / Под ред. Я.А. Фурмана. — 2-е* изд., испр. — М.: ФИЗМАТЛИТ, 2003. — 592 с. — ISBN 5-9221-0374-1.
7. Вежневец, В.П. Алгоритмы анализа изображения лица человека для построения интерфейса человек—компьютер: автореферат дис. . канд. физ.-мат. наук: 05.13.11 / Вежневец Владимир-Петрович. — М., 2004. — 24 с.
8. Глазунов, A.C. Компьютерное распознавание человеческих лиц. / Глазунов A.C. и др. // Зарубежная радиоэлектроника. Успехи современной радиоэлектроники- 1997. — №8. — С. 3—14
9. Головко, В.А. Нейроинтеллект: Теория и применения. Книга 1. Организация и обучение нейронных сетей с прямыми и обратными связями. / Головко В.А. — Брест: БПИ, 1999. — 260с.
10. Голубев, A.C. Аппаратно-программный комплекс автоматической регистрации и биометрической идентификации людей. / Голубев A.C.,
11. Звягин М.Ю., Квасов Д.С., Кокорин И.Г., Зиновьев И.И., Шамин П.Ю. // Материалы XVII Всероссийской научно-методической конференции "Телематика 2010". — СПб., 2010. — с. 261—262. — ISBN 978-5-75770354-1.
12. Гонсалес, Р. Цифровая обработка изображений в среде MATLAB: Пер. с англ. / Гонсалес Р., Вудс Р., Эддинс С. — М.: Техносфера, 2006. — 616 с.1.BN 5-94836-092-Х
13. Гонсалес, Р. Цифровая обработка« изображений: Пер. с англ. / Гонсалес Р., Вудс Р. — М.: Техносфера, 2005. — 1072 с. — ISBN 5-94836-028-8
14. Горбань, А.Н. Нейроинформатика / А.Н. Горбань, B.JI. Дунин-Барковский, А.Н. Кирдин и др. — Новосибирск: Наука. Сибирское предприятие РАН, 1998.
15. Журавлев, Ю.И. Об алгебраических методах в задачах распознавания и классификации. / Ю.И. Журавлев // Ежегодник "Распознавание. Классификация. Прогноз". Математические методы и их применение. Выпуск 1. — М.: Наука, 1989. — С. 9—16
16. Журавлев, Ю.И. Распознавание образов и распознавание изображений. / Ю.И. Журавлев, И.Б. Гуревич // Ежегодник "Распознавание. Классификация. Прогноз". Математические методы и их применение. Выпуск 2. — М.: Наука, 1989. — С. 5—72
17. Журавлев, Ю.И. Распознавание. Математические методы. Программнаясистема. Практические применения. / Ю.И.Журавлев, В.В.Рязанов,
18. О.В.Сенько. — М.: Фазис, 2006. — 176 с. — ISBN 5-7036-0108-8i
19. Звягин, М.Ю. Распознавание людей по изображению лица с j использованием текстурных характеристик. / М.Ю. Звягин, В.Г.
20. Прокошев, O.A. Новикова, П.Ю. Шамин // Материалы XVII ! Всероссийской научно—методической конференции "Телематика 2010".
21. СПб., 2010. — с. 257—259. — ISBN 978-5-7577-0354-1.
22. Каменская Е.И. Алгоритмы обработки и представления изображений лиц в пространстве канонических переменных: автореферат дис. .1канд. техн. наук: 05.13.18 / Каменская Екатерина Ивановна. — СПб., 2010. — 18 с.
23. Международной конференции по компьютерной графике и зрению ГрафиКон'2009. — М., 2009
24. Местецкий, JI.M., Математические методы распознавания образов / Местецкий JI.M. — М.: Изд-во МГУ, 2004. — 85 С.
25. Методы компьютерной обработки изображений. / Под ред. В.А. Сойфера. — 2-е изд., испр. — М!: ФИЗМАТЛИТ, 2003. — 784 с. — ISBN 5-9221-0270-2
26. Поляков, А.Ю. Методы и алгоритмы компьютерной «графики в примерах на Visual С++, 2-е изд., перераб. и доп. / Поляков А.Ю., Брусенцев В.А.
27. СПб:: БХВ—Петербург, 2003. — 560 с. — ISB№5-94157-377-4
28. Прэтт, У. Цифровая обработка изображений: Пер. с англ. / У. Прэтт. — М.: Мир, 1982.— Кн. 1. —312 с.
29. Рожков, М.М. Актуальность 2D алгоритмов в определенных задачах автоматического распознавания человека / Рожков М.М. // Материалы научной конференции "Технические науки: проблемы и перспективы"
30. СПб, 2011. — С. 145—146. — ISSN 2072-0297.
31. Рожков, М.М. Использование текстурных карт Лавса и дискретного косинусного преобразования в задаче распознавания лиц / Рожков М.М.
32. Прикладная информатика — М, 2011. — №1 (31). — С. 98—ЮЗ. — ISSN 1993-8314.
33. Самаль, Д.И. Выбор признаков для распознавания на основе статистических данных / Самаль Д.И., Старовойтов В.В. // Цифровая обработка изображений. — Минск, 1999. — С. 105—114.
34. Самаль, Д.И. Подходы- и методы распознавания людей по фотопортретам. / Самаль Д.И., Старовойтов В.В. — Минск: ИТК НАНБ, 1998. —54с.
35. Сойфер, В.А. Компьютерная обработка изображений. Часть 1. Математические модели / В.А. Сойфер// Соросовский образовательный журнал, 1996. — №2. — С. 118—124
36. Сойфер, В.А. Компьютерная обработка изображений. Часть 2. Методы и алгоритмы / В.А. Сойфер// Соросовский образовательный журнал, 1996.3. —С. 110—121
37. Специальное прикладное программное обеспечение: пояснительная записка / Владимирский государственный университет; рук. Аракелян С.М.; исп. Шамин П.Ю. и др. — Владимир, 2010. — 241 с. — № 643.02068048 00628-01 81 01
38. Стокман, Д. Компьютерное зрение: Пер. с англ. / Стокман, Д. Шапиро J1.
39. М.: "БИНОМ. Лаборатория знаний", 2006. — ISBN 0-13-030796-3, 594774-384-1.
40. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика / Уоссермен Ф., 1992. — 184 с.
41. Фисенко, В.Т. Компьютерная обработка и распознавание изображений: учеб. пособие. / В.Т. Фисенко, Т.Ю. Фисенко. — СПб: СПбГУ ИТМО, 2008.—192 с.
42. Форсайт, Д. Компьютерное зрение. Современный подход: Пер. с англ. / Д. Форсайт, Ж. Понс — М.: Издательский дом "Вильяме", 2004. — 928 с.1.BN 5-8459-0542-7
43. Фурман, Я.А. Цифровые методы обработки и распознавания бинарных изображений. / Фурман Я.А., Юрьев А.Н., Яншин В.В. — Красноярск: Изд-во Краснояр. ун-та, 1992. — 248 с.
44. Хайкин, С. Нейронные сети. Полный курс. Второе издание. / Хайкин С.1. М., СПб., Киев, 2008.
45. Юдашкин, А.А. Распознавание растровых изображений с помощью* динамической нейронной сети, заданной в пространстве комплексных чисел. / А.А. Юдашкин // Известия Самарского научного центра Российской академии наук, 2003. — № 1. — Т. 5. — С. 127—133
46. Яншин, В.В. Обработка изображений на языке Си для IBM PC: Алгоритмы и программы. / Яншин В.В., Калинин Г.А. — М.: Мир, 1994.240 с. — ISBN 5-03-002891-9
47. Ярославский, Л.П. Введение в цифровую обработку, изображений / Ярославский Л.П. — М.: Сов. радио, 1979. — 312 с.
48. Belhumeur, P. N. Eigenfaces vs Fisherfaces: Recognition Using Class Specific Linear Projection. / Belhumeur P. N., Hespanha J. P., Kriegman D. J. // IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997. — Vol. 19. —P. 711—-720.
49. Beymer, D. Face recognition from one example view / D. Beymer, T. Poggio // Proceedings of the IEEE International Conference on Computer Vision, 1995. —P. 500—507.
50. Bhat, G. Face Recognition using FSS-DSOP for Small Sample Size Problem with Illumination Variations / G. Bhat, K.K. Achary // Soft Comput. Appl, 2009. — Vol. 1. — No. 2. — P. 105—118. — ISSN 2074-8523.
51. Blanz, V. Face identification across different poses and illuminations with a 3D morphable model. / Blanz V., Romdhani S., Vetter T. // International Conference on Automatic Face and Gesture Recognition, 2002. — P. 202— 207.
52. Bronstein, A. M. Three-dimensional face recognition. / Bronstein A. M., Bronstein M. M., Kimmel R. // International Journal of Computer Vision1 (IJCV), 2005. — № i (64). — P. 5—30
53. Brunelli R., Poggio T. Face recognition: features versus templates // IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993. — Vol. 15.1. No 10. —P. 235—241.
54. Chen, S. Making FLDA applicable to face recognition with one sample per person. / S. Chen, J. Liu, Z. Zhou // Pattern Recognition, 2004. — Vol. 37. — No. 7. —P. 1553—1555.
55. Choi, S. Shadow compensation in 2D images for face recognition / S. Choi, C. Kim, C. Choi // Pattern Recognition, 2007. — No. 40. — P. 2118—2125.
56. Face recognition^ as a search tool "Foto-Fahndung". Final Report. — Wiesbaden, 2007. — 30 p.
57. Fractal Image Compression. Theory and Application / Editedby Y. Fisher — N.Y., Springer, 1995. — ISBN 0-3 87-29211 -4.
58. Gao, Q. Face recognition using FLDA with single training image per person / Q. Gao, L. Zhang, D. Zhang // Applied Mathematics and Computation, 2008.1. Vol. 205. — P. 726—734.
59. Heisele, B. Face recognition: component—based versus global approaches / B. Heisele, P. Ho, J. Wu, T. Poggio // Computer Vision and Image Understanding, 2003. — No. 91. — P. 6—21.
60. Heseltine, T. Evaluation of image pre-processing techniques for eigenface based face recognition / T. Heseltine, N. Pears, J. Austin // Proceedings of the
61. Second International Conference on Image and Graphics, SPIE, 2002. —Vol. 4875. —P. 677—685.
62. Heseltine, T. Face Recognition: A Comparison of Appearance-Based Approaches / T. Heseltine, N. Pears, J. Austin, Z. Chen // Proc. Vllth Digital Image Computing: Techniques and Applications, 2003. — Sydney. — P.59— 68
63. Heseltine, T. Three-dimensional face recognition using combinations of surface feature map subspace components. / Heseltine T., Pears N., Austin J. // Image and Vision Computing (IVC), 2008. — No. 3 (26).
64. Image Analysis, Sediments and Paleoenvironments / Edited by P. Francus. — Springer, 2005. — ISBN 1-4020-2061-9.
65. Jenkins R. Face Recognition from Unconstrained Images: Progress with Prototypes / R. Jenkins, A.M. Burton, D. White // Proc. Of the 7th International Conference on Automatic Face and Gesture Recognition, FGR'06, 2006.
66. Jorgensen, P. Analysis and Probability Wavelets, Signals, Fractals. / Jorgensen P. — Springer, 2006. — 320 P. — ISBN—10 0-387-29519-4
67. Kruizinga, P. Optical flow applied to person identification / Kruizinga P., Petkov N. // Proceedings of the EUROSIM Conference on Massively Parallel Processing applications and Development, 1994. — P. 871—878.
68. Lia, Y. Support vector machine based multi-view face detection and recognition / Y. Lia, S. Gongb, J. Sherrahc, H. Liddell // Image and Vision Computing, 2004. — No. 22. — P. 413—427.
69. Martinez, A.M. The AR Face Database / A.M. Martinez, R. Benavente. — CVC Tech. Report #24, 1998.
70. Ng, H. View-invariant face recognition from a single sample / H. Ng // Proceedings of the 10th World Multiconference on Systemics, Cybernetics and Informatics, 2006. — Vol. 5. — P. 212—216.
71. Phillips, P. FRVT 2006 and ICE 2006 Large-Scale Results. / P. Phillips, W. Scruggs, A. O'Toole, P. Flynn, K. Bowyer, C. Schott, M.Sharpe // Report of National Institute of Standards and Technology 7408, March 2007
72. Rabiner, L. R. A tutorial on Hidden-Markov Models and selected applications in speech recognition / Rabiner L. R. // Proceedings of the IEEE, 1989. — Vol. 77(2). — P. 257—285.
73. Scheenstra, A. 3D Facial Image Comparison using Landmarks / A. i Scheenstra. — Netherlands Forensic Institute, Institute of Information and
74. Computing Sciences, Utrecht University, February 2005.
75. Tan, X. Face Recognition from a Single Image per Person: A Survey. / X. Tan, S. Chen, Z. Zhou, F. Zhang // Pattern Recognition. The Journal of the Pattern Recognition Society, 2006. — No 39. — P. 1725—1745.
76. The Amsterdam Library of Object Images (ALOI). Grey value (8 bit). Half * resolution (384 x 288). Viewing direction. Электронный ресурс. —г
77. Электрон. дан. (2,2 Гб.). — Режим доступа: http ://www. science.uva.nl/sites/ALOI/aloigreyred2view.tar
78. The Color FERET Database Электронный ресурс.: Public face database — Ver. 2. — Last modified Jan. 31, 2008. — Режим доступа: http://face.nist.gov/colorferet/ч
-
Похожие работы
- Развитие и применение методов, алгоритмов и программных средств автоматической видео идентификации для предоставления индивидуального доступа по изображению лица
- Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов
- Методы и инструментальные средства решения задач сжатия, распознавания и поиска изображений по содержанию на основе дискретных отображений
- Разработка и исследование коллективных нейросетевых алгоритмов дикторонезависимого распознавания речевых сигналов
- Инвариантное представление изображений для распознавания космических объектов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность