автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов

кандидата физико-математических наук
Тельных, Александр Александрович
город
Нижний Новгород
год
2009
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов»

Автореферат диссертации по теме "Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов"

На правах рукописи

ТЕЛЬНЫХ Александр Александрович

МАТЕМАТИЧЕСКИЕ МОДЕЛИ НЕЙРОНОПОДОБНЫХ СРЕД ДЛЯ РАЗРАБОТКИ СИСТЕМ ОБНАРУЖЕНИЯ И РАСПОЗНАВАНИЯ ОБЪЕКТОВ ЗАДАННЫХ КЛАССОВ

05.13.18 - математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических паук

О 9 ДПР 2029

Нижний Новгород - 2009

003466408

Работа выполнена в отделении нелинейной динамики и оптики Учреждения Российской академии наук Институт прикладной физики РАН

Научный руководитель:

доктор физико-математических наук Яхно Владимир Григорьевич

Официальные оппоненты:

доктор физико-математических паук Казанцев Виктор Борисович

капдидат физико-математических наук, доцент

Карпов Владимир Ефимович

Ведущая организация:

НИИ Нейрокибернегики им. А. Б. Когана, Южного федерального университета

Защита состоится » 2009 года в час.

на заседании диссертационного совета Д 212.156.05 в Московском физико-техническом институте (государственном университете) по адресу: 141700, Московская обл., г. Долгопрудный, Институтский пер., 9, МФТИ, аудитория 903 КПМ.

С диссертацией можно ознакомиться в библиотеке Московского физико-технического института (государственного университета).

Автореферат разослан » 2009 г.

Ученый секретарь диссертационного совета кандидат физико-математических наук

"2—^р. С. Федько

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Задачи обнаружения объектов на цифровых изображениях характерны для целого ряда прикладных систем: обработки цифровой информации в системах видеонаблюдения, поиска полезной информации в цифровых фото- и видеоархивах, в системах ориентации автономных устройств, в системах контроля качества, в системах организации доступа на охраняемые объекты с использованием биометрических данных, в системах обработки медицинских изображений и многих других. Особенно актуальным является анализ видео-потока в реальном масштабе времени для создания интеллектуальных камер, позволяющих записывать только те события, происходящие в их поле зрения, которые «достойны внимания» с точки зрения пользователя системы. В настоящее время получили широкое распространение устройства, реагирующие на наличие «движения» в поле зрения камеры, как правило, работающие с использованием алгоритмов оценки «оптического потока». При этом классификация объекта или группы объектов, попавших в поле зрения камеры, отсутствует. Данная работа демонстрирует возможности расширения способностей подобных устройств. Обладая возможностью обнаруживать заданные объекты (людей, лица людей, транспортные средства и т.д.), идентифицировать их в реальном времени, устройства видео-наблюдения получают совершенно новые качества, которые позволяют оценивать «ситуацию» в наблюдаемом пространстве и реагировать только на такие события, которые интересны пользователям этих систем. В предлагаемой работе рассматриваются также актуальные задачи, связанные с систематизацией, индексацией и быстрым доступом к графическим данным в цифровых видеоархивах. Предложенные системы позволяют проводить поиск и автоматическую рубрикацию данных без участия оператора, опираясь только на заложенные в них алгоритмы и предложенную к рассмотрению видеоинформацию. Точность и надежность результатов, полученных при решении задач обнаружения, уточнения и распознавания объектов на сложном фоне, является критическим параметром всей системы в целом, наряду с быстродействием системы. Таким образом, актуальной является задача оптимизации параметров распознающей системы как по точности, так и по времени отклика.

Цели диссертационной работы. Цель данной работы заключается в разработке математических моделей и нейроноподобных алгоритмов, ориентированных на реализацию обучающейся системы для распознавания и мониторинга объектов с нетривиальной геометрией на сложном фоне в реальном времени. Разработанная модель должна позволять использующей ее системе эффективно функционировать в типичной программной среде персональных компьютеров. Система должна обладать подсистемой контроля полученного результата.

Для достижения поставленных целей необходимо решить следующие задачи:

1. Разработка теоретических принципов распознающей модели.

2. Разработка архитектуры программного комплекса для настройки создаваемых распознающих систем, работающих в режиме реального времени.

3. Реализация комплекса в виде пакета программ.

4. Разработка модели тестирования эффективности работы создаваемых распознающих систем.

5. Разработка методики статистического обучения нейроноподобных моделей для обнаружения объектов на сложном фоне с использованием прецедентной базы данных.

Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, математической статистики, математического моделирования, теории искусственных нейронных сетей, цифровой обработки сигналов и изображений, теории вероятностей.

Научная новизна работы.

1. Сформирована модель нейроноподобной системы для обнаружения, сопровождения и распознавания объектов заданного типа на сложном фоне в режиме реального времени.

2. Разработаны алгоритмы и архитектура нейроноподобной системы распознавания, позволяющие формировать модельное описание заранее заданных объектов.

3. Разработан способ параллельного соединения каскадов «сильных классификаторов», обученных на разных прецедентных базах, существенно повышающий производительность системы обнаружения.

4. Проведено исследование эффективности работы нескольких алгоритмов формирования функции активации сигналов от рецептивных полей.

5. Исследованы алгоритмы классификации найденного объекта с использованием нейроноподобной системы.

Практическая ценность работы. Полученные в диссертационной работе результаты по разработке моделей, алгоритмов и реализации программного комплекса для настройки нейроноподобных систем видеонаблюдения являются основой для построения перспективных систем и устройств обнаружения, сопровождения и классификации объектов на произвольном сложном фоне. Результаты данной работы могут использоваться также в системах оперативного анализа информации на борту летательных аппаратов и системах зрения автономных мобильных роботов.

Реализация результатов работы. Разработанные алгоритмы и программы используются в действующих вариантах демонстрационных биометрических систем для распознавания человека: по руке; по лицу; по дактоотпечат-ку; с помощью интегральной биометрической системы. Создана система для

распознавания музыкальных сигналов. Выполнена версия фотоархива с индексацией по лицам, система контекстного поиска для изображений специального характера. Системы ориентированы на применение в программных комплексах анализа информации в Интернете, в биометрических системах доступа, в системах обеспечения безопасности предприятий.

Апробация работы. Результаты работы обсуждались на 3-м рабочем семинаре-совещании «Теория приложения искусственных нейронных сетей» (Снежинск, РФЯЦ ВНИИТФ, 1998), на 4-й всероссийской конференции «Биомеханика» (Нижний Новгород, 1998), на 12-й международной конференции по нейрокибернетике (Ростов-на-Дону, 1999), на 2-м съезде биофизиков России (Москва, 1999), 4-й конференции по радиофизике (Нижний Новгород, 2000), на международной конференции ICONIP'02 (Сингапур, 2002), на международной конференции APHYS 2003 (Spain, Badajoz, 2003), на 6-й, 8-й, 9-й и 10-й всероссийской научно-технической конференции «Нейроинформати-ка» (Москва, МИФИ, 2004, 2006, 2007, 2008), на конференции «Управление и информационные технологии» (Санкт-Петербург, 2005), на 2-й Троицкой конференции «Медицинская физика и инновации в медицине» (Троицк, 2006), на 13-й всероссийской конференции «Математические методы распознавания образов» (Санкт-Петербург, 2007), на 9-й международной конференции Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008 (Нижний Новгород, 2008).

Публикации. Всего по теме диссертации опубликовано 26 работ, включая 7 в зарубежных изданиях. Из них две статьи - в изданиях из списка, рекомендованного ВАК РФ [9, 17], одна работа - международный патент [26], а также два российских патента [24,25].

Структура диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников, включающего 110 наименований и двух приложений. Диссертация изложена на 131 страницах.

Положения, выносимые на защиту

1. Архитектура нейроноподобных моделей распознавания для «слабых классификаторов» (сенсоры первого уровня).

2. Архитектура нейроноподобных моделей распознавания для «сильных классификаторов» (сенсоры второго уровня).

3. Способ параллельного соединения каскадов «сильных классификаторов», обученных на разных прецедентных базах, существенно повышающий производительность системы обнаружения.

4. Алгоритмы предварительного целеуказания, уточнения местоположения и классификации найденного объекта с использованием нейроноподоб-ной системы.

5. Комплекс программ, позволяющий настраивать нейроноподобные системы распознавания для обнаружения и распознавания заданных классов на сложном произвольном фоне.

Личный вклад автора. В совместных работах автор принимал непосредственное участие в выборе направлений исследований, постановке основных задач, разработке и обсуждении результатов. Все представленные в диссертационной работе результаты получены лично автором.

Во введении обоснована актуальность диссертационной работы, сформулированы цель и задачи исследования, охарактеризована научная новизна полученных результатов и их практическая значимость, указаны методы исследования, указаны положения, выносимые на защиту.

В первой главе диссертации рассмотрена история исследования нейрофизиологических процессов в нейроноподобных системах из возбуждающих и тормозных элементов. Представлена биологоправдоподобная модель нейрона. Помимо устройства отдельной клетки относительно рассмотрены глобальные аспекты деятельности мозга, специализация его областей, связи между ними и т.п. Рассматриваются подходы к моделированию обработки информации на промежуточном уровне, в участках нейронной сети, содержащих сотни тысяч нервных клеток. Рассматривается модель распределенной среды в виде балансных интегро-дифференциальных уравнений для «классической» схемы взаимодействия между нейроноподобными элементами с возбуждающими и тормозными связями. Затем рассматриваются упрощенные варианты базовой модели в приближении, когда влияние тормозных нейронов на себя мало. Введено понятие функции «латерального торможения» и в результате получена модель двумерного плоского слоя - однослойная (одно-компонентная) распределенная нейроноподобная система, которая записана как в непрерывном, так и в дискретном виде.

В разделе 1.3 рассмотрены методы исследования структур коллективной активности в таких распределенных однородных нейроноподобных системах. Указано, что в пространственно-временных структурах, полученных в результате эксперимента дискретизация по времени и пространству приводит к несоответствию с точными решениями распределенных систем. При этом, основываясь на результатах предыдущих работ, показано, что в дискретном варианте возможны различные режимы ее работы, в частности режимы взаимодействия фронтов и импульсов возбуждения.

В разделе 1.4 введена математическая модель рецептивного поля и указаны приближения, в которых была выполнена работа. В частности, предполагалось, что время срабатывания нейроноподобного элемента (рецептивного поля) равно шагу дискретизации системы. В этом приближении получена дискретная форма для уравнения рецептивного поля, которая может быть удобно запрограммирована на современной вычислительной технике:

КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

м м

к=-М 1=-М

где и' ■ - активность рецептивного поля; /г- нелинейная функция активации рецептивного поля; Ф( { - функция связи между элементами нейроноподоб-ной системы; ц.+к ,+1 - входной стимул на элементы нейроноподобной системы; ие.х. - дополнительные внешние сигналы, которые приходят на элементы

нейроноподобной системы; а, Г- нормировочные коэффициенты; ¡- местоположение в пространстве нейроноподобного элемента; к,1- расстояние от рассматриваемого элемента рецептивного поля до взаимодействующего с ним нейроноподобного элемента окрестности, М - радиус окрестности, в которой происходит взаимодействие между нейроноподобными элементами.

Заявлено, что, проведя вычисление с использованием уравнения рецептивного поля для всех нейроноподобных элементов, входящих в нашу систему, мы получим так называемую «карту рецептивного поля». В терминах теории обработки изображений, карта рецептивного поля соответствует нелинейной фильтрации входного изображения. В нашем случае это карта активности нейроноподобных элементов, которая и будет в дальнейшем использоваться для построения систем распознавания, работающих в реальном времени.

В разделе 1.5 описаны различные виды рецептивных полей, которые определяются функциями пространственной связи между активными элементами. Функция пространственной связи показывает, какое воздействие активный элемент оказывает на своих соседей в зоне своего пространственного влияния. Если элемент старается возбудить соседей, это соответствует диффузной связи, а пространственно-временные структуры соответствуют результатам для диффузных сред. Функции связи с положительным центром и отрицательными флангами соответствуют тому, что каждый активный элемент старается поддержать, или активировать, своих ближайших соседей и подавить возбуждение более активных далеких элементов в своей сфере влияния, т.е. реализуется латеральное торможение за счет отрицательных коэффициентов связей между отдельными элементами. Такой принцип избирательности по пространственной частоте реализуется в зрительной коре млекопитающих. Показано, что функция связи может быть как изотропной, так и анизотропной, что позволяет выполнять операции пространственной локализации, частотной локализации, избирательности пространственной частоты, избирательности направления. Рассмотрены некоторые типы функций пространственной связи, применение которых возможно для моделирования обработки сигналов сенсорной активности в мозгу млекопитающих и для формирования технических устройств построенных на таких «бионических принципах». В частности, рассмотрены функции Габора, функции типа «латеральное торможение», лапласиан гауссиана и функции Хаара. Введено понятие «интегрального изображения» и показан способ быстрого вычисления значений откликов рецептивных полей Хаара с использованием интегрального изображения.

В завершение главы приведены примеры численных расчетов с использованием модели «рецептивного поля», которые показывают возможность проведения всевозможных обработок изображения с использованием одного единственного уравнения. Сущность обработки информации в распределенной нейроноподобной системе заключается в выборе из всего множества возможных автоволновых процессов (возникновение стационарных автоструктур, распространение фронтов, импульсов, возникновение источников волн, отражение импульсов при взаимодействии, развитие возмущений на фронте, прорастание локализованных областей активности в двухкомпонентной среде, режимы самовозбуждения в трехкомпонентной среде) таких, при которых в системе из исходного начального условия в неподвижного изображения формируются стационарные автоструктуры. Формирование различного вида стационарных структур интерпретируется как выделение различных упрощенных препаратов исходного неподвижного изображения (например, контур или линии разных направлений). С помощью модели однородной нейроноподобной среды исключительно за счет смены ее параметров, могут быть реализованы различные требуемые для обработки и принятия решений варианты нелинейной фильтрации изображений.

Во второй главе диссертации рассмотрены вопросы применения моделей однородных распределенных нейроноподобных систем для решения задачи предварительного целеуказания. Целью работы системы предварительной обработки изображения является уменьшение числа рассматриваемых классификатором (системой принятия решения) фрагментов изображения путем формирования относительно небольшого числа зон «внимания».

В разделе 2.1 введено понятие местоположения объекта, которое задается двумя точками. Для случая обнаружения лиц эти точки будут соответствовать глазам найденного объекта на изображении, введено понятие расстояния между местоположениями найденных объектов. Показано, как, зная местоположение найденного объекта, формировалась прямоугольная анализируемая область изображения. И наоборот, введено правило, как, зная прямоугольную анализируемую область, сформировать местоположение найденного объекта. На основании этих понятий, местоположения и анализируемой области, сформулирована задача предварительного целеуказания: из всего массива анализируемых областей, которые могут покрывать изображение, оставить для дальнейшего анализа только те, в которых возможно наличие искомого объекта и указать местоположение этих объектов. Также введено понятие эффективности работы системы целеуказания. Ошибки первого и второго рода.

Далее в главе рассмотрены два подхода к решению задачи предварительного целеуказания:

1. Синтез массива областей кандидатов для дальнейшего анализа. Синтез производится по изображению, сегментированному некоторым алгоритмом.

2. Исключение из предварительно заданного массива областей для анализа таких, в которых заведомо нет искомого объекта. В этом случае анализ производится на изображении сегментированном некоторым алгоритмом. Показано, что для решения задачи обнаружения объектов в реальном времени, где основным критерием качества является скорость выполнения операции при фиксированной ошибке, предпочтительным является второй подход. Исключение из заданного массива областей позволяет проводить операцию предварительного целеуказания исходного изображения за фиксированное время.

В первом подходе, для системы синтеза анализируемых областей представлена блок-схема преобразования входного сигнала в массив местоположений, включающая следующие этапы: преобразование изображения в полутоновое, фильтрация с использованием модели распределенной однородной среды, состоящей из нейроноподобных элементов, выделение горизонтальных штриховых линий, пространственная кластеризация штриховых линий, фильтрация найденных кластеров по некоторому правилу, формирование массива анализируемых областей (рис. 1).

Рис. 1. Процесс синтеза массива областей кандидатов

Также предложена математическая модель процесса фиксации взгляда в случае системы поиска лиц на изображении на основании описанных выше процедур и описано пространство ее параметров:

Net ST СТ г л SF

G : и(х,у)->и(х,З'МкЫ^Мп,}, (2)

i = 0..Nl,j = 0..N2,k = 0..N

Видно, что математическая модель предварительного целеуказания состоит из 4 стадий преобразования входного сигнала и(х,у) в результат

{п,}.

• Преобразование с использованием модели однородной среды, состоящей из нейроноподобных элементов (Net).

• Формирование массива штрихов (ST).

• Формирование массива пространственных кластеров и их центров(СТ).

• Формирование массива местоположений (SF).

Предложен алгоритм оптимизации параметров этой модели относительно целевой функции, которая введена в 2.3.4. Далее в главе описывается детектор движения, построенный на основе предварительной обработки изображе-

ния с использованием нейроноподобных элементов. Его математическая модель и пространство ее параметров.

Следующая часть второй главы посвящена описанию второго подхода, связанного с алгоритмами исключения кандидатов из предварительного заданного массива возможных местоположений. Описана, регулярная сетка, на которую разбивается изображения и приведены результаты исследований, по оптимальным параметрам разбиения изображения на перекрывающиеся фрагменты. Показано, как с использованием «интегрального изображения» и карты активности рецептивных полей принимается решение об исключении исследуемого фрагмента изображения из массива предложенных кандидатов. Как и в случае синтеза областей для «фиксации взгляда», предложена математическую модель в виде цепочки преобразования исходного изображения. Описано пространство ее параметров и целевая функция для поиска максимума эффективности работы системы предварительного целеуказания в заданном пространстве параметров. Также описана модель детектора движения для рассматриваемого случая.

В заключение этой главы описан вычислительный эксперимент и приведены его результаты. Анализируя результаты сравнения двух алгоритмов предварительного разбиения на тестовой базе данных размеченных изображений объемом 1000 штук, мы получили, что алгоритм «синтеза областей фиксации взгляда» при максимально допустимом уровне ошибки локализации объекта имеет ненулевую ошибку потери объекта. При этом требует значительных вычислительных затрат. С другой стороны, разбиение изображения с помощью регулярной сетки не дает ошибки локализации объекта и не требует времени для организации массива фрагментов, но предъявляет жесткие требования к временным параметрам срабатывания блока принятия решения. Компромисс между вычислительными затратами и точностью можно достичь, объединяя алгоритм разбиения входного изображения методом регулярной сетки и последующего анализа наличия в каждом фрагменте изменений, генерируемых детектором движения.

В третьей главе диссертации рассмотрены вопросы построения функции обнаружения искомого объекта. Данная функция ищется как бинарный классификатор образцов фона и образцов полезного сигнала:

Введено понятия области фиксации взгляда и предположение о том, что анализ изображения происходит именно в области фиксации взгляда путем формирования множества карт активности рецептивных полей различного типа. Другими словами, рецептивных полей с различными видами функции связи. Показано, что плотность распределения рецептивных полей не является равномерной по всему полю и содержит явно выраженную точку (рис. 2), где количество участвующих в процессе преобразования входного изображения рецептивных полей максимально.

(3)

Рис. 2. Плотность распределения по пространству области фиксации взгляда, рецептивных полей различных типов.

Эта точка и является аналогом точки «фиксации взгляда» для живой системы, для которой число вовлеченных в анализ рецептивных полей максимально. При этом область, в которой произведено построение плотности распределения числа рецептивных полей, и является областью анализа содержимого и принятия решения.

В главе предложена и рассмотрена математическая модель системы обнаружения объектов, состоящая из нейроноподобных элементов, и пространство ее параметров:

Е : и(Я) —> {1,0}; 5 = Н0 л Н, л...лН„ Ч

=

\,У со. ./г' («:'.)>©, . , „ . , „ . , ,

0, в противном случае 1 е £2'..

'./ I / 17

(4)

■г ч

[0, в противном случае

Процесс передачи возбуждения и принятия решения характеризуется числом сильных классификаторов N, которое не известно, каждый сильный классификатор Н характеризуется порогом 0 , который не известен, помимо порога, он характеризуется неизвестным числом К «слабых классификаторов» /г и неизвестными весами слабых классификаторов СО, каждый слабый классификатор характеризуется неизвестной функцией активации У и неизвестным видом рецептивного поля и . Известными параметрами являются число видов рецептивных полей размеры пространственной области, на которой работает рецептивное поле В., параметры Т и О! в модели рецептив-

ного поля, а также вид нелинейной функции, которую мы выбрали для модели рецептивного поля F: 1

\ + еа{Т-х)

Для нахождения неизвестных параметров модели мы должны найти удовлетворяющие нас значения для некоторой целевой функции (6).

Целевой функцией для пространства параметров ОС, классификатора Е будем считать следующее соотношение:

= — ¿(Е(и°,а,©*(™->0)), (5)

Nо 1=1

где 3 - функция принятия решения на фрагменте исходного изображения и°, О (FR.fl —> 0) - порог принятия решения, при котором ошибка отвержения полезного сигнала на обучающем множестве стремится к нулю, А'<> -число образцов в обучающем множестве.

Предложен способ формирования целевой функции на множестве объектов и, которое в той или иной степени должно отражать реальный мир. Показано, что формирование детектора ведется до тех пор, пока изменение целевой функции детектора не будут меньше некоторого порога:

(б)

Введено понятие целевой функции для «сильного классификатора» и описана процедура формирования сильного классификатора как ассоциативной машины, построенной на большом множестве рецептивных полей с использованием процедуры Ас1аВоо51. В некотором приближении описан процесс обучения детектора и задан критерий его окончания.

В разделе 3.2.4 рассмотрены модели обучения для слабых классификаторов и формирования функции активации рецептивного поля на некотором подмножестве исходного множества (У. Причем подмножество выбирается таким образом, что все образцы объектов в нем остаются, а образцы фона формируются из ошибок существующего классификатора. Для формирования функции активации рецептивного поля предложено использование правила принятия решения на основе критерия «максимального правдоподобия» с учетом его оценки по обучающему множеству I/.

Рассмотрено несколько методов оценки плотностей вероятности полезных и шумовых сигналов для рецептивных полей Хаара. Рассмотрена гипотеза о нормальном распределении откликов от рецептивных полей, на основании которой с использованием критерия «максимального правдоподобия» строится модель обучения для слабого классификатора. Предложено использование метода оценки плотности распределения с использованием дискретной гистограммы. Показано, что использование второго метода для слабой

модели обучения дает лучшие результаты, чем использование гипотезы о нормальном распределении откликов от рецептивного поля на обучающем множестве.

Также рассмотрено применение рецептивных полей, основанных на Modified Census Transform для использования в модели детектора. И показано, что применение рецептивных полей на основе Modified Census Transform значительно уменьшает число используемых рецептивных полей в окончательном варианте детектора.

В разделе 3.3 описан вычислительный эксперимент по формированию высококачественной системы обнаружения объектов на произвольном фоне и представлены его результаты.

В заключение главы предложен алгоритм параллельного соединения детекторов. Суть параллельного соединения двух и более каскадов заключается в анализе активности каждого не на конкретном фрагменте изображения, а в некоторой области, которая окружает искомый объект. Разработанная нами система предварительного анализа формирует множество фрагментов, которые попадают в область рассогласования между истинным положением объекта и областями, где тестируется гипотеза о его наличии. Приведены результаты применения параллельного соединения каскадов на тестовой базе данных, которые демонстрируют сильное уменьшение ошибки ложных тревог, при незначительном увеличении ошибки пропуска цели (рис. 3).

MIT dataset newtest

£Г <

LL

70 -, 60 -50

I 40 s

1 30

J

5 20 m

2 10

ChaosFace-2 22,3

Fraunhofer IIS 10,6

- - fir : ■

ChaosFace-1 57,5

Intel Open CV 6,7

1

O Chaos Face □ Intel Open CV

□ Fraunhofer IIS

□ ChaosFace-1

□ ChaosFace-2

Рис. 3. Результат уменьшения ошибки ложных тревог с использованием параллельного соединения двух детекторов ChaosFace-1 и ChaosFace-2 в детектор ChaosFace на стандартном множестве изображений MIT dataset newtest.

В четвертой главе диссертации рассматриваются методы распознавания найденных объектов. Распознавание представляет собой отнесение исследуемого объекта, представленного совокупностью наблюдений, к одному из взаимоисключающих классов. Совокупность предъявленных наблюдений в процессе обучения обычно записывают в виде матрицы и называют «обучающей выборкой». Проводятся аналогии между системой обнаружения и системой классификации найденной цели. Рассмотрена процедура сведения задачи многоклассовой классификации к задаче двуклассовой классификации, что прямо соответствует изложенным в предыдущих главах задачам. Применение методов, описанных в главе 3, к решению задач классификации найденного объекта позволяет формировать системы, способные к распознаванию цели из множества альтернатив. При этом они используют аппарат рецептивных полей, сильных классификаторов и детекторов. Таким образом, использование техники перехода к двухклассовой задаче и использование концепции рецептивных полей позволяет создавать работоспособные и универсальные нейроноподобные системы распознавания.

В главе приведено также описание конкретных систем распознавания, в которых используются разработанные в данной работе схемы и алгоритмы. Описываются основные характеристики интегральной биометрической системы по изображениям руки, лица, дактоотпечатка и звукам голоса. Приведены характеристики разработанных систем распознавания музыкальных сигналов. Дано описание системы видеонаблюдения с детектированием лиц и распознаванием по ним людей. Приведено описание электронного фотоархива с индексацией по лицам людей. Приведены данные о программе, позволяющей производить поиск специальных изображений по контексту.

В заключении изложены основные результаты диссертации.

В приложении 1 рассматривается инструментарий разработчика.

В приложении 2 рассматриваются технические особенности реализации программного комплекса.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Предложена математическая модель нейроноподобных сенсорных элементов (включающих рецептивное поле и функции активации), а также каскады из таких элементов, позволяющая сформировать способные работать в реальном времени системы обнаружения и классификации объектов на 2й-изображении. Предложена оптимальная модель рецептивного поля с точки зрения вычислительной эффективности.

2. Создана и реализована оригинальная методика настройки параметров модели объекта. На основе этой методики исследованы режимы формирования эффективной модели распознаваемого объекта на изображении по заранее заданному экспертом набору прецедентов.

3. Разработан алгоритм параллельного соединения детекторов. Показано, что предложенная методика параллельного соединения каскадов нейронопо-добных элементов значительно снижает ошибку обнаружения ложных целей.

4. Предложена и реализована методика тестирования алгоритмов классификации найденных объектов. Показано, что алгоритм классификации, основанный на модели рецептивного поля и переходе к двухклассовой задаче, позволяет конструировать систему распознавания из универсальных элементов.

5. Исследованные алгоритмы реализованы в виде комплекса программ и использованы при разработке систем идентификации человека по биометрическим признакам. Комплекс позволяет работать как в интерактивном, так и в автоматическом режиме.

СПИСОК ПУБЛИКАЦИЙ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ

1. Коган А.Н., Тельных A.A., Яхно В.Г. Оптимизация точности режимов распознавания системы "Рука Идентификатор Человека" - "РИЧ-1" // Тезисы III рабочего семинара-совещания "Теория и приложения искусственных нейронных сетей" - Снежинск, РФЯЦ ВНИИТФ, 1-3 апреля, 1998. -С. 25-26.

2. Тельных A.A., Яхно В.Г., Савельев Д.В., Смирнов Г.В., Новиков A.B., Ветушкин В.Д., Донченко Е.В. Программно-аппаратный комплекс для биометрии кисти // Тезисы докладов на IV Всероссийской конференции "Биомеханика -98", -Н. Новгород, 1998, -С.84.

3. Тельных A.A., Яхно В.Г. Нейроноподобные модели второго и третьего уровней - адаптивные распознающие системы // Материалы XII Международной конференции по нейрокибернетики, Издательство Северокавказского научного центра высшей школы. - Ростов на Дону, 1999 - С. 164168.

4. Коган А.Н., Тельных A.A., Яхно В.Г. Нейросетевые режимы принятия решений // II съезд биофизиков России 23-27 августа 1999 г. -Москва, 1999. Тезисы докладов, том II, -С. 419.

5. Бондаренко Б.Н., Коган А.Н., Нуйдель И.В., Сборщиков A.B., Тельных A.A., Хилько А.И., Хурлапов П.Г., Яхно В.Г. Разработка адаптивных алгоритмов распознавания сложных изображений в неяроноподобных средах // Труды четвертой конференции по радиофизике 5 мая 2000 г., Н. Новгород. 2000, -С.207-208.

6. Ivanov А.Е., Eremin E.V., Bellustin N.S., Kostin M.A., Kogan A.N., Kraev A.V., Nuidel I.V., Perminov A.O., Sorokin M.A., Khil'ko A.I., Sborchikov V.N., Tel'nykh A,A„ Shilin S.G., Rohatgi U.S., Jain U.S. and Yakhno V.G. Recognition of ccomplex images by an adaptive neuron-like research sys-tem//Proceedings of Sixth ISTC Scientific Advisory Committee Seminar, Moscow, Russia, September 15-17,2003, -P.308-325.

7. Nuidel I., A. Chaikin A., A.Telnykh, O.Sanina, V.Yakhno, T.Yakhno, O.Kruglun, and N.Makarenko Extraction of Informative features From the Images of Diagnostic Structures In Dried Drops of Biological Liquids// Proceeding of the First International Meeting on Applied Physics (APHYS 2003), Spain, Badajoz,13-180ctober 2003, "Recent Advances in Interdisciplinary Applied Physics", 2005, -P.639-643.

8. Беллюстин H.C., Еремин E.B., Тельных А.А. и Яхно В.Г. Применение мелкозернистых искусственных нейронных сетей в системе распознавания лиц//У1 Всероссийская научно-техническая конференция «Нейроин-форматика-2004», Сборник научных трудов, часть 2 / МИФИ. М., 2004, -С. 201-207.

9. Яхно В.Г., Нуйдель И.В., Иванов А.Е., Беллюстин Н.С., Будников Д.Н., Тельных А.А., Еремин Е.В., Коган А.Н., Костин М.А., Перминов А.О., Раджабова Ю.Х., Сорокин М.А., Тихомиров Д.А., Шилин С.Г., Чайкин А.В. Исследование динамических режимов нейроноподобных систем. Примеры приложений// Информационные технологии и вычислительные системы, -2004, №1, -С.126-148.

10. Tel'nykh O.S., Tel'nykh А.А., and Shilin S.G. Program for recording, analyzing, and automatic finding of characteristic features in encephalograms // Proceedings of Nijmengen Institute for Cognition and Information, 2004, -P.391-396.

11. Тельных A.A., Разумов B.A., Беллюстин H.С., Калафати Ю.Д., Яхно В.Г. Создание электронной версии фотоальбома с индексированием по изображениям лиц // Сб. докладов «Управление и информационные технологии». Т. 1. 2005. -С.260-267.

12. Коган А.Н., Иванов А.Е., Тельных А.А., Раджабова Ю.Х., Еремин Е.В., Беллюстин Н.С., Jain А.К., Rohatgi U.S., Яхно В.Г. Интегральная биометрическая система распознавания человека // Сб. докладов Управление и информационные технологии. Т. 1.-С.Петербург, 2005. -С.267-275.

13. Яхно В.Г., Тельных А.А., Нуйдель И.В., Полевая С.А., Парин С.Б., Беллюстин Н.С., Еремин Е.В., Разумов В.А., Иванов А.Е., Чайкин А.В., Ше-магина О.В., Спицын И.Г., Краева Т.А. Программные модели обработки зрительных сигналов// II Троицкая конференция "Медицинская физика и инновации в медицине" (16-19 мая 2006), Альманах клинической медицины, Том XII, -Москва, 20066 - С.69.

14. Беллюстин Н.С., Разумов В.А., Тельных А.А., Настройка и тестирование фрагментов системы анализа лица человека на видеоизображениях, //VIII Всероссийская научно-техническая конференция «Нейроинформатика-2006», Сборник научных трудов ISBN 5-7262-0634-7, часть 1 МИФИ, -Москва. 2006,-С. 157-164.

15. Беллюстин Н.С., Разумов В.А., Тельных А.А., Шемагина О.В.Повышение качества распознавания лиц на цифровых изображениях за счет системы уточнения положения лица //Всероссийская научно-техническая конфе-

ренция "Нейроинформатика-2007", Сборник научных трудов; ISBN 57262-0709-2, часть 1. МИФИ, -М., 2007, -С. 88-94.

16. Ковальчук А.В., Беллюстин Н.С., Тельных А.А., Яхно В.Г. О методах промежуточного контроля в сложной системе обнаружения и распознавания лиц // Сб. докладов XIII всероссийской конф. ММРО-13. М.: МАКС-Пресс, 2007 - С. 471-481.

17. Беллюстин Н.С., Тельных А.А., Разумов В.А., Шемагина О.В., Ковальчук А.В., Яхно В.Г., Применение генетических алгоритмов для уточнения местоположения лица человека на видеоизображении // Нейрокомпьютеры: разработка и применение, 2007, № 11, -С. 43-45.

18. Беллюстин Н.С., Калафати Ю.Д., Ковальчук А.В., Тельных А.А., Шемагина О.В., Яхно В.Г., Нейроноподобный детектор лица. Технические особенности реализации и обучения // Сборник научных трудов. ISBN 978-57262-0878-7, часть 2, МИФИ, -Москва, 2008 -С. 123-132.

19. Telnykh А.А., Bellyustin N.S., Shemagina O.V., Kalafati Yu.D., Yakhno V.G., The Training Algorithm of a Neuron-like Object Detector and Variants of its Implementation,//9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008, September 1424, 2008, Conference Proceedings, v.2, -Nizhni Novgorod, 2008, -P. 208-211.

20. Telnykh A.A., Shemagina O.V., Bellyustin N.S., Kalafati Yu.D., Video clip segmentation algorithm and its realization, //9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008, September 14-20, 2008, Conference Proceedings, v.2, Nizhni Novgorod, 2008, -P. 212-214.

21. Telnykh A.A., Kovalchuk A.V., Object detection system using expert commit-teets, //9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008, September 14-20, 2008, Conference Proceedings, v.2. Nizhni Novgorod, 2008, -P. 212-214.

22. Ковальчук A.B., Соколов M.E., Тельных A.A., Сопоставление нейронопо-добных и классических методов в задаче уточнения координат глаз, //Сборник научных трудов ISBN 978-5-7262-0878-7, часть 2 / МИФИ. М., 2008. -С. 123-132.

23. Бондаренко Б.Н., Нуйдель И.В., Сборщиков И.Ф., Тельных А.А., Хилько А.И., Яхно В.Г., Адаптивное построение изображений нейроноподобной исследовательской системой, Препринт / ИПФ РАН, №559. Нижний Новгород, 2001- 29 с.

24. Пат. 2160466 Российская Федерация, 7 G 06 К 9/00. Способ биометрической идентификации личности по кисти руки и формирователь изображения кисти руки для его осуществления. /Яхно В.Г., Перминов А.О., Тельных А.А., Красильникова И.Г., Прудников М.Б., Бабиков Д.Б., НЦИНТ; заявитель и патентообладатель Яхно В.Г. - №97116929/09; заявл. 29.09.1997; опубл. 10.12.2000, Бюл. №34. -И с.

25. Пат. 2160467 Российская Федерация, 7 G 06 К 9/00. Метод адаптивного распознавания информационных образов и система для его осуществления. / Яхно В.Г., Нуйдель И.В., Тельных A.A., Бондаренко Б.Н., Сборщиков И.Ф., Хилько А.И.; заявитель и патентообладатель Яхно В.Г.-99115239/09; заявл. 08.07.1999; опубл. 10.12.2000. Бюл. №34. _ 14 с.

26. US Patent No.: US 6,751,353 Bl, 2000 Yakhno V.G., Nuidel I.V., Telnykh A. A., Bondarenko B.N., Sborshikov V.A., Khilko A.I./ The method for adaptive recognition of information images, and the system of implementation thereof. -12 p.

Тельных Александр Александрович

МАТЕМАТИЧЕСКИЕ МОДЕЛИ НЕЙРОНОПОДОБНЫХ СРЕД ДЛЯ РАЗРАБОТКИ СИСТЕМ ОБНАРУЖЕНИЯ И РАСПОЗНАВАНИЯ ОБЪЕКТОВ ЗАДАННЫХ КЛАССОВ

Автореферат

Подписано к печати 13.03.2009 г. Формат 60 х 90 . Бумага офсетная № 1. Усл. печ. л. 1,25. Тираж 100 экз. Закат № 37(2009)

Отпечатано в типографии Института прикладной физики РАН, 603950, Н. Новгород, ул. Ульянова, 46

Оглавление автор диссертации — кандидата физико-математических наук Тельных, Александр Александрович

ВВЕДЕНИЕ.

ГЛАВА 1. МОДЕЛИ РАСПРЕДЕЛЕННЫХ ДВУМЕРНЫХ НЕЙРОНОПОДОБНЫХ СРЕД ДЛЯ ОБРАБОТКИ ИНФОРМАЦИОННЫХ СИГНАЛОВ.

1.1 История проблемы исследования нейрофизиологических процессов в одном нейроне и в сети из возбуждающих и тормозных элементов.

1.2 Биологопрлвдоподобная модель.

Упрощенные варианты общей модели.

1.3 методы исследования структур коллективной активности в распределенных однородных нейроноподобных системах.

1.4 Рецептивные поля. Карты рецептивных полей.

1.5 Виды используемых рецептивных полей. Функции связи между элементами нейроноподобной системы.

Фильтры Габора.

Лапласиан гауссиана. Латеральное торможение.

Двумерные рецептивные поля Хаара. Вычисления с использованием интегрального изображения.

1.6 Обработка неподвижных изображений в однородных, распределенных нейроноподобных системах с использованием функций латерального торможения, функций Хаара и функций Габора.

Получение простейших препаратов неподвижного изображения: контраст, контур заданной толщины, линии заданных направлений, объекты заданных масштабов.

ГЛАВА 2. ИСПОЛЬЗОВАНИЕ МОДЕЛИ ОДНОРОДНОЙ РАСПРЕДЕЛЕННОЙ ДВУМЕРНОЙ НЕЙРОНОПОДОБНОЙ СРЕДЫ ДЛЯ ПРЕДВАРИТЕЛЬНОГО ЦЕЛЕУКАЗАНИЯ. НА ПРИМЕРЕ СИСТЕМЫ ПОИСКА ЛИЦ.

2.1 Местоположение объекта. Анализируемая область. Эффективность алгоритма предварительного целеуказания.

2.2 синтез массива кандидатов для дальнейшего анализа.

Формирование карты активности рецептивных полей.

Выделение горизонтальных штрихов.

Пространственная кластеризация штрихов.

Математическая модель.

Вычислительный эксперимент.

Детектор движения.

2.3 Исключение из предварительно заданного массива.

Регулярные сетки.

Математическая модель.

Вычислительный эксперимент.

ГЛАВА 3. ИСПОЛЬЗОВАНИЕ МОДЕЛИ ОДНОРОДНОЙ РАСПРЕДЕЛЕННОЙ ДВУМЕРНОЙ НЕЙРОНОПОДОБНОЙ СРЕДЫ ОБНАРУЖЕНИЯ МЕСТОПОЛОЖЕНИЯ ОБЪЕКТОВ НА СЛОЖНОМ ФОНЕ.

3.1 модель преобразования информации с использованием среды состоящей из нейроноподобных элементов.

3.2 Математическая модель системы обнаружения объектов, состоящая из нейроноподобных элементов и пространство ее параметров.

Целевая функция для системы обнаружения объектов на сложном фоне.

Целевая функция для «сильного классификатора» Н,.

Ассоциативная машина. Формирование сильного классификатора Н. Процедура AdaBoost.

Формирование функции активации рецептивного поля. Слабая модель обучения.

Рецептивное поле на основе МСТ (Modified Census Transform) и его функция активации.

3.3 ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ.

3.4 Параллельное соединение каскадов.

ГЛАВА 4. КЛАССИФИКАЦИЯ НАЙДЕННОГО ОБЪЕКТА.

4.1 Задача распознавания.

4.2 Переход к двухклассовой схеме распознавания.

4.3 Формирование пространства признаков.

4.4 Результаты вычислительного эксперимента.

4.5 Примеры практической реализации систем обнаружения и классификации найденных объектов.

Основные характеристики интегральной биометрической системы распознавания человека.

Система распознавания музыкальных сигналов.

Демонстрационная система видеонаблюдения с детектированием лиг/ и распознаванием по ним людей.

Разработка версии электронного фотоархива с индексацией по лицам людей.

Демонстрационная программа, позволяющая производить поиск специальных изображений по контексту.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Тельных, Александр Александрович

Актуальность темы. Задачи обнаружения объектов на цифровых изображениях характерны для целого ряда прикладных систем: обработки цифровой информации в системах видеонаблюдения, поиска полезной информации в цифровых фото - и видеоархивах, в системах ориентации автономных устройств, в системах контроля качества, в системах организации доступа на охраняемые объекты с использованием биометрических данных, в системах обработки медицинских изображений и многих других. Особенно актуальным является анализ видео-потока в реальном масштабе времени для создания интеллектуальных камер, позволяющих записывать только те события, происходящие в их поле зрения, которые «достойны внимания» с точки зрения пользователя системы. В настоящее время получили широкое распространение устройства, реагирующие на наличие «движения» в поле зрения камеры, как правило, работающие с использованием алгоритмов оценки «оптического потока». При этом классификация объекта или группы объектов, попавших в поле зрения камеры, отсутствует. Данная работа демонстрирует возможности расширения способностей подобных устройств. Обладая возможностью обнаруживать заданные объекты (людей, лица людей, транспортные средства и т.д.), идентифицировать их в реальном времени, устройства видео-наблюдения получают совершенно новые качества, которые позволяют оценивать «ситуацию» в наблюдаемом пространстве и реагировать только на такие события, которые интересны пользователям этих систем. В предлагаемой работе рассматриваются также актуальные задачи, связанные с систематизацией, индексацией и быстрым доступом к графическим данным в цифровых видеоархивах. Предложенные системы позволяют проводить поиск и автоматическую рубрикацию данных без участия оператора, опираясь только на заложенные в них алгоритмы и предложенную к рассмотрению видеоинформацию. Точность и надежность результатов, полученных при решении задач обнаружения, уточнения и распознавания объектов на сложном фоне, является критическим параметром всей системы в целом, наряду с быстродействием системы. Таким образом, актуальной является задача оптимизации параметров распознающей системы как по точности, так и по времени отклика. Цель данной работы заключается в разработке математических моделей и нейроноподобных алгоритмов, ориентированных на реализацию обучающейся системы для распознавания и мониторинга объектов с нетривиальной геометрией на сложном фоне в реальном времени. Разработанная модель должна позволять использующей ее системе эффективно функционировать в типичной программной среде персональных компьютеров. Система должна обладать подсистемой контроля полученного результата.

Для достижения поставленных целей необходимо решить следующие задачи:

1. Разработка теоретических принципов распознающей модели.

2. Разработка архитектуры программного комплекса для настройки создаваемых распознающих систем, работающих в режиме реального времени.

3. Реализация комплекса в виде пакета программ.

4. Разработка модели тестирования эффективности работы создаваемых распознающих систем.

5. Разработка методики статистического обучения нейроноподобных моделей для обнаружения объектов на сложном фоне с использованием прецедентной базы данных.

Методы исследования. Для решения поставленных в диссертационной работе задач были использованы методы теории распознавания образов, математической статистики, математического моделирования, теории искусственных нейронных сетей, цифровой обработки сигналов и изображений, теории вероятностей. Научная новизна работы.

1. Сформирована модель нейроноподобной системы для обнаружения, сопровождения и распознавания объектов заданного типа на сложном фоне в режиме реального времени.

2. Разработаны алгоритмы и архитектура нейроноподобной системы распознавания, позволяющие формировать модельное описание заранее заданных объектов.

3. Разработан способ параллельного соединения каскадов «сильных классификаторов», обученных на разных прецедентных базах, существенно повышающий производительность системы обнаружения.

4. Проведено исследование эффективности работы нескольких алгоритмов формирования функции активации сигналов от рецептивных полей.

5. Исследованы алгоритмы классификации найденного объекта с использованием нейроноподобной системы. Практическая ценность работы. Полученные в диссертационной работе результаты исследований и реализация программного комплекса для настройки нейроноподобных систем видеонаблюдения являются основой для построения перспективных систем и устройств обнаружения, сопровождения и классификации объектов на произвольном сложном фоне. Результаты данной работы могут использоваться также в системах оперативного анализа информации на борту летательных аппаратов и системах зрения автономных мобильных роботов.

Реализация результатов работы.

Разработанные алгоритмы и программы используются в действующих вариантах демонстрационных биометрических систем для распознавания человека: по руке; по лицу; по дактоотпечатку; интегральная биометрическая система (SDK и Демо для IBRS). Разработаны системы для распознавания музыкальных сигналов, а также особенностей вида ЭЭГ. Разработана версия фотоархива с индексацией по лицам, система контекстного поиска для изображений специального характера. Системы ориентированы на применение в системах анализа информации в Интернете, в биометрических системах доступа, в системах обеспечения безопасности предприятий.

Апробация работы. Результаты работы обсуждались на 3-м рабочем семинаре-совещании «Теория приложения искусственных нейронных сетей» (Снежинск, РФЯЦ ВНИИТФ, 1998), на 4-й всероссийской конференции «Биомеханика» (Нижний Новгород, 1998), на 12-й международной конференции по нейрокибернетике (Ростов-на-Дону, 1999), на 2-м съезде биофизиков России (Москва, 1999), 4-й конференции по радиофизике (Нижний Новгород, 2000), на международной конференции ICONIP'02 (Сингапур, 2002), на международной конференции APHYS 2003 (Spain, Badajoz, 2003), на 6-й, 8-й, 9-й и 10-й всероссийской научно-технической конференции «Нейроинформатика» (Москва, МИФИ, 2004, 2006, 2007, 2008), на конференции «Управление и информационные технологии» (Санкт-Петербург, 2005), на 2-й Троицкой конференции «Медицинская физика и инновации в медицине» (Троицк, 2006), на 13-й всероссийской конференции «Математические методы распознавания образов» (Санкт-Петербург, 2007), на 9-й международной конференции Pattern Recognition and Image Analysis: New Information Technologies, PRIA-9-2008 (Нижний Новгород, 2008).

Публикации. Всего по теме диссертации опубликовано 26 работ, включая 7 международных. Из них 1 международный патент, 2 российских патента, 2 статьи в научных журналах из списка ВАК РФ, 16 статей в научных сборниках и 5 тезисов докладов на конференциях.

Структура диссертации. Диссертация состоит из введения, четырех глав, заключения и двух приложений. Она изложена на 125 страницах, Список литературы включает 77 наименований.

Заключение диссертация на тему "Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов"

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ.

В диссертационной работе получены результаты по режимам настройки и работе реализованной системы распознавания на заданные объекты. Создаваемая в процессе настройки система состоит из блока предварительного целеуказания, блока детектирования объектов, блока сопровождения, блока классификации найденных объектов. Система работает в реальном времени. Основные результаты диссертационной работы заключаются в следующем:

1. Предложена математическая модель нейроноподобных сенсорных элементов (включающих рецептивное поле и функции активации), а также каскады из таких элементов, позволяющая сформировать способные работать в реальном времени системы обнаружения и классификации объектов на 2ё-изображении. Предложена оптимальная модель рецептивного поля с точки зрения вычислительной эффективности.

2. Создана и реализована оригинальная методика настройки параметров модели объекта. На основе этой методики исследованы режимы формирования эффективной модели распознаваемого объекта на изображении по заранее заданному экспертом набору прецедентов.

3. Разработан алгоритм параллельного соединения детекторов. Показано, что предложенная методика параллельного соединения каскадов нейроноподобных элементов значительно снижает ошибку обнаружения ложных целей.

4. Предложена и реализована методика тестирования алгоритмов классификации найденных объектов. Показано, что алгоритм классификации, основанный на модели рецептивного поля и переходе к двухклассовой задаче, позволяет конструировать систему распознавания из универсальных элементов.

5. Исследованные алгоритмы реализованы в виде комплекса программ и использованы при разработке систем идентификации человека по биометрическим признакам. Комплекс позволяет работать как в интерактивном, так и в автоматическом режиме.

ЗАКЛЮЧЕНИЕ

Библиография Тельных, Александр Александрович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Иваницкий Г.Р., Кринский В.И., Сельков Е.Е., Математическая биофизика клетки. М.: «Наука», 1978

2. Лоскутов А.Ю., Михайлов А. С. Введение в синергетику. М.: «Наука», 1990

3. Wilson H.R., Cowan J.D. A Mathematical Theory of the Functional Dynamics of cortical and Thalamic Neuron Tissue//"Kibernetic". 1973. V13. P.55-80

4. Wilson H.R., Cowan J.D. Excitatory and Inhibitory Interactions in Localized Populations of Model Neurons// "Biophiys.J". V 12. P. 1-24

5. Сбитнев В.К, Драбкин Г.М. Перенос спайков в статистических нейронных ансамблях. I. Концепция фазовых переходов // Биофизика. 1975. Т.20. С. 669-702

6. Сбитнев В.И. Перенос спайков в статистических нейронных ансамблях. III. Фазовый переход в модели САЗ гипоккама//Биофизика. 1977. Т. 22. С. 523-528

7. Позин Н.В. Моделирование нейронных структур. М. Наука, 1970. 264С.

8. Amari S. Dynamics of Pattern Formation in Lateral-inhibition Type Neural Fields // Biol. Cybernetics. 1977. Vol. 27/ P.77-87.

9. Кудряшов А.В., Яхно В.Г., Распространение областей повышенной импульсной активности в нейронной сети.// В сб. Динамика биологических систем. 1978. Вып.2. С. 45-59.

10. Шульгина Г.И., Исследование функциональной роли нейрофизиологических процессов на модели из нейроноподобных элементов. // Итоги науки и техники. Сер. Физические и математические модели нейронных сетей. ТЗ. М.: ВИНИТИ. 1991. С. 62-104

11. Кузнецов С.О., Нуйделъ КВ., Яхно В.Г., Сегментация и классификация образов на изображении с помощью элементов с нейросетевой архитектурой: Препринт ИПФ АН СССР N250. Н.Новгород 1989

12. Bellustin N.S., Kuznetsov S.O., Nuidel I.V., Yakhno V.G., Neural Networks with Close Nonlocal Coupling for Analyzing Composite Imges// Neurocomputing. V.3. 1991. P 231-246

13. Васильев B.A., Романовский Ю.М., Яхно В.Г., Автоволновые процессы. М.: Наука, 1987. 240С

14. Васильев В.А., Романовский Ю.М., Яхно В.Г., Автоволновые процессы в распределенных кинетических системах. // УФН. 1979. Т. 128. вып. 4. С625-666

15. Нуйделъ КВ., Кузнецов С.О., Использование однородных нейроноподобных сред для обработки изображений. // Изв. Вузов. Радиофизика. 1994 Т.37. N8. Сю 10531061

16. Bellustin N.S., Zemslov S.P., Yakhno V.G. Neuron-like Elements for modeling Social and Economic Problems // Proc. Of the Second International Symposium on Neuroinformatics and Neurocomputers, Rostov-On-Don, Russia, 1995. P.311-315

17. Yakhno V.G. Spatial-Temporal Dynamic Structures in Medium of Coupled Neuron-like Molecular Elements for Designing Decision Make Systems // The 5th International

18. Symposium Bioelectronics and Molecular Electronic Devices, Okinawa, Japan, Nov. 28-30 1995, P.253-254

19. Vasilev V.A., Romanovskii Y.M., Chernavskii D.C., Yakhno Y.G. Autowave Processes in Kinetic Systems. Spatial and Temporal Self-organization in Physics, Chemistry, Biology and Medicine. VEB deutscher Verlag der Wissenschaft, 1987, GDR

20. Беллюстин H.C. О динамике структур в искусственных нейронных сетях с латеральной конкуренцией элементов. Препринт НИРФИ N363, Нижний Новгород, 1993

21. Kohonen Т. An Introduction to Neural Computing // Neural Networks. 1988 V.l. P.3-16

22. Garpenter G., Grossberg S. A massively Parallel Architecture for Selforganizing Neural Pattern Recognizing Machine // Computer Vision, Graphics and Image Understanding. 1987, V.37.P.54-115.

23. Fukushima K. Cognitron: a self-organizing multilayered neural network model // NHK Technical Monograph. 1981. N30. NHK Technical Labs. Tokyo.

24. Fukushima K. Neocognitron: a new algorithm for pattern recognition tolerant of deformation and shifts in position.// Pattern Recognition. 1982. VI .15.P.455

25. ХыобелД. Глаз, мозг, зрение. М.:Мир, 1990. 239

26. Hubel D. and Wiesel Т. Receptive Fields, binocular integration and functional architecture in cat's visual cortex. //J.Physiol. 1962. V.160.P.106-154

27. Беллюстин H.C., Яхно В.Г. Пространственно-временная динамика в простейших экономических системах. // В тр. Международной школы «Nonlinear Science», Н.Новгород, 1995г.

28. Daugman John J. Six Formal Properties of Two-Dimensional Anisotropic Visual Filters: Structure principles and Frequency/Orientation Selectivity //IEEE Transaction on Systems/ Man and Cybernetics. 1983. V.SMS-13. N 5. P.882-887

29. Daugman John J. Uncertainty relation for resolution in spacr, spatial frequency and orientation optimized by two-dimentional visual cortical filters // Journal of the Optical Society of America. 1985. V.12.N 7. P.882-887.

30. Daugman John J Complete Discrete 2-D Gabor Transforms by Neural Networks for Image Analysis and Compression. //IEEE Transactions on Acoustic, Speech and Signal Processing. 1988. V.36. N 7, P.l 169-1179

31. Viola P & Jones M. Rapid Object Detection using boosted cascade of simply classifiers. //2001

32. Linehart RKuranov A. Pisarevsky V. Empirical Analysis of Detection Cascades of Boosted Classifiers for Rapid Object Detection // Microprocessor Research Labs, Intel labs, Technical report, may 2002

33. Turner M.R. Texture Discrimination by Functions // Biological Cybernetics 1986. V.55. P.71-82

34. Госалес P., Вудс. P. Цифровая обработка изображений. M.: Техносфера. 2006

35. Т. Pavlidis, Algorithms for Graphics and Image Processing. Rockville, Maryland: Computer Science Press, 1982

36. D.H. Ballard and C. Brown, Computer Vision, New Jersey, Prentice Hall, pp 149-157, 1982

37. W. W. Bledsoe, The Model Method in facial recognition. Panoramic Research Inc., Palo Alto, CA, Rep. PRI:15 Aug 1966

38. T.Kanade, Picture Processing System by computer complex and recognition of human faces. Dept. of information science, Kyoto University, Nov. 1973

39. S.Carey and R.Diamond, From piecemeal to configurational representation of faces. //Science, Vol.195. Jan. 21,1977, 312-13

40. M. Turk and A. Pentland. Eigenfaces for recognition. Journal of Cognitive Neuroscience, 3:71-86, 1991.

41. B. Moghaddam and A. Pentland. Face recognition using view-based and modular eigenspaces. In Automatic Systems for the Identification of Humans, SPIE, volume 2277, 1994

42. Milanova M., Almeida P. E. M„ Okamoto J. and Simoes M. G. Applications of Cellular Neural Networks for Shape from Shading Problem // Lecture Notes in Artificial1.telligence Machine Learning and Data Mining in Pattern Recognition, 1999. P. 5163.

43. Yoon K. S., Ham Y. К and Park R.-H. Hybrid approaches to frontal view face recognition using the Hidden Markov Model and Neural Network // Pattern Recognition 1998. Vol. 31. P. 283-293.

44. Ranganath S. and Arun K. Face recognition using transform features and neural networks // Pattern Recognition 1997. Vol. 30. P. 1615-1622.

45. Lawrence S., Giles C. L., Tsoi A. C., Back A. D. Face Recognition: A Convolutional Neural Network Approach // IEEE Transactions on Neural Networks, Special Issue on Neural Networks and Pattern Recognition, 1997. P. 1-24.

46. A. V. Kovalchuk, A.A. Telnykh, OBJECT DETECTION SYSTEM USING EXPERT COMMITTEES

47. С.Хайкин. Нейронные сети. Полный курс. //Издат. Дом «Вильяме» 2006

48. Nilson N.J. Learning Mashines: Foundations of Trainable Pattern-Classifying Systems, New York: McGraw-Hill, 1965

49. Freud Y. and R.E. Schapire, Experiments with a new boosting algorithm, Machine Learning:. Proceedings of the Thirteen International Conference, 1996, p. 148-156, Bari, Italy

50. Freud Y. and R.E. Schapire, Game Theory, on-line prediction and boosting. Proceedings of the Ninth Annual Conference on Computational Learning Theory, 1996 p.325-332, Desenzano del Garda, Italy

51. Y. Freund and R. E. Shapire. A short introduction to boosting. Journal of Japanese Society or Artificial Intelligence, pages 771-780, 1999.

52. Rodrigo Verschae, Javier Ruiz-del-Solar, Mauricio Correa, Paul Vallejos, A Unified Learning Framework for Face, Eyes and Gender Detection using Nested Cascades of Boosted Classifiers

53. Левин Б.P., Теоретические основы статистической радиотехники, М: Радио и связь, 1989. 656с.

54. Фомин, Оптимизация распознающих систем

55. В. Froba and A. Ernst, Face detection with the modified census transform", 6th Int. Conf. on Face and Gesture Recognition FG 2004, pp. 91-96, Seoul, Korea, May 2004.

56. Erik Hjelmas, Christel Beate Ler0y and Henry Johansen Department of Electrical ngineering and Science Gjervik College, ICI System: A First Attempt, email: erikh@hig.no, cleroey@online.no, henry.iohansen@no.ibm.com

57. Ross Cutler, Face Recognition Using Infrared Images and Eigenfaces, April 26, 1996

58. Turk, M., and Pentland, A., (1991) Eigenfaces for Recognition, Journal of Cognitive Neuroscience, Vol. 3, No. 1, pp. 71-86.

59. Pentland, et. al., (1991) Experiments with Eigenfaces, MIT VISMOD TR-194.

60. Kamran Etemad and Rama Chellappa, Discriminant analysis for recognition of human face images, J. Opt. Soc. Am. A/ Vol. 14, No. 8/August 1997

61. W.Zhao, R.Chellappa, A. Krishnaawamy, Discriminant analysis of Principal Components for Face Recognition

62. Juwei Lu, Kostantinos N. Plataniotis, and Anastasios N. Venetsanopoulos, Face Recognition Using LDA-Based Algorithms, IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 14, NO. 1, JANUARY 2003

63. P. N. Belhumeur, J. P. Hespanha, and D. J. Kriegman, "Eigenfaces vs.Fisherfaces: Recognition using class specific linear projection," IEEE Trans. Pattern Anal. Machine Intell., vol. 19, pp. 711-720, May 1997.

64. Kresimir Delac, Mislav Grgic, Sonja Grgic, Independent Comparative Study of PCA, ICA, and LDAon the FERET Data Set,' 2006 Wiley Periodicals, Inc.

65. Yang M.-H., Kriegman D., Ahuja N., Detecting Faces in Images: A Survey IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 24, 2002, no. 1, pp. 34-58,

66. Sung K.-K., Poggio T., Example-based learning for view-based human face detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(1), 1998, pp. 3951.

67. Rowley H., Baluja S., Kanade Т., Neural network-based detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(1), 1998, pp. 23-38.

68. Osuna E., Freund R., Girosi F., Training support vector machines: An application to face detection. Proceedings of IEEE Conference on Computer Vision, 1997, pp. 130136.

69. Schneiderman H., Kanade Т., Probabilistic modeling of local appearance and spatial relationships for object recognition. Proceedings of IEEE Conference on Computer Vision snd Pattern Recognition, 1998, pp. 45-51.

70. Rajagopalan A., Kumar K., Karlekar J., Manivasakan R., Patil M., Desai U., Poonacha P., Chaudhuri S., Finding fsces in photographs. Proceedings of the Sixth IEEE Internation Conference on Computer Vision, 1998, 640-645.

71. Тельных А.А., Яхно В.Г., Савельев Д.В., Смирнов Г.В., Новиков А.В., Ветушкин В.Д., Донченко Е.В. Программно-аппаратный комплекс для биометрии кисти // Тезисы докладов на IV Всероссийской конференции "Биомеханика -98", -Н. Новгород, 1998, -С.84.

72. Коган А.Н., Тельных А.А., Яхно В.Г. Нейросетевые режимы принятия решений // II съезд биофизиков России 23-27 августа 1999 г. -Москва, 1999. Тезисы докладов, том II, -С. 419.

73. Tel'nykh O.S., Tel'nykh A.A., and Shilin S.G. Program for recording, analyzing, and automatic finding of characteristic features in encephalograms // Proceedings of Nijmengen Institute for Cognition and Information, 2004, -P.391-396.

74. Тельных А.А., Разумов B.A., Беллюстин H.C., Калафати Ю.Д., Яхно В.Г. Создание электронной версии фотоальбома с индексированием по изображениям лиц // Сб. докладов «Управление и информационные технологии». Т. 1. 2005. -С.260-267.

75. Ковальчук А.В., Беллюстин Н.С., Тельных А.А., Яхно В.Г. О методах промежуточного контроля в сложной системе обнаружения и распознавания лиц // Сб. докладов XIII всероссийской конф. ММРО-13. М.: МАКС-Пресс, 2007 С. 471-481.

76. Беллюстин Н.С., Тельных А.А., Разумов В.А., Шемагина О.В., Ковальчук А.В., Яхно В.Г., Применение генетических алгоритмов для уточнения местоположения лица человека на видеоизображении // Нейрокомпьютеры: разработка и применение, 2007, № 11, -С. 43-45.

77. Telnykh A.A., Kovalchuk A.V., Object detection system using expert committeets, //9-th International Conference on Pattern Recognition and Image

78. Analysis: New Information Technologies, PRIA-9-2008, September 14-20, 2008, Conference Proceedings, v.2. Nizhni Novgorod, 2008, -P. 212-214.

79. Ковальчук A.B., Соколов M.E., Тельных A.A., Сопоставление нейроноподобных и классических методов в задаче уточнения координат глаз, //Сборник научных трудов ISBN 978-5-7262-0878-7, часть 2 / МИФИ. М., 2008. -С.123-132.

80. Бондаренко Б.Н., Нуйдель И.В., Сборщиков И.Ф., Тельных А.А., Хилько А.И., Яхно В.Г., Адаптивное построение изображений нейроноподобной исследовательской системой, Препринт / ИПФ РАН, №559. Нижний Новгород, 2001-29 с.

81. US Patent No.: US 6,751,353 Bl, 2000 Yakhno V.G., Nuidel I.V., Telnykh A. A., Bondarenko B.N., Sborshikov V.A., Khilko A.I./ The method for adaptive recognition of information images, and the system of implementation thereof. — 12 p.