автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Метод, модели и алгоритмы обработки сложноформализуемых видеоданных в локальных информационных системах

кандидата технических наук
Скрипкина, Анна Андреевна
город
Курск
год
2013
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Метод, модели и алгоритмы обработки сложноформализуемых видеоданных в локальных информационных системах»

Автореферат диссертации по теме "Метод, модели и алгоритмы обработки сложноформализуемых видеоданных в локальных информационных системах"

На правах рукописи

Скрипкина Анна Андреевна

МЕТОД, МОДЕЛИ И АЛГОРИТМЫ ОБРАБОТКИ СЛОЖНОФОРМАЛИЗУЕМЫХ ВИДЕОДАННЫХ В ЛОКАЛЬНЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

05.13.01 - Системный анализ, управление и обработка информации

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

28 ноя т

005540706

Курск-2013

005540706

Работа выполнена в Юго-Западном государственном университете н кафедре биомедицинской инженерии

Научный руководитель: доктор технических наук, профессор

Бурмака Александр Александрович

Официальные оппоненты: Довбня Виталий Георгиевич

доктор технических наук, старший научный сотрудник, Научно-исследовательский центр (г. Курск) ФГУП «18 ЦНИИ» МО РФ, главный научный сотрудник

Горбатенко Светлана Александровна

кандидат технических наук, доцент Курский институт социального образования (филиал) Российского государственного социального университета, директор

Ведущая организация: Курское ОАО «Прибор» ОКБ

«Авиаавтоматика», г. Курск

Защита состоится «20» декабря 2013 г. в 1300 часов в конференц-зале н заседании диссертационного совета Д 212.105.03 при Юго-Западно государственном университете по адресу: 305040, Курск, ул. 50 лет Октября, 94.

С диссертацией можно ознакомиться в библиотеке Юго-Западног государственного университета.

Автореферат разослан «19» ноября 2013 года

Ученый секретарь диссертационного совета Д 212.105.03 ---у'М**^' / Милостная Наталья Анатольевна

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Широкое развитие и выделение информационных технологий в различных отраслях народного хозяйства Российской Федерации, в сервисных службах, силовых и оборонных ведомствах в настоящее время способствует созданию единой системы информационного мониторинга для своевременного контроля и управления технологическими, сервисными, охранными и другими целенаправленными процессами.

Важнейшим направлением является построение и использование видеоинформационного мониторинга, как наиболее содержательного и доступного в организации, доставляющего до 80% всей оперативной и технологической информации пользователям соответствующего уровня.

Одним из факторов в создании видеоинформационного потока данных, формируемого оптико-электронными и программно-аппаратными средствами видеомониторинга, является распознавание и анализ движущихся объектов, обработка информации, отображаемой в кадрах видеоизображений, представленных в аналоговом и цифровом видах в зависимости от типа и назначения видеодатчиков (аналоговых и цифровых видеокамер).

Обычно при распознавании (классификации) движущихся объектов решаются следующие задачи: определение самого факта движения; выделение анализируемого движущегося объекта на фоне стационарного или движущегося фона; определение (классификация) типа движущегося объекта (человека, животного, птицы, транспортного средства и т.д.); распознавание конкретного образа движущегося объекта, например, лица (портрета) человека.

При этом опознание конкретного человека, в основном, осуществляется путем сравнения эталона (портрета, видеоизображения) с видеоизображениями человека (текущим видеокадром) или его отдельными чертами (например, изображение радужной оболочки глаза).

Анализ известных приемов, методов и средств распознавания и идентификации людей по их портретному сходству показал их недостаточную эффективность в целом ряде случаев, а именно при преднамеренном сокрытии (например, с помощью маски) или искажении лица, его отдельных черт (использованием грима, искусственным преобразованием путем использования сторонних предметов); при неудачном ракурсе наблюдения движущегося человека; при значительном расстоянии между человеком и видеодатчиком; при недостаточном освещении анализируемого объекта.

В связи с этим представляется целесообразным поиск, обоснование и использование особенностей, свойств новых информационных признаков, позволяющих повысить качество распознавания движущихся людей.

Разработке методов обнаружения и сопровождения движущихся объектов, обработки изображений и управления объектами и целенаправленными процессами (например, пожаро-охранными) посвящен целый ряд фундаментальных исследований Алпатова Б.А., Атакищева О.И., Башмакова O.E., Быкова P.E., Гуревича С.Б., Дуды Р., Харта П. и др. Методы цифровой обработки

изображений рассматривались в работах Гонсалеса Р., Лукьяницы A.A., Титова B.C., Филиста С.А. Вопросы, посвященные передаче видеоданных, исследовались в работах Зубарева Ю.Б., Согдулаева Ю.С. и др. Методы распознавания статических и динамических образов на основе пространственно-временного анализа видеоизображений освещались в работах Фаворской М.Н., Сойфера В.А., Фисенко В.Т., Форсайта Д., Ключикова И.А. и др. Вместе с тем, вопросы распознавания движущихся людей (динамических образов) в различных ситуациях и в условиях меняющихся факторов (наличие помех, неоднородности освещения, изменение ракурса и т.д.) остаются нерешенными.

Одним из перспективных направлений распознавания и идентификации образов движущихся людей является биометрия, то есть технология, использующая физиологические или поведенческие особенности, способны выступать в качестве признаков при распознавании и идентификации образов людей, находящихся в движении (то есть идущих пешком или бегущих отдельно или в толпе).

Анализ многочисленных, в основном зарубежных, публикаций в области биометрии позволяет утверждать, что различными авторами исследована такая биометрическая характеристика, как походка человека, описаны методы е идентификации как полезного, а часто и незаменимого признака в общем словар признаков, используемых при распознавании образов движущихся людей. В результате этого анализа также установлено, что ряд вопросов, таких ка формирование эталонов с включением признака — особенностей (свойств походки индивидуума, коррекция этих эталонов в процессе обучения системы распознавания образов, а также - оптимизация текущих описаний конкретны движущихся людей для их последующего сравнения с эталонами рассмотрены исследованы недостаточно для различных форм представления походки человека.

Таким образом, сложилось противоречие между необходимостью повышат достоверность и оперативность (быстродействие) распознавания движущихся людей в различных условиях внешней среды и ограниченными возможностям существующих методов и средств соответствующего назначения. Из-з многочисленных приемов описания походки движущегося человек неоднозначны пути и способы соответствующих эталонных описаний и текущи описаний походки конкретного человека. При этом оба типа описани" (представлений) и последующие процедуры распознавания и идентификаци движущихся объектов должны опираться на теоретически и экспериментальн исследованный и обоснованно выбранный словарь признаков и алфавит классо соответственно для походки и других биометрических характеристик с близким (схожими) свойствами.

В этой связи актуальной научно-технической задачей являете повышение достоверности и быстродействия распознавания и идентификаци движущихся людей путем разработки метода и моделей обработк сложноформализуемых видеоданных (видеоизображений) в части оптимизаци текущих описаний движущегося человека на основе косвенных биометрически признаков (походка), повышение достоверности формирования эталонны описаний объекта по этим признакам.

Целью работы является разработка моделей, метода и алгоритмов обработки сложноструктурируемых видеоданных на основе использования косвенных биометрических признаков движения человека для повышения качества распознавания и идентификации конкретных людей (движущихся объектов).

В соответствии с поставленной целью научно-техническая задача диссертационной работы декомпозирована на следующие частные задачи:

1. Анализ результатов современных исследований (на основе отечественных и зарубежных публикаций монографий, методик, статей и докладов) в области автоматического и автоматизированного процессов селекции видеоданных (видеоизображений) по косвенным биометрическим признакам движения, определение существующих ограничений известных приемов и методов распознавания и идентификации движущегося человека, обоснование направлений исследований.

2. Разработка системной модели выделения косвенных признаков движущихся конкретных людей, формирование рабочего словаря признаков единой или гибридной физической природы.

3. Разработка метода и программно-ориентированных алгоритмов формирования текущих описаний, эталонов и классов движущихся людей на основе использования словаря и алфавита для косвенных признаков движения.

4. Создание функционально-структурной организации системы распознавания движущихся людей по косвенным биометрическим признакам.

Объект исследований - автоматические и автоматизированные системы распознавания и идентификации движущихся людей в общем комплексе видеоинформационного мониторинга.

Предмет исследований - методы и алгоритмы селекции и цифровой обработки видеоданных, использующие косвенные признаки движущихся людей для их выделения из общего фона, распознавания и идентификации в реальном масштабе времени.

Методы исследования. Для рещения поставленных в работе задач использовались методы и приемы цифровой обработки и анализа видеоинформации, методы системного анализа, принципы построения систем видеомониторинга, теория систем, теория распознавания образов, теория множеств и математической логики, методики грамматического описания и анализа видеосцен, теория сигналов, теория обнаружения и выделения сигналов.

Новыми научными результатами и положениями, выносимыми на защиту, являются:

1. Системная модель выделения косвенных биометрических признаков движения конкретных людей, отличительной особенностью которых является представление этих признаков в пространственно-частотном базисе, оптимизирующих текущие и эталонные описания движущихся объектов.

2. Метод формирования рабочего словаря, объединяющего косвенные и гибридные признаки для текущего и эталонного описания движущихся экземпляров людей, отличием которого является использование признаков

частотного (спектрального) разложения вспомогательных траекторий

движущихся частей тела идущего человека.

3. Программно-ориентированные алгоритмы:

- формирования рабочего словаря признаков косвенного и гибридного видов для текущих и эталонных описаний движущихся людей;

- формирования эталонных описаний (экземпляров людей) на основе пространственно-частотного представления косвенных признаков в составе рабочего словаря;

- распознавания и идентификации движущихся людей с использованием гибридного словаря и приемов обучения с целью динамического уточнения алфавита классов в процессе функционирования системы распознавания.

4. Функционально-структурная организация системы распознавания движущихся людей, отличающаяся наличием элементов и связей формирования рабочих гибридных словарей косвенных признаков, представленных в пространственно-временном базисе.

Практическая ценность и внедрение результатов работы

Практическая ценность работы состоит в следующем.

Разработка моделей формирования рабочего словаря из косвенных и гибридных информативных признаков, текущих и эталонных описаний экземпляров движущихся людей (объектов), положеных в основу функционирования автоматических распознающих систем в составе комплексов видеоинформационного мониторинга (видеонаблюдения, регистрации высокоинформативных видеоданных, охранного телевидения и т.д.), функционирующих в реальном масштабе времени.

Программно-ориентированные алгоритмы поэкземплярного распознавания и идентификации образов движущихся людей с применением биометрических косвенных и гибридных описаний, оптимизирующие локальные процессы функционирования распознающей системы с требуемой технической эффективностью внедрены в ФГУП «18 ЦНИИ» МО РФ, г. Курск и используются в учебном процессе Юго-Западного государственного университета, что подтверждено соответствующими актами.

Соответствие диссертации паспорту научной специальности

Диссертация соответствует паспорту специальности 05.13.01 — Системный анализ, управление и обработка информации: п. 4 «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации», п. 5 «Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», а также п. 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации».

Апробация работы. Основные научные и практические результаты диссертационного исследования докладывались и получили положительную оценку на международных и российских научных конференциях: «Перспективы развития информационных технологий» (г. Новосибирск, 2011 г.), «Медико-

экологические информационные технологии» (г. Курск, 2011 г.),

«Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации «Распознавание - 2012» (г. Курск, 2012 г.), «Тенденции и инновации современной науки» (г. Краснодар, 2013 г.), «Актуальные задачи математического моделирования и информационных технологий» (г. Сочи, 2013 г.), а также на научно-технических семинарах кафедры «Биомедицинская инженерия» с 2011 по 2013 гг.

Публикации. Основные результаты диссертации отражены в 10 научных работах, из них 4 статьи, опубликованные в ведущих рецензируемых научных журналах.

Личный вклад автора. Все выносимые на защиту результаты получены лично автором. В работах, опубликованных в соавторстве и приведенных в списке литературы, соискателем лично предложены: в [1] и [7] анализ результатов современных исследований в области автоматического и автоматизированного процессов селекции видеоданных; в [3] - системная модель выделения косвенных признаков движущихся конкретных людей; в [4] — структурная и математическая модели выделения признаков движущегося человека по траекториям полюсов (фокусов) эллипсной модели.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы, включающего 70 наименований, изложена на 136 страницах машинописного текста и поясняется 38 рисунками, 3 таблицами.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы основное противоречие, цель и задачи исследования, научная новизна, положения, выносимые на защиту, практическая ценность, основные результаты работы.

В первой главе выполнен анализ известных методов и устройств цифровой обработки видеоинформации, отражены цели и задачи анализа и обработки оцифрованных видеопоследовательностей. Показано, что наиболее сложными и проблемными вопросами являются сегментация, распознавание (классификация), идентификация и отслеживание двигающихся фрагментов видеоизображения, особенно движущихся образов людей ввиду их многопозиционного проецирования на двумерное (х,^) изображение, применение сложноструктурированных шаблонов, блокирование движения различными перекрытиями во времени и пространстве, подверженность влиянию помех как на этапе приема входной информации, так и в процессе ее обработки на различных этапах реализации алгоритма функционирования системы распознавания видеообразов, в том числе движущихся людей. Показано, что если задачи классификации движущихся объектов рассматривать в видеопоследовательностях как единый процесс, то наиболее эффективным представляется подход решения этих задач с единых системных позиций, использующий иерархические принципы параллельно-последовательной обработки видеоданных.

Рассмотрены и систематизированы типовые задачи

анализа видеоинформации (рисунок 1), показана роль приемов и алгоритмов селекции движущихся объектов, в том числе - людей, проанализированы существующие способы селекции образов движущихся людей, выделены их достоинства и недостатки.

Рис. 1. Целевые задачи систем анализа и обработки видеоизображений

При этом основными этапами известных способов анализа видеоизображений в реальном масштабе времени являются:

- анализ существующих способов оценивания наличия движения в кадрах видеопоследовательности;

- сопоставление методов сегментации движущихся (динамических) объектов в кадре;

- селекция и выделение лучших по показательности быстродействия и достоверности приемов анализа сцен с целью определения совокупности информативных признаков распознаваемого объекта;

- подготовительная работа: формирование и обработка априорной информации, необходимой для структурно-параметрического синтеза подсистемы распознавания и идентификации движущихся объектов;

- построение алгоритмов оценивания характера движения динамических объектов, выделения (селекции) движущихся образов людей в соответствии с выбранной и обоснованной моделью сегментации анализируемых фрагментов

изображения.

В результате анализа существующих приемов фильтрации видеоинформации показано, что лучшими показателями обладают фильтры, реализующие процедуру свертки, т.е.

] 1

«=- 1п=-1 (1)

где 1ф - изображение (сцена, кадр); 1„х ~ исходное изображение; М г{т,п) -

матрица соответствующей размерности, задающая параметры фильтра; Ах, Ау -корректирующие поправки.

Вычислительная и алгоритмическая сложность, недостаточность описания динамических объектов, в особенности людей, обусловили поиск новых приемов и признаков, в том числе косвенных, для повышения достоверности и оперативности распознавания и отслеживания движущихся людей. В качестве таких признаков широко используются биометрические характеристики, такие как тепловые портрет лица и особенности походки человека.

Движущиеся люди формируют характерные образы в пространственно-временной плоскости, анализ которых дает уникальные признаки походки (косвенные и прямые), дополняющие рабочий словарь признаков до уровня описания эталонов, позволяющих существенно повысить достоверность распознавания образов движущихся людей. Траектория движения (на уровне лодыжки) человека в пространственно-временной плоскости показана на рисунке 2.

Рис. 2. Траектория движения человека в пространство-временной плоскости

Блочный алгоритм распознавания человека по походке показан на рисунке 3.

На основе анализа значительного количества публикаций (в основном зарубежных) по использованию признаков походки для распознавания движущихся индивидуумов было выявлено, что большинство из них выполнены на уровне комментариев к экспериментальных исследованиям и результатам проверки различных программных продуктов.

В результате разнопланового анализа обработки видеоданных с целью распознавания и отслеживания движущихся людей показано, что эти вопросы в предметной области исследованы недостаточно, в связи с чем сформирован круг (перечень) задач по разработке моделей, метода и алгоритмов обработки сложноструктурированных видеоданных на основе выделения и использования

косвенных биометрических признаков движения человека для повышения качества распознавания и идентификации образов конкретных людей.

Видеопоследовательность

- распознавание;

- идентифиация

Рис. 3. Блочный алгоритм распознавания человека по походке

Во второй главе с учетом результатов анализа видеопоследовательностей с динамическими объектами выполняется разработка системной модели обработки видеоизображений и выделения косвенных признаков движущихся конкретных людей как результатов последовательной реализации этапов (шагов, процедур) обработки видеопоследовательностей. Принимая, что динамический случай распознавания самый сложный из-за большой неопределенности при оценке движения в последовательностях изображений, общая задача построения системной модели (рисунок 4) декомпозируется на:

- динамическую аналитическую субмодель состояния (ДСС, исходная модель выявления ситуации движущегося антропогенного объекта с наложением модели описания фигуры человека);

- динамическую аналитическую субмодель наблюдений;

- динамическую субмодель выделения прямых антропологических признаков (ДСПП);

- динамическую субмодель отслеживания траекторий движения (ДСТ);

- динамическую и статическую субмодели селекции косвенных признаков.

Влияния помех: пь(0, «1,0, ГгИа^м)]

Определение «прямых» и косвенных признаков походки: и Т; (ЦР, ЦТ))

Выделение переднего плана

г 1=Е8[8в(х,у,1)]

Отделение движущихся фрагментов изображения от неподвижных (фоновых)

ёв(х,у,0 Полезный сигнал видеоизображения

Определение движения человека, отслеживание траектории его движения г3=Ет{Еко,Ес(г,)} г*4=Еи(г3,гэ)

Распознавание образов людей, идентификация объектов по эталонам, описание действий |/|_ выделенных объектов м" 24=Еи(2з,£э), Z5=Eв(Zз,Zэ), г6=ЕъШ_

Выделение и классификация движущихся объектов

7

Сегментация Ес(г0 Изображений

переднего плана, нахождение компактной области, движущейся с одинаковой скоростью (движущегося объекта) _2?=НкоГч(2|)_

\7

Отслеживание

«переплетающейся» траектории движущегося объекта (трекинг Еу), определение

взаимооднозначного соответствия (идентификации Еп) Между обнаруженными объектами на

видеопоследовательностях ---

Рис. 4. Системная модель обработки видеоизображений и выделения косвенных признаков движущихся конкретных людей

В формализованном виде ДСС может быть представлена как

= ЕРи?\а«\1,т о + (/,)]«'"(/)} ' (2)

где F*, С*,/*, - переходные матрицы обработки: соответственно, б* - для текущего 1+1-то кадра, /*, g* - для анализируемого ¡-го фрагмента (переднего плана) к-го объекта (человека) О^; Е^ — оператор информационного преобразования для к-го объекта; - вид (режим) движения к-го объекта в видеопоследовательности на временном обрезке Т; х¡, у) — координаты ]-го участка анализа; ау® - уй параметр (признак, прямой или косвенный) для к-го образа

(3)

движущегося объекта на участке (хр у) с интенсивностью //!); п{к>(1, 0 -шумовая фоновая помеха на входе селектора (фильтра) переднего плана.

Для построения и реализации локального алгоритма выделения переднего плана адекватно ДСС и соответствующему этапу системной модели формируется ДСН, учитывающая динамику 1(х,у,Т), ц>(Ок), (а//,.)}'*', п\к\1,Т).

Входные воздействия для системы предобработки видеоинформации для ДСН в общем случае представляют собой произвольную комбинацию полезного сигнала 1(а,х,у,Т) и помехи «(Г), т.е. реализацию

\Е(а,х,у,Т) = 8?\{{а]Г),х1,урТ)п{Т)\,

[О <Т<Т + АГ.

Здесь время наблюдения (Т + АТ) зависит от числа кадров в анализируемой видеопоследовательности.

Остальные субмодели в соответствии с системной моделью (рисунок 4) представлены в виде операторных уравнений:

- выделение переднего плана (фрагмента динамического участка изображения)

[Ъ = ЕП&) = ЕП{Е,[8.(Х,У,/)]};

— сегментация изображений согласно субмодели шаблонов Z2 = £с(^),

А = ЕсЕП{ЕК[8Лх,У^)]}-

(4)

(5)

(6)

Z2 = EKoEcEn{Es[ge(x,y,I)]};

— выделение прямых и косвенных признаков походки X = Et(Z2),

Z3 = ETEKEcEn{Es[G = /,)}]},

= Еи (Z},Z3), 2э = ЕэгШ?(ХпУ1,*Ж

- распознавание и идентификация объектов | = 2ss(Z3,Z3),

{z;=E,Tag:i});

где ge(x,y,I) - функция интенсивности (picture function); G={g/'(x,y,I)} -множество функций интенсивности в видеопоследовательностях; х, у — координаты фрагмента (или его элемента); I — интенсивность (яркость) фрагмента изображения;

в свою очередь, операторы как направленные воздействия: Es — селекции; Еп -выделения переднего плана; Ес - сегментации; ЕК0 - формирования (выделения, селекции) компактной области; Ет — трекинга (отслеживания траектории); Еи -идентификации с учетом предыстории; Еэт - формирования эталонов; Ев —

(7)

распознавания вида (типа) походки конкретного человека; _/=./,.-результат действия операторов.

Модели, представленные в виде операторных уравнений, являются основой для создания программно-ориентированных алгоритмов формирования текущих описаний, эталонов и классов движущихся людей на основе использования словаря и алфавита для косвенных признаков движения.

Субмодель, реализующая отслеживание траектории движения человека при одновременном определении прямых признаков походки - длины шага I и периода следования шагов Т (в нижней части анализируемого фрагмента изображения), предполагает определение того, является ли движущийся объект человеком, для этого предварительно определяется форма изображения ХТ слоя, является ли он переплетающимся, как показано на рисунке 5.

Рис. 5. Форма ХТ слоя движения человека

Посколько пространственно-временная функция (рисунок 5) достаточно структурирована, то она может быть в первом приближении коррелирована с несколькими, полученными на основе априорной информации, шаблонами, использующими несколько параметров: амплитуду и, период Тп и наклон 0, в дополнение к стандартным параметрам Ь и Т (прямым признакам для рабочего словаря), модель шаблона может быть представлена известным способом, как показано на рисунке 6.

Рис. 6. Шаблон для субмодели отслеживания траектории и прямых (основных) признаков походки

Диапазон амплитуд с1(У) зависит от длины шага, т.е. с/(1/) = /(Т) и расстояния объекта от видеодатчика, период Тп зависит от скорости человека, длины шага и длин частей тела, которое может быть представлено, например, скелетной моделью, как показано на рисунке 7

Рис. 7. Формирование скелетной модели идущего человека

В третьей главе показано, что одной из базовых трудностей в распознавании динамических объектов, в особенности, антропогенного типа (людей), является построение информационно-емких шаблонов различных проекций идущего человека, позволяющих в динамике получать с наименьшими потерями максимально возможное количество текущей информации о характеристиках движения конкретных людей (образов) в условиях различных помех случайного и регулярного характера. В результате анализа различных публикаций было выявлено, что строго математизированных из них — небольшое число. Проведенный анализ различных методов получения необходимых признаков для формирования рабочего словаря, используемого для распознавания людей по походке, показал, что недостатком известных приемов является сложность вычислений и отсутствие единого подхода (даже концепции) по созданию априорного и в последующем рабочего словаря информативных признаков, инвариантных к размерам тела, воздействию внешней среды и ситуации в видеокадре и видеопоследовательностях. Поэтому обосновывается целесообразность использования так называемой «тонкой структуры» видеоизображений, в частности - походки.

Для решения этой задачи предложен комплексный подход в создании метода формирования рабочего словаря, объединяющего косвенные и гибридные признаки для текущего и эталонного описания движущихся экземпляров людей, отличием которого является использование признаков частотного (спектрального) разложения вспомогательных траекторий движущихся частей тела идущего человека. Данный подход основан на последовательном применении модельного приема (последовательности шаблонов проекций тела человека), объединенного с поуровневой фрагментацией движения человека, зафиксированного в видеопоследовательностях с периодом наблюдения Тн с последующим использованием преобразованных фрагментов видеоизображений (за вычетом фона) как многомерного сигнала в виде взвешенных сумм базисных функций.

В качестве первого этапа реализации метода формирования рабочего словаря, объединяющего косвенные и гибридные признаки для текущего и

эталонного описания движущихся экземпляров людей, отличием которого является использование признаков частотного (спектрального) разложения вспомогательных траекторий движущихся частей тела идущего человека, предложено выделение движущегося человека в кадре на основе построения и использования его эллипсной модели (и ее различных модификаций в зависимости от ситуации в кадре) с определением:

- оперных точек а и Ь (полюсов, фокусов) каждого из эллипсов модели (рисунок 8а);

- уровней нижней А, средней В и верхней С фрагментации кадров для движущегося фрагмента видеоизображения (рисунок 86);

- площадь окна Ш, анализируемого в кадре.

а) б)

Рис. 8. Структурная эллипсная модель человека, уровни А, В, С и окна с!1 и Ш' кадровой фрагментации

Пусть вся информация, содержащаяся в изображении, описывается как

1{х,у) = 1* (х, у) со5[со/ + ф(х, у)] ( (8)

где 1 - амплитуда напряженности электрического поля световой волны, ш -частота, <р - фаза.

В комплексном виде

1{х,у) = Г(х,у)ех р{-у'[со/ + ф(х,дО]}, (9)

при этом

1(х,у) = Ке[1'(х,у)]5 (]0)

При этом видеодатчик использует только амплитудную составляющую (12(х,у)), т.е. часть информации в фазовой составляющей теряется.

Любая создающая изображение система является фильтром, избирательно пропускающим одни частоты и задерживающим другие. При этом базовыми функциями для частотного разложения являются временные функции траекторий полюсов (фокусов) а,, Ък, контролируемые скользящими окнами (11({) и с!'1(1), подобно парзеновским окнам как в пределах видеокадра, так и в

видеопоследовательностях. Каждое из скользящих окон кодировано бинарным кодом с шагом соответственно Д/ и Ас1 (или Ас1'). Контролируемые траектории полюсов в пределах интервала Тн воспроизводят траектории отдельных частей тела идущего человека, содержащие всю необходимую информацию о характеристиках походки контролируемого индивидуума. Графическая модель этого процесса (шаблон) показана на рисунке 9

У \ \ 3i<t) \ \ // \ \ \ bk(t> \ / S / \ \ \ \ /// \ \ /Ьг 0 \ \ \

1/foy \

0 1/fo« X

Рис. 9. Графическая модель траектории полюсов эллипсной модели

человека

Пусть в походке доминирует циклическая частота оо0 = , определяющая

скорость походки, то на рисунке 9 a,(t) и bk(t) - вещественные функции, для которых область нулевой фазы <р - параллельные линии, наклон каждой из них и нормалям под углом

Q = arctg(И)

fay

равен где /0= —, т.е. с каждой информативной точкой (fx,fy)

foy 2п

полюса (фокусы) на плоскости пространственных частот связаны геометрические параметры: угол ориентации 6 и интервал L. Спектр реальных функций (/)] и F[bk(l)] определяют коэффициенты их разложения, например, в ряд Фурье, составленный из комплексных экспонент вида схр\2ту{/хх + /у)\. Наибольший интерес с точки зрения информации о «тонкой структуре» движения представляют участки разных переходов функций F[a((i)] и ПРИ учете

того, что из геометрических и антропогенных соображений функции F(») для одного эллипса сильно коррелированы.

Тогда, с одной стороны, изображение 1(х,у) на фотоносителе

(ПЗС-матрица камеры) описывается совокупностью коэффициентов Су, v = \,m, таких, что

00 X

Су = | 11{х,х + 1\у,у + с1)т\{х,у)<Ь<1у , (12)

—00 -ОС

где г\(х,у) - базисные функции, а с другой стороны

^¿гЬ" _ <13>

Совокупность элементов разложения С,' является спектром сигнала 1(Т,а), в частности, при Фурье-преобразовании функций и ¿ПА(0]> гДе

составляющие спектра (единицы Герц), их состав, амплитуды и фазы содержат в себе всю уникальную информацию («тонкую структуру») о характеристиках походки конкретного человека и представляют собой совокупность признаков, включаемых в состав рабочего словаря, объединяющего косвенные и гибридные признаки для текущего и эталонного описания движущихся экземпляров людей.

Траектории ^[аД/)] и Р[Ьк (/)] с позиций частотного представления (рисунок 10) рассматриваются, как отвечающие условиям модуляции /(ш0), т.е. со(/) = соо+уГ + Дсо8т(Пг + 0), (14)

где у = П = рП„р = 1,2,...,

2 т Тн

- девиация (максимальное отклонение частоты), До, 0 - параметры

зависимости, £2 - высшие составляющие спектра разложения /*[аД/)] и /Г[Л^(/)].

При этом фаза

VI2

ф(0 = — -Дфсо5(О? + 0), (15)

. 1 Аса1

где Дф =-.

О

С этих позиций в априорный (или в рабочий) словарь, объединяющий косвенные и гибридные признаки для текущего и эталонного описания движущихся экземпляров людей, включены информативные параметры {О}, Дф, Дсо, ф(?), р, 1!(0.). Таким образом, эти признаки, отнормированные по отношению и текущим значениям £ и Т, в большинстве являются инвариантными к изменению основных параметров, характеризующих походку.

Рис. 10. Графическое представление аналитической модели модуляции основного компонента походки

В четвертой главе рассматриваются принципы построения функционально-структурной организации системы распознавания движущихся людей по косвенным и гибридным признакам, базирующимся на спектральном разложении функций траекторий полюсов (фокусов) эллипсной многопроекционной (многошаблонной) модели.

Рабочий словарь признаков сформирован из основных параметров (длина шага, скорость движения) и параметров «тонкой структуры» спектрального разложения модулирующих функций полюсов {/Пд ^ХЬ^ТАСО]} • Использование всех /•"[•] полюсов, в принципе, избыточно, объем априорного словаря при этом также избыточен, но в связи с тем, что в видеопоследовательностях изменяются во времени проекции переднего плана, то рабочий словарь постоянно меняется по составу и отслеживание траекторий производится до тех пор, пока не достигается требуемая достоверность распознавания конкретного образа. При этом важно, чтобы большинство признаков рабочего словаря признаков во всем интервале наблюдений [ТН+АТ] было инвариантно к изменению скорости походки и габаритных характеристик человека. Технической задачей, синтезируемой ФСО системы распознавания, является повышение достоверности распознавания и идентификации движущихся людей по походке.

Функционально-структурная организация системы распознавания движения людей, построенная с учетом исследования системной модели, предложенной во второй и третьей главах, показана на рисунке 11.

1 Видеокамера

—2 блок хранения р I__ данных ___I

3 Блок анализа иифр. видеоизображений

4 Блок логического предпроцессора

4 I Блок моделирования

4.2 Блок сегментации

4.4 Блок эллипсного описания фигурь

4.3 Блок отслеживания траекторий (трекинга)

5 Блок выделения признаков

4.5 Блок формирования и отслеживания траекторий полюсов эллипсов

5 1 Блок период челе анализа 1 Г шага века

5.3 вычис частоты элок ления шагов С

5.2 Блок анализа

расстояния (дистанции)УУ

5,4 Блок вычисления длины шага Ь

5.5 Блок формирования функций траекторий полюсов

6 Блок' классификации |

6.1 Блок Фу рье-преобразования

6 2.2 Блок формирования рабочего словаря признаков

6.2.1 Блок

модели обучения

6.3 Блок классификации объектов по походке

Рис.11. Функционально-структурная организация системы распознавания движущихся людей по косвенным биометрическим признакам

Функциональная организация системы представлена операторными уравнениями, приведенными в главе 2. В состав системы распознавания входят (рисунок 11): видеокамера 1, блок хранения данных 2, блок логического анализа цифровых (оцифрованных) видеоизображений 3, блок логического предпроцессора (модуль предварительной обработки) 4, блок выделения признаков 5, блок классификации 6. Блок 4 содержит: блок моделирования фона 4.1, блок сегментации 4.2, блок отслеживания траектории движения (трекинга) 4.3, и отличается наличием блока эллипсного описания фигуры человека 4.4 и блока формирования и отслеживания траекторий полюсов (фокусов) эллипсов 4.5. Блок выделения признаков 5 содержит: блок анализа периода Т шага человека 5.1, блок анализа расстояния (дистанции) W 5.2, блок вычисления частоты шагов (скорости походки) С 5.3, блок вычисления длины шага L 5.4, и отличается наличием блока нормировки функций траекторий полюсов 5.5. Блок классификации 6 также содержит: элементы существенных отличий -блок Фурье-преобразования (БФП) 6.1 и блок формирования рабочего словаря признаков 6.2.2, блок модели обучения 6.2.1, блок классификации объектов по походке 6.3. Все блоки, кроме видеокамеры, являются виртуальными и построены программно-ориентированным способом с реализацией соответствующих алгоритмов на базе ЭВМ с необходимыми характеристиками. Обобщенный программно-ориентированный алгоритм функционирования системы распознавания движущихся людей показан на рисунке 12.

Экспериментальные исследования предложенного метода формирования рабочего словаря в составе обобщенного алгоритма функционирования системы распознавания движущихся людей выполнялись путем разработки и проверки работоспособности соответствующих программных алгоритмов и специальной программы. Использовалась ПЭВМ типа Notebook (процессор Intel(R) Core(TM)2DUO CPU Р7450 2,13GHz.

Получение видеоизображений с движущимися людьми для последующего анализа и обработки осуществлялось посредством 3-х камер с различными характеристиками

Для проведения экспериментальных исследований были приняты следующие допущения (ограничения):

1. Камера расположена неподвижно (стационарно).

2. Камера расположена фронтально-параллельно (квазифронтально-параллельно) по отношению к движущемуся объекту.

3. Тело человека во время движения не перекрывается посторонними предметами.

В соответствии с системной моделью обработки видеоизображений и выделения косвенных признаков движущихся конкретных людей следующим шагом после получения видеокадров с камеры является нахождение в кадре всех движущихся объектов и их отделение от фона (детекция движения). На данном этапе выполняется моделирование фона и его последующее вычитание из кадра.

Рис. 12. Обобщенный программно-ориентированный алгоритм функционирования системы распознавания движущихся людей

На рисунке 13 представлены кадры (исходный и после вычитания фона) для 1 -й камеры.

Видеопоследовательности получены в различных погодных и сезонных условиях. Отчетливо видно, что наиболее четкие силуэты после вычитания фону получаются в следующих условиях: однородный фон; однотонная, контрастная к фону одежда; неподвижность камеры; отсутствие осадков; освещенность кадра.

Рис. 13. а) кадр видеопоследовательности, полученный с камеры 1; б) результат вычитания фона

В результате эксперимента при обработке 20 массивов видеопоследовательностей объемом 360 кадров каждый с использованием оценок к-средних и формирования словаря из основных (прямых) признаков Ьк,&ок,1¥к среднее время Тс распознавания образа идущего человека составило 4,2 с (без учета общей длительности выборки видеопоследовательностей). При добавлении в словарь одного косвенного признака {О}, р = 1 среднее время составило Тс 3,6с, при добавлении признаков {О}, р = 3, Лео и Лф (с доверительными интервалами соответственно ±0,1Асо и ±0,2Лф) среднее время Тс составило 2,8 с при вероятности правильного распознавания Р = 0,95. Это позволяет сделать вывод о состоятельности и эффективности предложенного метода и достигнутой цели работы.

а)

б)

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Диссертационная работа посвящена решению научно-технической задачи повышения достоверности и быстродействия распознавания и идентификации движущихся людей путем разработки метода и моделей обработки сложноформализуемых видеоданных (видеоизображений) в части оптимизации текущих описаний движущегося человека на основе косвенных биометрических признаков (походка).

В ходе решения данной задачи получены следующие основные результаты:

1. Проведен сопоставительный анализ результатов современных исследований на основе отечественных и зарубежных публикаций в области автоматического и автоматизированного процессов селекции видеоданных (видеоизображений), использующих принципы применения биометрических характеристик, в том числе косвенных признаков.

2. Разработана системная модель выделения (селекции) косвенных признаков движущихся конкретных людей, методика формирования на основе этих признаков рабочего словаря гибридной природы.

3. Разработан метод формирования рабочего словаря, объединяющего косвенные и гибридные признаки для текущего и эталонного описания движущихся экземпляров людей, отличием которого является использование признаков частотного (спектрального) разложения вспомогательных траекторий движущихся частей тела идущего человека.

4. Разработаны, построены и опробованы экспериментально программно-ориентированные алгоритмы:

- формирования рабочего словаря признаков косвенного и гибридного типов для текущих и эталонных описаний идущих людей, отличающегося использованием признаков спектрального разложения траекторий различных двигающихся элементов тела человека;

- формирования эталонных описаний (экземпляров) людей на основе пространственно-частотного нормированного представления косвенных признаков в составе рабочего словаря;

- распознавания и идентификации движущихся людей с использованием рабочего гибридного словаря (в составе — прямые и косвенные признаки) и приемов обучения на основе корреляционных определителей с целью динамического уточнения алфавита классов в процессе функционирования системы распознавания.

5. Разработана на основе приемов структурно-параметрического синтеза функционально-структурная организация системы распознавания движущихся людей, отличающаяся наличием элементов и связей формирования рабочих гибридных словарей косвенных признаков, представленных в частотно-временном базисе.

6. Разработанные программно-ориентированные алгоритмы экспериментально проверены с использованием в качестве исходных данных серий видеопоследовательностей с движущимися людьми в различных ситуациях, доказана их работоспособность и эффективность применения в перспективных системах распознавания идущих людей по биометрическим характеристикам.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в рецензируемых научных журналах

1. Скрипкина, А.А. Применение тепловых портретов и интегрированных систем на их основе для распознавания лиц в видеопоследовательностях [Текст] / А.А. Бурмака, А.А. Скрипкина // В мире научных открытий. Серия «Математика. Механика. Информатика». -2012.-№ 8.1 (32).-С. 156-169.

2. Скрипкина, А.А. Анализ и исследование методов распознавания походки и движений человека [Текст] / А.А. Скрипкина // Естественные и технические науки. — 2013. - №3 (65). - С. 218-223.

3. Скрипкина, А.А. Разработка системной модели обработки и анализа видеоизображений и субмодели выделения переднего плана [Текст] / А.А. Бурмака, А.А. Скрипкина//Перспективы науки.-2013.-№8.-С. 153-156.

4. Скрипкина, А.А. Формирование информативных признаков движения человека по результатам видеомониторинга [Текст] / А.А. Бурмака, И.А. Ключиков, А.А. Скрипкина // Промышленные АСУ и контроллеры. — 2013. -№10. - С. 57-61.

Научные работы в других изданиях

5. Скрипкина, А.А. Использование походки человека в качестве биометрической характеристики [Текст] / А.А. Скрипкина // Медико-экологические информационные технологии-2011: сборник материалов XIV Международной научно-технической конференции. - Курск: Юго-Зап. гос. ун-т, 2011. - С.210-215.

6. Скрипкина, А.А. Обзор методов обнаружения движущегося объекта по видеоизображениям [Текст] / А.А. Скрипкина // Перспективы развития информационных технологий: сборник материалов III Международной научно-практической: в 2-х частях. Часть 1. - Новосибирск: Издательство НГТУ, 2011. -С. 126-129.

7. Скрипкина, А.А. Применение тепловых портретов для распознавания лиц в видеопоследовательностях [Текст] / А.А. Бурмака, А.А. Скрипкина // «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. «Распознавание 2012»: материалы X международной научно-технической конференции. - Курск: Юго-Западный государственный университет, 2012. - С. 65-67.

8. Скрипкина, А.А. Анализ методов распознавания движений человека [Текст] / А.А. Скрипкина // Новый университет. - 2013. -№ 1(11). - С. 28-32.

9. Скрипкина, А.А. Выделение контуров движущихся объектов на видеоизображениях посредством применения морфологических алгоритмов [Текст] /А.А. Скрипкина // Тенденции и инновации современной науки: тезисы докладов VII Международной научно-практической конференции. — Краснодар, 2013.-С. 98.

10. Скрипкина, А.А. Применение морфологических операций для контурного представления движущихся людей на видеоизображениях [Текст] /А.А. Скрипкина // European Researcher. - 2013. - Vol.(48) - № 5-1. - С. 1206-1210.

Подписано в печать 18.11.2013г. Формат 60*84 1/16. Печатных листов 1,1. Тираж 100 экз. Заказ 112 Юго-Западный государственный университет, 305040, Курск, ул. 50 лет Октября, 94

Текст работы Скрипкина, Анна Андреевна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

ФГБОУ ВПО «Юго-Западный государственный университет»

На правах рукописи

04201451664 Скрипкина Анна Андреевна

МЕТОД, МОДЕЛИ И АЛГОРИТМЫ ОБРАБОТКИ СЛОЖНОФОРМАЛИЗУЕМЫХ ВИДЕОДАННЫХ В ЛОКАЛЬНЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

05.13.01 - Системный анализ, управление и обработка информации

Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель:

доктор технических наук, профессор А.А. Бурмака

Курск-2013

ОГЛАВЛЕНИЕ

ПЕРЕЧЕНЬ СОКРАЩЕНИЙ...............................................................................4

ВВЕДЕНИЕ............................................................................................................5

1 АНАЛИЗ ИЗВЕСТНЫХ МЕТОДОВ И УСТРОЙСТВ ЦИФРОВОЙ ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ ПРИ РАСПОЗНАВАНИИ ОБЪЕКТОВ В РЕАЛЬНОМ МАСШТАБЕ ВРЕМЕНИ.......................................................................13

1.1 Цели и задачи цифрового анализа и обработки видеоинформации.........13

1.2. Основные принципы и этапы анализа видеоизображений в реальном масштабе времени..........................................................................................................18

1.3 Выделение и формирование признаков распознавания движущихся объектов в существующих системах цифровой обработки видеоинформации......24

1.4 Выводы и постановка задачи исследования...............................................41

2 МОДЕЛИРОВАНИЕ ОСНОВНЫХ ПРОЦЕССОВ ДЛЯ ВЫДЕЛЕНИЯ ИНФОРМАТИВНЫХ ПРИЗНАКОВ ДЛЯ РАСПОЗНАВАНИЯ, ИДЕНТИФИКАЦИИ И ОТСЛЕЖИВАНИЯ ДВИЖУЩИХСЯ ЛЮДЕЙ ПО ОСОБЕННОСТЯМ ИХ ПОХОДКИ............................................................................44

2.1 Построение системной модели выделения прямых и косвенных биометрических признаков (основных и дополнительных) движения людей в пространственно-временном базисе............................................................................46

2.2 Динамические модели состояний и наблюдений для анализируемой текущей видеопоследовательности.............................................................................48

2.3 Отображение системной модели в операторных уравнениях. Этапы динамического выделения признаков и формирования рабочего словаря.............50

2.4 Предварительная обработка видеоинформации для выделения информативных признаков походки человека...........................................................52

2.5 Выводы ко 2-й главе......................................................................................69

3 Разработка метода формирования рабочего словаря прямых (основных) и косвенных (дополнительных) признаков для разложения описания алфавита классов и эталонов людей по особенностям их походки..........................................71

3.1 Выбор и обоснование модели сегментации переднего плана..................72

3.2 Математические субмодели элементов отслеживания траекторий движения человека, как вложений его эллипсной модели........................................77

3.3 Формирование косвенных и гибридных информативных признаков движения человека.........................................................................................................92

3.4 Применение преобразования Фурье для получения значений прямых и косвенных признаков рабочего словаря......................................................................99

3.5 Выводы к третьей главе..............................................................................102

4 ПОСТРОЕНИЕ ФУНКЦИОНАЛЬНО-СТРУКТУРНОЙ ОРГАНИЗАЦИИ (ФСО) СИСТЕМЫ РАСПОЗНАВАНИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ (ДВИЖУЩИХСЯ ЛЮДЕЙ) ПО БИОМЕТРИЧЕСКИМ ПРИЗНАКАМ ПОХОДКИ. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ.................................104

4.1 Функциональная и структурная организация системы распознавания движущихся людей по биометрическим характеристикам походки.....................105

4.2 Алгоритмическая организация системы распознавания...................116

4.3 Экспериментальные исследования работоспособности алгоритмов функционирования системы распознавания.............................................................123

4.4 Выводы к 4 главе...................................................................126

ЗАКЛЮЧЕНИЕ..................................................................................................128

СПИСОК ЛИТЕРАТУРЫ.................................................................................130

ПЕРЕЧЕНЬ СОКРАЩЕНИЙ

БПФ - блок Фурье-преобразования;

ДЗУ - динамическое запоминающее устройство;

ДСКП - динамическая субмодель селекции косвенных признаков;

ДСН - динамическая субмодель наблюдений;

ДСПП - динамическая субмодель выделения прямых признаков;

ДСС - динамическая субмодель состояний;

ДСТ - динамическая субмодель отслеживания траекторий;

СКО - среднее квадратичное отклонение;

ФСО - функционально-структурная организация.

ВВЕДЕНИЕ

Актуальность работы. Широкое развитие и выделение информационных технологий в различных отраслях народного хозяйства Российской Федерации, в сервисных службах, силовых и оборонных ведомствах в настоящее время способствует созданию единой системы информационного мониторинга для своевременного контроля и управления технологическими, сервисными, охранными и другими целенаправленными процессами.

Важнейшим направлением является построение и использование видеоинформационного мониторинга, как наиболее содержательного и доступного в организации, доставляющего до 80% всей оперативной и технологической информации пользователям соответствующего уровня.

Одним из факторов в создании видеоинформационного потока данных, формируемого оптико-электронными и программно-аппаратными средствами видеомониторинга, является распознавание и анализ движущихся объектов, обработка информации, отображаемой в кадрах видеоизображений, представленных в аналоговом и цифровом видах в зависимости от типа и назначения видеодатчиков (аналоговых и цифровых видеокамер).

Обычно при распознавании (классификации) движущихся объектов решаются следующие задачи: определение самого факта движения; выделение анализируемого движущегося объекта на фоне стационарного или движущегося фона; определение (классификация) типа движущегося объекта (человека, животного, птицы, транспортного средства и т.д.); распознавание конкретного образа движущегося объекта, например, лица (портрета) человека.

При этом опознание конкретного человека, в основном, осуществляется путем сравнения эталона (портрета, видеоизображения) с видеоизображениями человека (текущим видеокадром) или его отдельными чертами (например, изображение радужной оболочки глаза).

Анализ известных приемов, методов и средств распознавания и идентификации людей по их портретному сходству показал их недостаточную эффективность в целом ряде случаев, а именно при преднамеренном сокрытии (например, с помощью маски) или искажении лица, его отдельных черт (использованием грима, искусственным преобразованием путем использования сторонних предметов); при неудачном ракурсе наблюдения движущегося человека; при значительном расстоянии между человеком и видеодатчиком; при недостаточном освещении анализируемого объекта.

В связи с этим представляется целесообразным поиск, обоснование и использование особенностей, свойств новых информационных признаков, позволяющих повысить качество распознавания движущихся людей.

Разработке методов обнаружения и сопровождения движущихся объектов, обработки изображений и управления объектами и целенаправленными процессами (например, пожаро-охранными) посвящен целый ряд фундаментальных исследований Алпатова Б.А., Атакищева О.И., Башмакова O.E., Быкова P.E., Гуревича С.Б., Дуды Р., Харта П. и др. Методы цифровой обработки изображений рассматривались в работах Гонсалеса Р., Лукьяницы A.A., Титова B.C., Филиста С.А. Вопросы, посвященные передаче видеоданных, исследовались в работах Зубарева Ю.Б., Согдулаева Ю.С. и др. Методы распознавания статических и динамических образов на основе пространственно-временного анализа видеоизображений освещались в работах Фаворской М.Н., Сойфера В.А., Фисенко В.Т., Форсайта Д., Ключикова И.А. и др. Вместе с тем, вопросы распознавания движущихся людей (динамических образов) в различных ситуациях и в условиях меняющихся факторов (наличие помех, неоднородности освещения, изменение ракурса и т.д.) остаются нерешенными.

Одним из перспективных направлений распознавания и идентификации образов движущихся людей является биометрия, то есть технология, использующая физиологические или поведенческие особенности, способные

выступать в качестве признаков при распознавании и идентификации образов людей, находящихся в движении (то есть идущих пешком или бегущих отдельно или в толпе).

Анализ многочисленных, в основном зарубежных, публикаций в области биометрии позволяет утверждать, что различными авторами исследована такая биометрическая характеристика, как походка человека, описаны методы ее идентификации как полезного, а часто и незаменимого признака в общем словаре признаков, используемых при распознавании образов движущихся людей. В результате этого анализа также установлено, что ряд вопросов, таких как формирование эталонов с включением признака - особенностей (свойств) походки индивидуума, коррекция этих эталонов в процессе обучения системы распознавания образов, а также - оптимизация текущих описаний конкретных движущихся людей для их последующего сравнения с эталонами рассмотрены и исследованы недостаточно для различных форм представления походки человека.

Таким образом, сложилось противоречие между необходимостью повышать достоверность и оперативность (быстродействие) распознавания движущихся людей в различных условиях внешней среды и ограниченными возможностями существующих методов и средств соответствующего назначения. Из-за многочисленных приемов описания походки движущегося человека неоднозначны пути и способы соответствующих эталонных описаний и текущих описаний походки конкретного человека. При этом оба типа описаний (представлений) и последующие процедуры распознавания и идентификации движущихся объектов должны опираться на теоретически и экспериментально исследованный и обоснованно выбранный словарь признаков и алфавит классов соответственно для походки и других биометрических характеристик с близкими (схожими) свойствами.

В этой связи актуальной научно-технической задачей является повышение достоверности и быстродействия распознавания и идентификации

движущихся людей путем разработки метода и моделей обработки сложноформализуемых видеоданных (видеоизображений) в части оптимизации текущих описаний движущегося человека на основе косвенных биометрических признаков (походка), повышение достоверности формирования эталонных описаний объекта по этим признакам.

Целью работы является разработка моделей, метода и алгоритмов обработки сложноструктурируемых видеоданных на основе использования косвенных биометрических признаков движения человека для повышения качества распознавания и идентификации конкретных людей (движущихся объектов).

В соответствии с поставленной целью научно-техническая задача диссертационной работы декомпозирована на следующие частные задачи:

1. Анализ результатов современных исследований (на основе отечественных и зарубежных публикаций монографий, методик, статей и докладов) в области автоматического и автоматизированного процессов селекции видеоданных (видеоизображений) по косвенным биометрическим признакам движения, определение существующих ограничений известных приемов и методов распознавания и идентификации движущегося человека, обоснование направлений исследований.

2. Разработка системной модели выделения косвенных признаков движущихся конкретных людей, формирование рабочего словаря признаков единой или гибридной физической природы.

3. Разработка метода и программно-ориентированных алгоритмов формирования текущих описаний, эталонов и классов движущихся людей на основе использования словаря и алфавита для косвенных признаков движения.

4. Создание функционально-структурной организации системы распознавания движущихся людей по косвенным биометрическим признакам.

Объект исследований - автоматические и автоматизированные системы распознавания и идентификации движущихся людей в общем комплексе видеоинформационного мониторинга.

Предмет исследований - методы и алгоритмы селекции и цифровой обработки видеоданных, использующие косвенные признаки движущихся людей для их выделения из общего фона, распознавания и идентификации в реальном масштабе времени.

Методы исследования. Для решения поставленных в работе задач использовались методы и приемы цифровой обработки и анализа видеоинформации, методы системного анализа, принципы построения систем видеомониторинга, теория систем, теория распознавания образов, теория множеств и математической логики, методики грамматического описания и анализа видеосцен, теория сигналов, теория обнаружения и выделения сигналов.

Новыми научными результатами и положениями, выносимыми на защиту, являются:

1. Системная модель выделения косвенных биометрических признаков движущихся конкретных людей, отличительной особенностью которых является представление этих признаков в пространственно-частотном базисе, оптимизирующих текущие и эталонные описания движущихся объектов.

2. Метод формирования рабочего словаря, объединяющего косвенные и гибридные признаки для текущего и эталонного описания движущихся экземпляров людей, отличием которого является использование признаков частотного (спектрального) разложения вспомогательных траекторий движущихся частей тела идущего человека.

3. Программно-ориентированные алгоритмы:

- формирования рабочего словаря признаков косвенного и гибридного видов для текущих и эталонных описаний движущихся людей;

- формирования эталонных описаний (экземпляров людей) на основе пространственно-частотного представления косвенных признаков в составе рабочего словаря;

- распознавания и идентификации движущихся людей с использованием гибридного словаря и приемов обучения с целью динамического уточнения алфавита классов в процессе функционирования системы распознавания.

4. Функционально-структурная организация системы распознавания движущихся людей, отличающаяся наличием элементов и связей формирования рабочих гибридных словарей косвенных признаков, представленных в пространственно-временном базисе.

Практическая ценность и внедрение результатов работы

Практическая ценность работы состоит в следующем.

Разработка моделей формирования рабочего словаря из косвенных и гибридных информативных признаков, текущих и эталонных описаний экземпляров движущихся людей (объектов), положеных в основу функционирования автоматических распознающих систем в составе комплексов видеоинформационного мониторинга (видеонаблюдения, регистрации высокоинформативных видеоданных, охранного телевидения и т.д.), функционирующих в реальном масштабе времени.

Программно-ориентированные алгоритмы поэкземплярного распознавания и идентификации образов движущихся людей с применением биометрических косвенных и гибридных описаний, оптимизирующие локальные процессы функционирования распознающей системы с требуемой технической эффективностью внедрены в ФГУП «18 ЦНИИ» МО РФ, г. Курск и используются в учебном процессе Юго-Западного государственного университета, что подтверждено соответствующими актами.

Соответствие диссертации паспорту научной специальности

Диссертация соответствует паспорту специальности 05.13.01 - Системный анализ, управление и обработка информации: п. 4 «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации», п. 5 «Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», а также п. 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации».

Апробация работы. Основные научные и практические результаты диссертационного исследования докладывались и получили положительную оценку на международных и российских научных конференциях: «Перспективы развития информационных технологий» (г. Новосибирск, 2011 г.), «Медико-экологические информационные технологии» (г. Курск, 2011 г.), «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации «Распознавание - 2012» (г. Курск, 2012 г.), «Тенденции и инновации современной науки» (г. Краснодар, 2013 г.), «Актуальные задачи математического моделирования и информационных технологий» (г. Сочи, 2013 г.), а также на научно-технических семинарах кафедры «Биомедицинская инженерия» с 2011 по 2013 гг.

Публикации. Основные результаты диссертации отражены в 10 научных работах, из них 4 статьи, опубликованные в ведущих рецензируемых научных журналах.

Личный вклад автора. Все выносимые на защиту результаты получены лично автором. В работах, опубликованных в соавторстве и приведенных в списке литературы, соискателем лично предложены: в [28] и [29] анализ результатов современных исследований в области автоматического и автоматизированного процессов селек�