автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Алгоритмы распознавания трехмерных объектов по эталонным двумерным проекциям

кандидата технических наук
Тант Зин Пьо
город
Москва
год
2014
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Алгоритмы распознавания трехмерных объектов по эталонным двумерным проекциям»

Автореферат диссертации по теме "Алгоритмы распознавания трехмерных объектов по эталонным двумерным проекциям"

На правах рукописи

ТАНТ ЗИН ПЬО

АЛГОРИТМЫ РАСПОЗНАВАНИЯ ТРЕХМЕРНЫХ ОБЪЕКТОВ ПО ЭТАЛОННЫМ ДВУМЕРНЫМ ПРОЕКЦИЯМ

Специальность 05.13.01. Системный анализ, управление и обработка информации (в приборостроении)

2 0 НОЯ 2014

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Москва, 2014 005555545

005555545

Работа выполнена на кафедре «Вычислительная техника» в Национальном исследовательском университете «МИЭТ».

Научный руководитель - кандидат технических наук, доцент

Кочетков Михаил Петрович

доктор технических наук, профессор кафедры «Радиоэлектроника» Тульского государственного университета

Минаков Евгений Иванович

кандидат технических наук, доцент, директор ООО «РАДИС-РЛ»

Федоров Алексей Роальдович

Ведущее предприятие - ОАО НПЦ «Электронные вычислительно-

информационные системы» г. Москва

Официальные оппоненты

Защита состоится « // » сЗвк^гх^/г^ 2014 г. часов на

заседании диссертационного совета Д212.134.02 в Национальном исследовательском университете «МИЭТ».

124498, Москва, Зеленоград, проезд 4806, МИЭТ.

С диссертацией можно ознакомиться в библиотеке МИЭТ и на сайте www.miee.ru.

Автореферат разослан " " _2014 года.

Ученый секретарь дирсертационного совета

д.т.н., доцент Гуреев А.В.

Общая характеристика работы

Актуальность темы. Системы технического зрения (СТЗ) предназначены для выполнений обработки и анализа двумерных изображений и трехмерных сцен. Эта область информационной техники в настоящее время быстро развивается, и соответствующие системы находят широкое применение в промышленности, На транспорте, в военном деле и сельском хозяйстве ргрвитых страц мира.

СТЗ также используются в системах контроля государственной границы, мониторинга протяжейных объектов (нефте- и газопроводов, морского побережья, национальных заповедников), труднодоступных горных районов, мест техногенных аварий и экологических катастроф.

Важной функцией подобных систем, определяющихся их целевым назначением, является распознание изображений трехмерных объектов, которое, как правило, выполняется в условиях существенной неоднозначности, что затрудняет последующий анализ и прогнозирование возникающих ситуаций.

Первые работы исследователей из США и Японии по обработке изображений и распознаванию объектой были опубликованы в конце 70-х годов прошлого века. Позже аналогичные работы стали появляться и в России: в Москве (МГУ, МФТИ), С-Петербурге (СПбГУ, ГУАП), Самаре (СГАУ), Рязани (РГРУ), Новосибирске (НГУ), Томске (ТГПУ) и других городах. Особый вклад принадлежит выдающимся российским ученым: Ю.И. Журавлеву, В.А. Сойферу, Н.Г. Загоруйко, JI.M. Местецкому, Б.А.Алпатову и другим. Широко известны работы таких зарубежных учёных, как Rosenfeld А., Roberts L.G., Winston Р.Н., Waltz D., Hunt E.B., Hueckel M.H., Lloyd J.M. и других.

Следует отметить, что разработанные методы обработки информации для СТЗ эффективны лишь для отдельных достаточно несложных объектов, примерами служат многогранники, человеческие лица, печатные или рукописные символы, номера автомобилей. Причем идентифицируемые объекты должны наблюдаться в достаточно детерминированных условиях (определённое освещение, фон и положение объекта относительно камеры).

Перечисленные условия, как правило, не соблюдаются для СТЗ роботизированных комплексов (PK), функционирующих на заранее неподготовленной местности. Проектирование СТЗ для перспективных PK предполагает решение целого ряда нЬвых сложных задач, которые не имели место для промышленных роботов, функционирующих в пределах заводских помещений.

Следует также отметить, в США, Японии и' странах Западной Европы развернуты и интенсивно ведутся исследования цо разработке РК, которые могут использоваться для ликвидации последствий экологических и техногенных катастроф, обезвреживания подозрительных предметов в местах массового скопления людей, а также для других ситуавд^, представляющих угрозу для здоровья и жизни человека. Существующие в РФ й за рубежом РК в основном предназначены для выполнения работы в достаточно ограниченных условиях внешней среды. Во многих ситуациях применение РК отличается высокой степенью неопределенностью окружающей среды.

Для повыщения эффективности перспективных РК необходимо увеличивать степень их автономности. Проблема состоит в оперативной идентификации окружающей среда для обеспечения устойчивого функционирования РК при возникновении нештатных ситуаций и нарушениях связи с Диспетчерский пунктом.

В связи с перечислениями обстоятельствами разработка новых алгоритмов распознавания трехмерных объектов, Определяемых целевым назначением РК и обеспечивающих их эффективное функционирование в условиях недостаточно определенной внешней среды, представляется актуальной научно-технической проблемой при проектировании современных СТЗ.

Цель работы и задачи исследования. Диссертационная работа посвящена вопроса^! повышения эффективности распознавания трехмерных объектов по их двумерным проекциям в условиях изменения условий наблюдения за счет применения передовых алгоритмов и моделей обработки изображений.

Для достижения поставленной цели в работе решаются следующие основные задачи:

1. Исследование современных методов и Моделей обработки изображений для идентификации трехмерных объектов внешней среды в усл<3виях недостаточно определенной информации.

2. Разработка алгоритма распознавания трехмерных объектов по их эталонным двумерный проекциям.

3. Разработка алгоритма идентификации параметров внешних факторов, искажающих изображения, для учета их действия в алгоритме распознавания.

4. Создание компьютерной додели распознавания трехмерных объектов и проведение компьютерного эксперимента для различных условий внешней среды.

Объект и предмет исследования. Объектом исследования является система технического зрения, функционирующая в недостаточно определенных условиях.

Предмет исследования составляет алгоритм распознавания изображений трехмерных объектов по их эталонным двумерным проекциям в условиях воздействия помех и изменения фактора освещенности.

Методы исследования. При выполнении диссертационной работы исполЬзЬвались: теория вероятностей, математическая статистика, теории принятия решений и распознавания образов, методы математического моделирования динамических систем, а также специальные разделы алгебры и геометрии.

Исследование работоспособности разрабатываемых алгоритмов проводилось посредством компьютерного моделирования с использованием математического пакета прикладных программ МаИаЬ.

Научная новизна.

1. Разработан алгоритм статистического распознавания трехмерных объектов на местности по эталонным изображениям их двумерных проекций, полученных на этапе обучения и хранящихся в базе данных, который предназначен для применения в условиях изменения фактора освещенности и воздействия помех, искажающих входные изображения, поступающие от телекамер системы технического зрения.

2. Установлены формульные зависимости, позволяющие определить неизвестные параметры функции правдоподобия гйпотез относительно классов распознаваемых объектов при недостаточно определённых факторах внешней среды.

3. Создана методика обучения системы распознавания человеком-оператором, рлужащая для установления соответствия между наблюдаемыми изображениями объектов и представителями юс классов, предварительно размещенных в базе данных компьютера.

Положения, выносимые на защиту.

1. Алгоритм статистического распознавания трехмерных объектов на местностк по эталонным изображениям их двумерных проекций, полученных на этапе обучения и хранящихся в базе данных, который предназначен для применения в условиях изменения фактора освещенности и воздействия помех, искажающих входные изображения, поступающие от телекамер системы технического зрения. '

2. Формульные зависимости, позволяющие определить неизвестные параметры функций правдоподобия гипотез относительно классов распознаваемых объектов при недостаточно определенных факторах внешней среды.

3. Упрощенные формулы для представления входных изображений СТЗ и факторов, вносящих искажения в изображения распознаваемых объектов, для реализации их на компьютерах ограниченней производктельности.

4. Методика обучения системы распознавания человеком-оператором, служащая для установления соответствия между наблюдаемыми изображениями объектов и представителями их классов, предварительно размещенных в базе данных компьютера.

Практическая значимость. Представленные результаты исследований могут быть использованы при разработке моделей внешней среды, создании алгоритмов распознавания различных трехмерных объектов по их эталонным двумерным Проекциям для СТЗ, осуществляющих мониторинг местности в недостаточно определенных условиях.

Внедрение результатов. Результаты диссертационной работы используются на кафедре вычислительной техники МИЭТ при проведенйи практических занятий По курсу «Моделирование информациойно-управляющих систем».

Степень. достоверности. Полученные экспериментальные результаты й разработанная методика согласуются с известными теоретическими моделями, в определённой своей части имеют прямое подтверждение в опубликованных отечественных работах, а также находят косвенное подтверждение в результатах зарубежных экспериментальных и теоретических работах. Опубликованные результаты согласуются и дополняют экспериментальные результаты других авторов.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на Всероссийских межвузовских научно-технических конференциях студентов и аспирантов «Микроэлектроника и информатика» - 2010, 2011, 2012, 2013, МИЭТ; Всероссийской Межвузовской научно-практической конференций студентов и аспирантов «Актуальнее проблемы информатизации в науке, образовании и экономике» - 2011, 2012, МИЭТ; Международной научной заочной конференции «Актуальные вопросы современной техники и технологии» - 2011, Липецк; Международной телекоммуникационной конференции молодых ученых и студентов «МОЛОДЕЖЬ И НАУКА».

НИЯУ МИФИ -2013; Международной научно-технической конференции студентов, аспирантов и молодых ученых по про1-рамме «У.М.Н.И.К.» -Пенза, 2013.

Публикации. Основные результаты исследования, проведенного соискателем, изложены в 19 печатных источниках, опубликованных в российских изданиях, из них 4 статьи в журналах, рекомендованных ВАК России.

Структура и объём диссертационной работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы из 79 наименований. Диссертация изложена на 121 страницах, содержит одну таблицу и 8 рисунков.

Содержание рабрты

Во введении обоснована актуальность работы, показана степень разработанности темы диссертации, сформулировайы цель и задачи исследования, указаны теоретическая и практическая значимость работы, ее научная новизна, перечислены основные положения, выносимые на защиту, представлены сведения об апробации рабрты, достоверности полученных результатов, объеме и структуре диссертации.

В первой главе показано, что современный эт^п развития научно-технического прогресса характеризуется возрастающим применением СТЗ, как в количественном отношении, так и в расширении областей, в которых они' выполняют те или иные операции. Использование СТЗ не только приносит когпфетный технико-экономический эффект, связанный с повышением производительности труда и качества продукции, но и является важным средством решения социальных проблем, позволяя исключить присутствие людей в опасных средах, заменив их частично или полностью роботизированными комплексами, решающими задачи обнаружения и распознавания различных объектов.

Роботизированные комплексы, оснащенные СТЗ, применяются преимущественно в экстремальных условиях, когда люди не могут находиться на определенных территория* или если их пребывание там сопряжено с риском для жизни. Кроме того, в условиях повышенной опасности человек начинает совершать ошибки, снижается его работоспособность и эффективность действий. Й настоящее время в большинстве случаев управление техническими средствами РК осущертвляет человек-оператор на уровне движений, при этом от человека требуется непрерывное наблюдение за РК и оперативное управление его действиями. Такой подход определяется неспособностью РК принимать самостоятельные решения и имеет ряд недостатков. К ним

можно отнести необходимость организации и постоянной поддержки канала связи с оператором, что существенно ограничивает область применения РК. При выполнении технологических операций оператор, получая от системы технического зрения информацию об объекте и процессе выполняемых работ, непрерывно осуществляет ручное управление исполнительными механизмами манипулятора и транспортного средства.

Сложный процесс управления в сочетании с характером выполняемых работ, требующих повышенного внимания и осторожности, приводит к быстрой утомляемости оператора и, как следствие, увеличению вероятности ошибочных действий. Кроме того, человек не всегда может Правильно оценить окружающую среду по данным телеметрии и осуществить адекватное управление. Указанных недостатков можно избежать, если управление со стороны человека-оператора будет проводиться не на уровне задания отдельных движений, а на уровне постановки цели. В этом случае РК должен самостоятельно (или при минимальном участии человека) выполнять поставленные задачи

В современных робототехнических системах наиболее предпочтительной является многоуровневая иерархическая структура управления. Как правило, функции верхних уровней должен брать на себя человек-оператор. Нижний уровень управляющей системы физически может быть реализован непосредственно в силовых блоках исполнительных устройств, другие уровни обычно строятся на базе универсальных или специализированных процессорах. Перспективные системы управления, реагирующие на внешние воздействия, должны превратить РК, действующие чисто механически, в машины, обладающие способностью к адаптации, умеющие самостоятельно реагировать на изменения окружающей среды и Принимать требуемые решения.

Развитие РК, Предназначенных для выполнения работ в недостаточно определенной внешней среде, все активнее выдвигает требование по их оснащению СТЗ. Подобные системы должны обеспечить систему управления РК информацией о текущей ситуации во внешней среде, включающей следующие основные сведения: наличие, тип, параметры, местоположение и ориента!щю объектов манипулирования (воздействия); корректность, и качество выполнения РК технологических операций и/или других действий; существования препятствий, путей их обхода и т.д,

Достижения в р^витии аппаратных средств сбора и ввода визуальной информации в комгуьщтер позволяют ставить и решать сложные задачи по ее фашинной Обработке, которая заключается в

получении изображения рабочей сцены и формировании последующего ее описания. Полученное описание должно, с одной стороны, содержать существенную информацию о рабочей сцене, а с другбй - допускать ее получение за ограниченное время, управление РК в реальном масштабе времени.

При этом можно выделить ряд этапов, типичных для СТЗ РК различного назначения, к ним относятся: ввод (восприятие) информации, т. е. получение изображения рабочей сцены с помощью датчиков; предварительная обработка изображения, в том числе подавление шума и устранение искажений; выделение локальных особенностей на изображении; сегментация, т. е. выделение на изображении одного или нескольких представляющих интерес объектов сиены; распознавание или идентификация объекта, т. е. установление его принадлежности к некоторому классу объектов; анализ (интерпретация) полученной информации с точки зрения задач функционирования робота.

В соответствии с тем, какие этапы преобразования информации реализуются в конкретной системе, ее можно отнести к СТЗ высокого, среднего или низкого уровня. Задачи, решаемые СТЗ низкого уровня! ограничиваются восприятием й предварительной обработкой информации. Алгоритмы, используемые в СТЗ низкого и среднего уровня, основаны на традиционных подходах к обработке информации и разработаны достаточно хороЩо, в то время как алгоритмы СТЗ высокого уровня разработаны в значительно меньшей степени требуют дальнейшей проработки.

Ёопросам распознавания изображений для СТЗ промышленных роботов посвящено большое количество 'работ, представляющих разнообразные достижения в этой области. Большинство математических методов распознавания образов разделяется на две группы, одну из которых можно трактовать с позиций теории решений (Дискриминантный подход), а другую - в рамках синтаксического (или структурного) подхода. Значительно меньше публикаций уделено проблеме распознавания изображений для СТЗ РК, действующих вне заводских помещений в реальной динамической среде с высокой степенью неопределенностью.

Алгоритмы идентификации окружающей среды основаны на использовании теории распознавания образов трехмерных объектов, которая в настоящее время разработана в недостаточной мере. Качество распознавания таюке зависит от эффективности множества предшествующих процессов, начиная от процесса ввода изображения и заканчивая формированием признаков объекта. Наиболее важной задачей при распознавании трехмерных объектов в сложных условиях является

задача описания свойств объекта —дескрипторов.

Во второй главе рассматриваются вопросы совершенствования методов и моделей обработки изображений трехмерных объектов для СТЗ РК. Формирование изображения СТЗ в достаточно общем случае можно представить в виде модели линейной динамической системы:

/• ОО р со

F(x,y)= I Ux, у,х0,у0) С(хй, у0)dxady0,

J— СО -' — со

где весовая функция h определяет зависимость между распределениями энергии, излучаемой в окрестности некоторой точки объекта (х0,у0), и точки (х, у) ее изображения.

В том случае, когда функция h инвариантна к сдвигу в плоскости объекта уравнение модели линейной динамической системы приобретает вид:

I* СО <• ОО

Нх- хо>У ~ У о) C(x0,y0)dx0dyQ.

I J — ОО J — OO

В условиях большой статистической неопределенности внешней среды, в которой приходится функционировать РК, невозможно получить адекватные детерминированные зависимости для функций G(x0,y0) и Н.х - х0,у - у0). Возникает необходимость статистического представления F(x,y) в виде реализаций многомерных массивов случайных величин с заданными вероятностными характеристиками -случайных полей. В общем случае случайной поле задается в узлах п-мерной сетки:

^ = С/а- -J'n): Л = 1 ,Mk,k= ТТТг}.

В зависимости от физической природы значений отсчетов дискретные случайные поля могут быть скалярными (яркость монохроматического изображения) или векторными (цветные изображения, поле смещений). Если обозначить через Xj значение отсчета случайного поля в узде (пикселе) /, то случайное поле представляет совокупность этих значений на сетке: X = [xf- j е Л}.

На практике для случайных полей стараются использовать статистическое описание подрбное случайным процессам, подразумевая вместо одной переменной t совокупность параметров Q. В частности, на случайное поле обобщаются n-мерная плотность вероятности:

,v = 1,...,n}.

Важно отметить, чтр по своему строению случайные поля значительно сложнее случайных процессов. Во-первых, реализации случайных полей являются функциями нескольких переменных, теория

которых принципиально сложнее теории функций одной переменной. Во-вторых, значительно усложняется понятие марковости.

Для марковских последовательностей временной интервал может быть разбит любой точкой I на множества: условно Независимые прошлое Г~ = {хк: к < 0 и будущее Г+ = {хк\к > (].

Свойство марковости состоит в том, что дДя любого множества Г (из некоторого класса множеств) случайные функции, входйщйе в Г~, условно независимы от случайных функций, входящих в Г+, при известных Г. Если в качестве Г брать строки двумерной сетки, то поле X можно представить формирующимся построчно. Дальнейшее развитие этого подхода позволяет обобщить модели временных случайных последовательностей, в которых значение ряда в данный момент времени линеййо зависят от предыдущих значений (авторегрессионные модели) на случайкые поля.

Предположим, что полученная последовательность является марковской порядка б, т.е. распределение плотности вероятности любого хт относительно всех предшествующих ему элементов зависит только от неко+орого конечного отрезка: Гх = {хг: (Г) - 5 < {]) < (Г)}. Множество Гг будем называть глобальным состояни'ем. В двумерном случае при пилообразной развертке оно включает в себя несколько последних строк матрицы. Следовательно, можно представить хх как функцию элементов глобального состояния Г: и возмущения (т:

Полученное выражение представляет авторегрессионную модель случайного поля, Однако использовать ее для представления полей на сетках больших размеров достаточно сложно, в виду большого числа аргументов функции <рх. Преодолеть эту трудность позволяет следующее обстоятельство. Плотность распределения вероятности часто зависит не от всего глобального состояния Гг, а только от некоторой его части 1Т -локального состояния, и включающего в себя только достаточно близкие к хх элементы поля, не упреждающие хт относительно данной развертки. В результате поле X может быть представлено авторегрессионной моделью:

которая во многих случая?: может быть приемлема для решения прикладных задач СТЗ РК. Возможно также ввести ряд условий и получить ряд упрощенных статистических моделей, которые могут быть рекомендованы для приближенного представления изображений при разработке процедур идентификации объектов в зоне видимости СТЗ РК. В частности, . моделью изображения могут служить реализации

двумерного марковского процесса перрого порядка. Автоковариационная функция такого процесса имеет вид:

где К, ос и т - масштабирующие множители. Во многих случаях делается упрощающее предположение, что ¿втоковариационная функция марковского процесса может быть представлена в виде:

Кх,у{тх,ту)=КЬх р{- ai\rx\- ау\ту\\

Для практического использование предлагаемых моделей следует определить числовые значения их параметров путем проведения экспериментальных исследований на конкретных аппаратных средствах СТЗ в типовых условиях применения РК.

Главная задача СТЗ РК - это распознавание изображений, т.е. определение соответствия между полученными изображениями реальных объектов и эталонными изображениями. Отличие эталонных и реальных изображений объектов обусловлено ошибками сегментации, геометрическими и яркостными преобразованиями^ а также с различными условиями их записи в память СТЗ. Системы координат, в которых они записываются, отличаются друг от друга ориентацией, выбором масштаба на осях, смещением (несовпадением начала координат), изменением освещенности или контраста и рядом более сложных трансформаций.

В рассматриваемых формульных зависимостях эталонное и реальное изображения представляются финитными функциями двух переменных в прямоугольной области D, являющейся непрерывной моделью дискретного поля зрения. Следует отметить, что реальное изображение В(х,у) и эталонное Ва(х,у) определены це по всей области D, а только в области Е с D выделенного объекта, однако удобно доопределить В(х,у) и Вй(х,у) нулевым значением в точках (х,у) £ Е. В общем виде реальное изображение является результатЬм воздействия на эталонное изображение некоторого преобразования ср в некоторый момент времени: В (л: у) =

Реальное теоретическое и практическое значение имеет изучение математических моделей, соответствующих частному виду преобразований:

В(х,у) = K(x,y)BQ [Т(х, y)j + г(х,у), где К(х,у) - нелинейная функция мультипликативных искажений яркости; г{х,у) - аддитйвные изменен^ фона, включая случайные помехи; Т(х,у) - оператор геометрического преобразования изображения объекта. Если К(х,у) = к, г(х,у) = О, Т - тождествённый оператор (ТОс.у) = (х,у)),

то рассматриваемое преобразование характеризует изменение освещенности объекта по сравнению с освещенностью

эталона. Коэффициент к показывает изменение освещенности или уровня общей чувствительности телевизионного датчика по сравнению с моментом первоначального обнаружения эталона. В более общем случае К(х,у) - функция изменения чувствительности датчика по полю зрения, функция неоднородности светофильтра и т.д. Функция г(х,у) характеризует изменение контрастности. В диссертации проведена конкретизация оператора Т(х,у), важнейшими видами которого являются смещения, изменения масштаба и п0вороты изображения. На практике такие преобразования соответствуют формированию новых изображений объектов на основании ограниченного множества эталонов, хранящихся в памяти бортового компьютера.

На рсновании рассмотренных моделей формализована задача распознавания объектов. Пусть задано множество X из Ь > 1 полутоновых эталонных изображений: X = {Х1, ...,Х[}, Х1 = Цх^Л, где I -номер изображения, I = 1, 1\ С/, V - соответственно длина изображения по вертикали и горизонтали, и = 1,11; V = 1, V; е {ОД, ...,хтах} -интенсивность точки изображения с координатами (и, у); хтах -максимальное значение интенсивности. Предполагается, что X разбивается на Я непересекающихся классов Хг, г= 1, Я: Х= 11?=1ХГ; Х„ П X,- = 0 приФ Т2', Каждый класс Хт с X отличается тем, что принадлежащие ему объекты обладают некоторой общностью или сходством характеристик, т.е. определяют некоторый образ. Любое изображение е X относится к одному из классов, т.е.: (VI) (Зг) Хх е Хг. Любому классу Хг присвоен номер с(г) е {ОД,..., Д}, где Я - количество различных классов.

Необходимо: сформировать классы Хг, г = 1, Д. на основе множества Х\ отнести новое изображение X - ||хи„|| к одному из Я классов, т.е. выяснить, какой класс ближе к нему на основе введенной меры сходства (расстояния между объектами).

Проанализированы различные функции, оценивающие сходство реального и эталонного изображений. Применительно к СТЗ РК в качестве классов изображений (эталонов) предлагается рассматривать силуэты типовых объектов на наблюдаёмой сцене, положение и ориентация которых заранее не известны. При решении задачи распознавании объектов необходимо учитывать, что: изображения предъявляются на сложном случайном фоне; имеет место изменение освещенности; входные изображения отличаются заранее неизвестным положением в поле зрения. В силу перечисленных причин представляется целесообразным для распознавания объектов использовать методы статистической проверки гипотез. Теорема Байеса рассматривается при этом как логическая основа пересмотра суждений в зависимости от

действительно происходящих событий, т. е. обучения на базе опыта и, следовательно, оперативной корректировки возможных решений.

В ряде случаев априорная неопределенность относится только к параметрам функции распределения, тогда целью статистического обучения системы распознавания становится получение оценок этих параметров. Чтобы реализовать преимущества параметрического обучения необходимо обеспечить предварительное разделение наблюдаемых совокупностей на две группы: нормально распределенные и имеющие распределения, отличие от нормального. Для этого целесообразно предусмотреть процедуру предварительного анализа наблюдаемых совокупностей. Этот анализ может быть выполнен однократно, если вид закона распределения наблюдаемых совокупностей не изменяется во времени. Затем обработка наблюдений может производиться в завиЬицости от его результатов параметрическим или непараметрическим алгоритмом обучения.

В настоящее время для непараметрическОго оценивания, можно рекомендовать использовать: гистограммный метод, метод Парзена, метод разложения по базисным функциям, метод полигонов Смирнова,' метод локального оценивания по ¿-ближайшим соседям, а также ряд специальных методов нелинейного оценивания.

Если случайный (в общем случае р-мерный векторный) процесс, описывающий изменения выборочных значений во времени, является нестационарным, то указанный предварительный анализ следует периодически повторять. Для исключения потерь временц целесообразно выполнять его параллельно с проводимыми вначале параметрическим и непараметрическим обучением (если, конечно, для этого имеются соответствующие вычислительные возможности). Ненужная ветвь обучения немедленно отключается по результатам текущего предварительного анализа.

В третьей главе рассматриваются идентификация параметров внешней среды и распознавание трехмерных объектов по их изображениям. Окружающая среда, в которой приходится функционировать мобтьиым роботам, характеризуется высокой априорной неопределеннцстью. Для ее преодоления важно создать математические модели, позволяющие оценивать неизвестные параметры среды при воздействии различных случайных факторов. Компенсация помех и искажений на полученных изображениях может быть достигнута путем использования различных подходов, разработанных в математической статистике. Байесойский подход связан с предположением, что априорные распределения состояний случайных величин и функции потерь известны. Если априорные сведения

отсутствуют, то используют небайесовские методы принятия решений. К их числу относят критерий максимального правдоподобия, который имеет ряд важных преимуществ. Оценки, полученные этим методом состоятельны, распределены асимптотически нормально и имеют наименьшую дисперсию.

Входное изображение трехмерного объекта представляется его двумерной проекцией на плоскость наблюдения и подвергается искажению помехами. Типы и параметры помех могут варьироваться в зависимости от условий получения данных, в том числе, от состояния внешней среды, условий эксплуатации: АЦП, устройств регистрации и ряда других причин.

В самом общей случае математическая модель рассматриваемой гипотезы может быть представлена в виде ограниченной функции двух переменных, заданной на ограниченной прямоугольной области следующим образом:

Нрд: Б = ард ■ В^ + С,

где 5 матрица полутонового изображения, имеющая размерность I * У, / -количество строк, у - количество столбцов матрицы; ард - коэффициент,

учитывающий фактор освещенности объекта; В^ - матрица исходного неискаженного изображения, на котором наблюдается объект. Координаты объекта определяются координатами «центра тяжести» его изображения и принимаются равными (р,д). Объект располагается на горизонтальной поверхности и может наблюдаться датчиком информации под различными углами (ракурсами). В силу конечной разрешающей способности датчика, недостаточного объема исходной информации об объектах наблюдения, ограниченной производительности средств обработки количество различных проекций (ракурсов) объекта представляется конечным множеством и может быть пронумеровано: к = 1,2, ...М. С - матрица аддитивных помех, искажающих исходное изображение, каждый элемент которой дрд представляет значение шума в точке 0", _/'). Размерности матриц Вркд и С совпадают.

Кроме этого считаем, что в результате проведения сегментации на изображении выделены однородные области (сегменты). Обычно к сегментированным изображениям предъявляются требования, позволяющие обеспечить приемлемое качество решения задачи распознавания, а именно:

сегментируемые области должны быть однородны относительно некоторых характеристик (например, уровня серого тона или текстуры); - все области должны иметь простую топологию;

- соседние области должны обладать существенными различиями в значениях характеристик, по которым оценивается однородность сегментируемых объектов;

- границы сегментов должны иметь простую форму, не иметь разрывов и быть четкими.

Пусть на изображении в точке (р.д) находится трехмерный объект некоторого класса с заранее неизвестным ракурсом относительно датчика информации. Причем известны априорные вероятности гипотез появления различных проекций объекта:

Р(Н$), к = 1,2,...М.

Обозначим Я; событие, связанное с сопоставлением наблюдаемого объекта с /-м классом. Вероятность этого события при условии наблюдения к-ой проекции объекта запишем в виде:

Р{Я1\Н^),к= 1,2, ...М.

Вероятность события И, при условии, что объект может наблюдаться под любым из М ракурсов, можно рассчитать по формуле полной вероятности. Формула позволяет вычислить вероятность интересующего события /?; через условные вероятности этого события Р^Я^Н^д) в

предположении известных априорных вероятностей Р(Яр^) гипотез следующим образом:

и к=1

На практике часто считают, если нет других оснований, что

появление всех Мпроекций к = 1,2,... М равновероятно, то есть,

=

тогда по формуле полной вероятности имеем:

м

к=1

Для определения номера класса, с которым отождествляется наблюдаемый объект, поступаем следующим образом. Находим: Рк(Ю= тах{Р{Я0)Л= 1,2,... М.

I

Относим анализируемый объект классу, номер которого соответствует индексу максимальной вероятности, т.е. к.

Для упрощения решения задач статистического распознавания матрицу изображения можно трактовать как случайный вектор: 5 = ->57/, размерность которого N определяется произведением количество строк /на количество столбцов »/матрицы изображения.

Случайные вектора можно полностью охарактеризовать совместной функцией распределения вероятностей, которая определяется следующим образом:

^fOO = P{f 11 < ^11^12 < < sij}.

В рамках статистического подхода задача распознавания объектов сводится к оцениванию плотности распределения вероятностей p(s) случайного вектора 5.

Важные роли в статистической теории распознавания образов играют совместная плотность вероятности вектора и условная плотность вероятности вектора при фиксированном событии, которые соответственно равны:

p(s)= Ит < ?" < + Asu- -'s>} < bj < su + Asu)

^ii-^o AS11AS12...ASU

a s/J->O

PO|w) =-j----J-, V=IxJ.

Из многомерного статистического анализа известно, что если достоверное событие состоит из m независимых событий i = 1,2,..., m, то безусловная плотность вероятности вектора s имеет вид:

m

PO) = ^Гр(<?К)Р(а)к). к=1

Учитывая

этот факт, представим p(s) при равновероятных гипотезах в виде смеси плотностей распределения следующим образом:

k=l

где р(5|а)() - условная плотность распределения вектора з при гипотезе, что реальный объект представлен к-ой проекцией в точке (р,д).

В общем случае плотность вероятностей следует рассматривать как случайную функцию и искать наиболее вероятную ее реализацию. Однако в теории распознавания часто полагают, что векторы 5 принадлежат одному и тому же параметрическому семейству, статистически независимы и могут различаться лишь значениями параметров. Распространенной формой их представления является многомерный нормальный закон распределения, который характеризуется плотностью вероятности:

Р(!|н"3" апг*\кП"2"ехр0,5(5"га1В)Т''(5"т<4)1'

где т^- математическое ожидание случайного вектора б, когда объект представлен ¿-ой проекцией; ]| и К^ 1 соответственно

корреляционная матрица вектора 5, ее определитель и обратная корреляционная матрица вектора 5.

В случае некоррелированных координат вектора ^ выражение принимает вид:

р(5|<) = —

■ ехр ^ - 0,5

,00 п(«

п(к) п(к) М1 и17 ип

^12 "и

где ту1, Оу1 - элементы матриц математического ожидания М^ и дисперсии ,причем:

< = Ь[+ $.

где - элемент матрицы Вркд\ ^ - математическое ожидание величины шума, искажающего изображение объекта в точке (;,/). Полагая для всех точек изображения ц^ = йу^ = можно

представить в виде:

' 7 (50- - а^Ь™ - цЫ)2

Р3) Тег^Г ии

2й да

Используя полученное выражение, можно вычислить р(э) по формуле:

- мХ

IV 1 гтгт

ехр

(зу-а^ЬУ-^У

года

Для статистической оценки неизвестных параметров воспользуемся методом максимального правдоподобия. В качестве оценок определим те значения параметров к\ а(к) при которых результаты

наблюдаемых величин 512 ... б,] «наиболее вероятны».

Реализация метода связана с максимизацией функции при

фиксированных значениях наблюдаемых величин. Это, в свою очередь, равносильно нахождению корней уравнений:

¿010 0 ¿(яр

дцЮ ' дОЫ и' да(ю - и'

д(»0 =

При логарифмической форме функции правдоподобия переходим к уравнениям:

. аш{з\н<$) д(з\<>)

дцМ ' ' 30») ~ ' За« "

Если справедливо допущение о том, что изображения отдельных объектов не пересекаются и их размеры значительно меньше размеров фона, то оценки искомых параметров имеют следующий вид:

ТГоо =

/-У _

хит/и*}-и™)2 ¡■] _'

Случайные вектора можно полностью охарактеризовать совместной функцией распределения вероятностей, которая определяется следующим образом:

Представленный подход и полученные формульные зависимости позволяют:

- решить задачи распознавания трехмерных объектов, наблюдаемых под различными ракурсами в точках, отличных от тех, которые были использованы на этапе идентификации параметров статистической модели;

- рассчитать вероятности ошибок распознавания для заданных условий помех, искажающих информацию, и определить оптимальное соотношение «сигнал - шум», по превышению которого принимается решение о распознавании объектов.

В четвертой главе рассматриваются вопросы подготовки и проведения компьютерного эксперимента по использованию разработанных

методов идентификации параметров окружающей среды, представлены основные требования к компьютерной модели системы распознавания и исходные положения, используемые при ее проектировании.

Разработка модели системы распознавания носит итерационный характер и отображается блок-схемой, показанной на (рис. 1).

В силу большой априорной неопределенности внешней среды предложено проводить обучение системы распознавания на двух этапах:

первичное обучение на этапе проектирования; дополнительное обучение на этапе эксплуатации с целью распознавания новых объектов.

Для обучения системы распознавания СТЗ РК необходимо иметь обучающую выборку. Обучающая выборка представляет множество пар изображений: реальное искаженное изображение объекта и его изображение, полученное в некоторых заранее заданных и известных условиях. При этом предполагается, что классы идентифицируемых объектов определены заранее. По каждому классу в базе данных хранится множество цифровых изображений его проекций, соответствующих разным ракурсам наблюдения. В результате обучения система распознавания должна приобрести способность реагировать одинаковыми реакциями на все объекты одного образа и различными - на объекты других образов.

Функционирование РК на неподготовленной местности с произвольным положением объекта соответствует наибольшей степень неопределенности и требует участия человека в процессе обучения системы распознавания.

Рис. 1. Процесс разработки модели системы распознавания.

Создана методика обучения человеком-оператором системы распознавания, позволяющая установить соответствие между наблюдаемыми изображениями объектов и представителями их классов, хранящихся в базе данных компьютера. При разработке методики учитывались следующие особенности функционирования системы распознавания.

Выделение объектов естественного происхождения на изображениях, полученных в сложных условиях, представляет значительные трудности. Изображения объектов могут практически сливаться с фоном. Погодные явления - дождь, снег, туман затрудняют обнаружение. Негативными факторами являются как недостаточная, так и избыточная освещенность.

Человек-оператор выступает в роли учителя и обучает систему распознавания в условиях плохо определенной внешней среды. В первую очередь он выделяет контур объекта, его форму. Форма изображения является основным прямым классификационным признаком, по которому устанавливается наличие объекта определенного класса.

Учитель лучше, чем компьютер принимает решения в условиях неопределенности, но и ему для принятия верного решения требуется адекватная (полная и достоверная) информация, характеризующая предметную область.

В ряде случаев для успешного решения задачи идентификации может возникнуть необходимость предварительного повышения контрастности изображения. Выбор алгоритма повышения контрастности зависит от статистических характеристик изображения и исходной различимости объектов.

Применительно к процессу обучения системы распознавания СТЗ в любом случае необходимо иметь обучающую выборку. Обучающая выборка представляет множество Пар изображений: реальное искаженное изображение объекта и его изображение, полученное в некоторых заранее заданных и известных условиях.

Предполагается, что классы идентифицируемых объектов определены. По каждому классу в базе данных имеется конечное множество цифровых изображений его проекций, соответствующих разным ракурсам наблюдения.

Процесс обучения с учителем включает следующие действия:

- получение реального изображения сцены;

- визуальный поиск областей на изображении, представляющих интерес для системы распознавания; локализация областей интереса;

- визуальное распознавание класса объектов в локализованных областях, путем мысленного сопоставления выделяемого образа с наиболее подходящей проекцией, хранимой в базе данных.

Для определения числовых значений параметров внешней среды следует выполнить:

- позиционирование изображения выбранной проекции на изображение распознаваемого объекта (на начальном этапе используется ручной режим совмещения изображений, в перспективе -полуавтоматический);

- формирование матрицы разности совмещенных изображений;

- вычисление числовых значений параметров закона распределения помех, искажающих изображение, и коэффициента освещенности.

С целью проверки качества разработанных алгоритмов и апробирования предложенной методики проводилось моделирование процесса распознавания объектов заданной формы с произвольной ориентацией относительно датчика информации в условиях воздействия помех. При этом изображения наблюдаемых проекций объекта отличались от их эталонных изображений, хранящихся в базе данных. Указанная ситуация соответствует наибольшей степени неопределенности и требует участия человека в процессе обучения системы распознавания.

Моделирование процесса идентификации объектов вида «прямоугольник» (рис. 2) осуществлялось на сцене (рис. 3) в разл-ртных условиях обстановки (рис. 4-8).

ш

Рис. 2. Изображение эталона - (маска размером 100x117 пикселей)

Рис. 3. Исходное неискаженное изображение сцены, размером 500><500 пикселей.

Рис. 4. Изображение сцены в условиях слабых помех (ц=0,3; о=0,7; а=1,0), объект подлежащий распознаванию находится на переднем плане.

Рис. 5. Результат обработки «скользящим окном»

изображения сцены,

показанной на (рис. 4). СТЗ выделяет объект, подлежащий распознаванию.

Рис. 6. Изображение сцены в условиях интенсивных помех (ц=0,55; ст=6,9; а =0,8). Оператору трудно выделить и распознать объект.

Рис. 7. Результат обработки «скользящим окном» изображения сцены, показанной на (рис. 6). СТЗ распознает объект, изображения которого искажено интенсивными помехами.

Рис. 8. Результат обработки «скользящим окном» изображения сцены, представляющей "черный квадрат" при воздействии сильных помех О = 0,85; а = 13.0; а=0,8).

Представленный подход и полученные формульные зависимости позволяют решить задачу распознавания трехмерных объектов определенного класса, наблюдаемых под различными ракурсами и в точках, отличных от тех, которые были использованы на этапе идентификации параметров статистической модели при воздействии интенсивных помех, затрудняющих визуальное обнаружение и идентификацию этих объектов человеком - оператором.

В заключении сформулированы основные результаты и выводы, а также рекомендации по применимости алгоритмов.

В соответствии с поставленной целью, основными результатами работы является:

1. Анализ современных методов и моделей распознавания изображений для идентификации трехмерных объектов внешней среды в условиях недостаточно определенной информации;

2. Алгоритм статистического распознавания трехмерных объектов на местности по эталонным изображениям их двумерных проекций, полученных на этапе обучения и хранящихся в базе данных, который предназначен для применения в условиях изменения фактора освещенности и воздействия помех, искажающих входные изображения, поступающие от телекамер системы технического зрения.

3. Формульные зависимости, позволяющие определить неизвестные параметры функций правдоподобия гипотез относительно классов распознаваемых объектов при недостаточно определенных факторах внешней среды. Алгоритма идентификации параметров внешних факторов, искажающих изображения, для учета их действия в алгоритме распознавания.

4. Упрощенные формулы для представления входных изображений СТЗ и факторов, вносящих искажения в изображения распознаваемых объектов, для реализации их на компьютерах ограниченной производительности.

5. Методика обучения системы распознавания человеком-

оператором, служащая для установления соответствия между наблюдаемыми изображениями объектов и представителями их классов, предварительно размещенных в базе данных компьютера.

6. Компьютерная модель распознавания трехмерных объектов по эталонным изображениям их двумерных проекций, полученных на этапе обучения и хранящихся в базе данных, проведение компьютерного эксперимента для различных условий внешней среды.

Публикации автора по теме диссертации:

1. Таит Зин Пьо. Замена серверных курсоров с помощью технологии MARS. // «Микроэлектроника и информатика» - 2010 г. 17-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов.-М.: МИЭТ, апр. 2010 г. -351с., С. 146.

2. Тант Зин Пьо. Обработка связанных наборов данных. // «Микроэлектронные информационно-управляющие системы и комплексы» - 2010 г. Международная научная школа для молодежи: Материалы научной школы. - М.: МИЭТ, окт. 2010 г. - 172с., С. 113.

3. Тант Зин Пьо, Кочетков М.П. Математические модели изображений для систем технического зрения. // «Актуальные вопросы современной техники и технологии» - 2011 г. III-я Международная научная заочная конференция: Сборник докладов. - Липецк, янв. 2011 г. -109 е., С. 56-62.

4. Тант Зин Пьо. Сегментация изображений для бортовых вычислительных систем робототехнических комплексов. // «Микроэлектроника и информатика» - 2011 г. 18-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. - М.: МИЭТ, апр. 2011 г. - 339с., С. 205.

5. Тант Зин Пьо, Кочетков М.П. Методы распознавания объектов для мобильных роботов. // «Актуальные проблемы информатизации в науке, образовании и экономике» - 2011 г. 4-я Всероссийская межвузовская научно-практическая конференция студентов и аспирантов: Тезисы докладов. -М:МИЭТ, окт. 2011 г. -195с., С. 103.

6. Тант Зин Пьо, Кочетков М.П. Обработка изображений в системах технического зрения робототехнических комплексов. // «Информационно-управляющие вычислительные системы: алгоритмы, аппаратные и программные средства» : межвузовский сборник / Под ред. В.А Бархоткина. -М.:МИЭТ, 2011 г.-148с., С. 130-135.

7. Тант Зин Пьо. Нечеткие нейронные сети и преимущества их использования при моделировании систем обработки информации. // «Микроэлектроника и информатика» - 2012 г. 19-я Всероссийская

межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов.-М.: МИЭТ, апр. 2012 г.-323с., С. 197.

8. М.П. Кочетков, Тант Зин Пьо. Интеллектуальная обработка информации в проблемных ситуациях. // «Актуальные проблемы информатизации в науке, образовании и экономике» - 2012 г. 5-я Всероссийская научно-практическая конференция: Тезисы докладов - М-МИЭТ, окт. 2012 г. - 156 е., С. 71.

9. М.П. Кочетков, Тант Зин Пьо. Роботизация мобильных комплексов для выполнения работ в сложных условиях. // «Методы и средства контроля объектов природно-технических геосистем» : сборник научных трудов / Под ред. В.И. Каракеяна. - М.: МИЭТ, 2012 г. - 124с С 35-39.

10. Тант Зин Пьо. Модели сигналов для систем технического зрения мобильных роботов. // «XVI Международная телекоммуникационная конференция молодых ученых и студентов «МИФИ»» - Тезисы докладов 2013 г.-234 е., С. 122.

11. Тант Зин Пьо. Адаптивные алгоритмы распознавания. // «Микроэлектроника и информатика» - 2013 г. 20-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. - М.: МИЭТ, апр. 2013 г. - 340с„ С. 220.

12. М.П. Кочетков, Тант Зин Пьо. Особенности проектирования мобильных роботизированных комплексов для выполнения работ в сложной обстановке. // «Инфраструктура объектов природно-технических геосистем»: сборник научных трудов / Под ред. В.И. Каракеяна. - М • МИЭТ, 2013 г. - 100с., С. 30-35.

13. Зин Пьо Аунг, Вэй Пьо Аунг, Тант Зин Пьо. Система технического зрения для мониторинга транспортных потоков. // «Микроэлектроника и информатика» - 2013 г. 20-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. - М.: МИЭТ, апр. 2013 г. - 340с., С. 184.

14. Пайе Тэйн Наинг, Тант Зин Пьо, Касимов р. А., Смирнов В. О. Методика повышения достоверности магистрального телеуправления//

Журнал «Научное обозрение» - М.: ИД «Наука образования», 2013 г. — № 4. - С. 76-78 (перечень ВАК).

15. Тант Зин Пьо. Нейросетевой алгоритм Кохонена для классификации образов // «Современные информационные технологии» -Пенза 2013 г. 17-я международная научно-техническая конференция студентов, аспирантов и молодых ученых по программе«У.М.Н.И.К.» : Сборник статей.-2013 г. - С. 166-167.

16. Тант Зин Пьо, Пья Сон Ко Ко. Алгоритмы обработки изображений для систем управления наземными роботизированными

комплексами // научно-технический журнал «Естественные и технические науки»,- М.: Изд-во ООО «Компания Спутник+», 2013 г - N° 5 (67 ) - С 288-289. (перечень ВАК).

17. Тант Зин Пьо. Алгоритм обучения самоорганизующихся карт Кохонена для распознавания образов. // «Актуальные проблемы информатизации в науке, образовании и экономике» - 2013 г. 6-я Всероссийская научно-практическая конференция: Тезисы докладов - М-МИЭТ, окт. 2013 г. - 191 е., С. 102.

18. Тант Зин Пьо, Тин Чжо, Пья Сон Ко Ко, Пайе Тэйн Наинг. Методика системы распознавания образов с помощью самоорганизующихся карт кохонена нейронных сетей на основе тгХ\зЫ/ Интернет-журнал «Науковедение». 2013 г.- №5 (18) [Электронный ресурс]. - М. 2013 г. - Режим доступа: http://naukovedenie.ru/ ш4ех.р11р?р=155ие-5-13. (перечень ВАК).

19. М.П. Кочетков, Тант Зин Пьо. Формализация деятельности оператора при управлении мобильным роботизированным комплексом // Журнал «Научное обозрение» - М.: ИД "Наука образования", 2013 г - № 5. - С. 209-212. (перечень ВАК).

Подписано в печать:

Формат 60x84 1/16 Уч.-изд.л.

Тираж ЯОэкз. Заказ №

Отпечатано в типографии ИПК МИЭТ.

124498, г. Москва, г. Зеленоград, проезд 4806, д.5, МИЭТ.