автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы автоматической локализации объектов в потоках изображений динамических сцен

доктора технических наук
Ересько, Юрий Николаевич
город
Тула
год
2006
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Методы автоматической локализации объектов в потоках изображений динамических сцен»

Автореферат диссертации по теме "Методы автоматической локализации объектов в потоках изображений динамических сцен"

На правах рукописи

,___3

л\ чл

#6 о/, мя?

Ересько Юрий Николаевич 0030530 1ь»

МЕТОДЫ АВТОМАТИЧЕСКОЙ ЛОКАЛИЗАЦИИ ОБЪЕКТОВ В ПОТОКАХ ИЗОБРАЖЕНИЙ ДИНАМИЧЕСКИХ СЦЕН

Специальность 05 13 01 - Системный анализ, управление и

обработка информации

Автореферат диссертации на соискание ученой степени доктора технических наук

Тула 2007

003053016

Работа выполнена на кафедре «Автоматика и телемеханика» в ГОУ ВПО «Тульский государственный университет»

Научный консультант' доктор технических наук, профессор

Моттль Вадим Вячеславович

Официальные оппоненты. доктор технических наук, профессор

Васильев Константин Константинович

доктор технических наук, профессор Акиншин Николай Степанович

доктор технических наук, профессор Ларкин Евгений Васильевич

Ведущая организация Федеральное государственное унитарное

предприятие «Конструкторское бюро машиностроения» (ФГУП «КБМ»), г. Коломна, Московская обл

Защита состоится « 15"» мая 2007 г. в_14_час _00_мин на заседании диссертационного совета Д 212 271 05 при ГОУ ВПО «Тульский государственный университет» по адресу, г. Тула, проспект Ленина, 92, к 9-101.

С диссертацией можно ознакомиться в библиотеке ГОУ ВПО «ТулГУ»

Автореферат разослан « {2 »_февраля_2007 г

Ученый секретарь диссертационного совета В М Панарин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ.

Актуальность темы. Основной формой представления первичных данных в технике дистанционного (бесконтактного) изучения объектов являются массивы действительных чисел, упорядоченные на плоской решётке целочисленных координат Связывая эти числа со значениями (отсчётами) интенсивности некоторого физического поля, такие массивы ограниченных размеров обобщённо называют плоскими изображениями той или иной физической природы. Изображения описывают многомерными векторами, матрицами, дискретными функциями двумерных аргументов, а для обозначения их элементов и значений используют обобщающий термин яркостей точек изображения.

Типичные изображения в своём большинстве представляют собой сцены, матрицы которых помимо областей элементов, принадлежащих объекту исследований, содержат области, принадлежащие другим объектам и/или фону. Для представления динамических сцен необходимо уже иметь множество массивов взаимосвязанных данных, упорядоченных по оси дискретного времени и представляющие собой потоки изображений сцен или, иначе, последовательностей кадров изображений. Изучение объектов в потоках динамических изображений сцен позволяет не только снизить искажения результатов, но и получить недоступные в исследованиях по единичным сценам данные об объекте исследований, его эволюциях, структурных отношениях и динамических связях с другими объектами и наблюдателем. В силу этих возможностей такие исследования вызывают широкий интерес, имеют большое научное и практическое значение.

С задачей дистанционного изучения объектов естественным образом сопряжена задача локализации на сценах их изображений, описываемых эталонами или моделями. Локализация понимается как выделение изображения интересующего объекта и определение его координат на каждой сцене. Решение задачи заключается в поиске такой области двумерной функции изображения сцены, в которой эта функция соответствует аналогичной функции эталона (модели). При этом оценки координат объекта получают из решения системы уравнений или неравенств, составленных из линейных или нелинейных функций от значений и аргументов найденной области функции сцены. Для полученной последовательности оценок выбирают закон сглаживания и экстраполяции и подбирают такие параметры, которые минимизируют целевой функционал в виде некоторой функции невязки истинных координат и их оценок.

Классические и хорошо известные параметрические, корреляционно-экстремальные и признаковые методы позволяют получить удовлетворительные решения задачи локализации изображений для простых сцен, известных или неизменных моделей объекта (иконических, статистических, признаковых). Разработаны и применяются разнообразные методы обновления и нормализации моделей, которые позволяют компенсировать метрическую группу аффинных преобразований изображений объектов (изменения координат, масштабов, поворотов) и тем самым расширяют применимость методов локализации.

Однако существует широкий класс прикладных задач, в том числе специальных, которые неразрывно связаны с локализацией объектов, изобра-

жепия которых в реальной динамической сцене претерпевают существенные изменения на интервале наблюдения. Такие изменения вызваны естественными эволюциями объектов и/или ракурса их наблюдения. Можно утверждать, что естественные изменения изображений объектов, подлежащих выделению на сценах, являются скорее правилом, чем исключением, и часто используемые предположения о квазипостоянстве изображений малореалистичны.

Изменения изображений искомых объектов есть следствие изначального противоречия между трёхмерными объектами и разнообразием их плоских проекций, представляемых двумерными функциями яркости. Противоречие порождает априорную неопределённость анализируемых изображений, нарушение адекватности сопоставления триады объект - модель - область сцены, что в конечном итоге приводит к аномальным погрешностям локализации и срыву автоматического процесса как такового. В таких условиях классические методы локализации изображений либо не дают удовлетворительных решений в принципе, либо поднимают трудноразрешимые теоретические проблемы. Даже их частичное решение требует существенных компромиссов в классах объектов, их динамике, сложности сцен, мощности их потоков, степени автоматизации процессов, временном масштабе реализации, что в совокупности переводит проблему локализации изменяющихся изображений в разряд крупных.

Представляемая работа посвящена уточнению теории и разработке методологии локализации объектов на динамических сценах в реалистичных условиях изменения изображений этих объектов, наблюдаемых в автоматическом режиме.

В качестве общей теоретической основы решения этой проблемы в работе принята признаковая методология локализации объектов в рамках теории распознавания образов. К условиям и ограничениям задачи в этом случае отнесены двухальтернативное распознавание, малая (единичная) обучающая выборка, динамический образ объекта, пересекающиеся по совокупности сцен кластеры образов, принятие решений о принадлежности образов по каждой сцене в реальном масштабе времени. Сформулированная таким образом задача выходит за рамки классических методов распознавания, а главная проблема локализации порождает следующие проблемные вопросы.

Проблема выбора признаков. Очевидно, что при применении методологии распознавания образов необходимо использовать признаки, устойчивые к изменениям изображения каждого выбранного объекта. При этом, применительно к изображениям, классическая теория рекомендует использовать структурные различительные признаки. Однако именно структурные признаки неинвариантны к изменениям изображений объектов, что порождает проблему поиска устойчивых признаков. Помимо того, традиционной областью приложений теории распознавания образов является различение классов объектов. Но в условиях выделения выборочных и изменяющихся образов объектов понятие классов утрачивает свой фундаментальный смысл. Это обстоятельство предъявляет к свойствам признаков нетипичные требования максимизации расстояний в признаковом пространстве между любыми образами и существенно усложняет проблему построения признаков, адекватных решаемой задаче.

Проблема повышения мощности решающего правила разделения образов. В классических методах решающее правило строится на представительной обучающей выборке центральных образов классов и остаётся неизменным при последовательном предъявлении образов. Разделяющие границы между классами строят в едином признаковом пространстве и увеличивают его размерность для повышения мощности решающего правила. В нашем случае, каждая предъявляемая сцена в признаковом пространстве содержит выборочные образы, образы могут быть подобными, а разделяющие границы должны охватывать лишь один образ и их необходимо перестраивать от сцены к сцене. Такие условия требуют существенно большей мощности решающего правила, чем в классических ситуациях разделения классов. Проблематичность построения решающих правил значительной мощности сопряжено, кроме непропорционального роста сложности, со следующими обстоятельствами. Во-первых, очередная предъявленная сцена играет роль, по сути, единственной обучающей совокупности и дополнительно поднимает проблему малой обучающей выборки. И во-вторых, увеличение размерности признакового пространства ограничено, с одной стороны, проблемой выбора признаков, а с другой — опасностью переобучения в условиях малой обучающей совокупности и изменяющихся образов.

Проблема синтеза отображений пространства изображений в признаковое пространство. Как и в классической теории распознавания образов, операторы отображения исходного пространства в пространство образов полностью определяются выбранными признаками и решающими правилами. Соответственно, проблемы выбора признаков и решающего правила с неизбежностью приведут к проблемам синтеза адекватных им операторов отображения.

Таким образом, проблема автоматической локализации динамических объектов в потоках сцен в условиях изменения изображений объектов выходит за рамки как существующих методов локализации, так и традиционной методологии распознавания образов, и приводит к необходимости проведения специального комплексного исследования.

Цель работы. Разработка концепции, теоретических основ и методов автоматической локализации изменяющихся изображений объектов в потоках динамических сцен, синтез линейных отображений пространства изображений сцен, систем признаков и решающих функций для реализации разработанных методов

Для достижения цели исследования и решения стоящих проблем, в работе использована реалистичная гипотеза непрерывности исследуемых объектов и их изображений в пространстве и времени, предложена и обоснована гипотеза умножения мощностей решающих правил. Привлечена наиболее общая априорная информация о линейном характере функций доминирующих фонов и ограниченных размерах изображений объектов. Приняты концепции плавной адаптации моделей исследуемых объектов, распределения модели объекта и решающего правила по уровням и пространствам признаков.

Основные положения диссертационных исследований, выносимые на защиту.

1. Концепция построения систем автоматической локализации изменяющихся изображений объектов как основа решения проблемы распознавания динамических образов в последовательностях их множеств.

2. Методы решения задачи автоматической локализации изменяющихся объектов малой и большой протяжённости на последовательностях множеств хорошо размещённых образов и операторные модели систем, реализующих предложенные методы.

3. Масштабируемая система устойчивых, функционально-геометрических признаков изображений объектов, распределённых по конечному множеству нелинейно связанных пространств.

4. Распределённая система нелинейных операторов отображения пространств, локальных решающих функций и моделей объекта с параметрической обратной связью, расширяющая пределы достижимой мощности обобщённого решающего правила разделения образов.

5. Класс автокорреляционных фильтров преобразования изображений сцен, сопряжённых с нелинейными операторами формирования локальных признаков изображений объектов.

6. Аналитически точные взаимные разложения автокорреляционных функций Уолша и степенных квадратичных сплайн - функций.

7 Структуры, алгоритмы и методики построения дискретных вэйвлет преобразований с автокорреляционными функциями и вэйвлетами Уолша.

8. Методы решения задачи автоматической локализации изменяющихся изображений объектов в последовательностях изображений сложных сцен и операторные модели соответствующих им систем.

Методы исследований. В работе использованы методы теории распознавания образов, теории вероятностей и математической статистики, математический аппарат функционального анализа, линейной алгебры, ортогональных преобразований, цифровой фильтрации и вэйвлет преобразования.

Достоверность научных положений, выводов и рекомендаций. Достоверность подтверждается тесной взаимосвязью с базовыми теоретическими положениями и апробированным математическим аппаратом исследований, доказательствами лемм, теорем и их следствий, аналитическими методами синтеза основных положений работы, математическим и имитационным моделированием, результатами экспериментальных исследований.

Научная новизна. Решена задача распознавания и оценок векторов динамических образов в последовательностях их множеств одного класса, с простым и сложным размещениями в многомерных векторных пространствах. Синтезирована система функционально-геометрических признаков изображений с параметрической обратной связью по модели объекта. Предложена методология расширения пределов достижимой мощности обобщённого решающего правила разделения образов и её реализация в виде совокупности нелинейных операторов отображения пространств, локальных решающих функций и моделей объекта, распределённых по уровням и пространствам признаков Формализованы и исследованы новые классы автокорреляционных функций и автокорреляционных вэйвлетов для использования в линейных операторах отобра-

жения пространства изображений. Получены аналитические соотношения, отражающие свойства функций и автокорреляционных функций Уолша, взаимные связи этих функций со степенными квадратичными сплайнами. Синтезированы новые формы дискретных вэйвлет преобразований действительных последовательностей. Предложен и формализован единый групповой оператор линейного преобразования многомерных массивов действительных чисел для формирования множеств локальных признаков. Получены выражения для расчётов вероятностей ложной тревоги при использовании операторов выделения связных множеств.

Практическая значимость. Разработанные методы автоматической локализации объектов позволяют расширить круг решаемых прикладных задач, достичь качественно новых технических характеристик систем дистанционного исследования объектов и явлений. Предложенная методология сопоставления характеристик и векторной оптимизации систем позволит избежать принятия системообразующих ошибочных решений уже на этапе их структурного проектирования. Использование результатов теоретических исследований, доведенных в работе до уровня практических алгоритмов, структурных схем, инженерных рекомендаций и методик синтеза, сократит сроки и затраты на создание новых систем различного назначения. Найденные формы вэйвлет преобразований, линейных по смещениям исходной последовательности, снимают основное ограничение широкого использовании этого эффективного инструмента анализа сигналов в системах обработки и извлечения информации.

Реализация прикладных результатов. Результаты исследований автора использованы в научно-исследовательских и опытно-конструкторских работах «Стриж», «Арман», «Лега», «Фал», «Ориентир-Р», «Цапля», «Снегирь», «Рельеф», выполненных Центральным конструкторским бюро аппаратострое-ния (ОАО ЦКБА) в рамках Решений Комиссии Президиума СМ СССР, Межведомственной целевой программы по новой технике на период до 2000 г., Федеральной целевой программы «Реструктуризация и конверсия отраслей промышленности 1998 - 2000 гг.». Результаты исследований применены в опытных образцах систем СТ-01, 9С835, СГН-00 и технологическом процессе получения прецизионных поверхностей второго порядка «Рельеф» (ОАО ЦКБА), а также использованы в учебном процессе Тульского государственного университета по курсам «Радиотехнические цепи и сигналы», «Информатика».

Публикации. Из 62 работ по избранному направлению исследований, непосредственно по теме диссертации опубликована 31 печатная работа, включая монографию и 11 работ в ведущих научных изданиях из перечня ВАК.

Апробация работы. Основные положения работы докладывались и обсуждались на Iй Международной научной конференции «Глобальные информационные системы. Проблемы и тенденции развития» (Харьков, 2006 г.), 7 й Международной конференции «Теория и техника передачи, приёма и обработки информации» (Харьков, 2001 г.), III Международной научно-технической конференции «Управление в технических системах - XXI век» (Ковров, 2000 г.), межреспубликанской научно-технической конференции «Обработка растровых изображений в автоматических системах» (Тула, 1991 г.), Всесоюзной научно-

технической конференции «Обработка изображений и дистанционные исследования» (Новосибирск, 1984 г.).

Структура и объём работы. Структура диссертации включает введение, семь разделов, основные результаты исследований, библиографический список из 160 наименований и три приложения. Основной текст работы изложен на 206 страницах, содержит 68 рисунков и 17 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении раскрыты суть основных понятий и определений, место и значение задач локализации изображений в решении объемлющей задачи дистанционного изучения объектов. Раскрыты сущность и масштабы основной проблемы локализации, значение и важность её решения для науки и широкого круга практических приложений.

В первом разделе рассматриваются вопросы построения систем автоматической локализации объектов в потоках изображений динамических сцен (САЛИ). Дано формальное описание систем, рассмотрены известные методы локализации, их достоинства, недостатки и проблемы применения в условиях изменяющихся изображений объектов. Предложена обобщённая концепция построения САЛИ, позволяющая разрешить выявленные проблемы, конкретизирована цель и определены задачи исследований.

В формальном описании систем использована логика их представления как систем управления и операторные модели подсистем. Выбранный для дистанционного исследования объект V представлен поверхностью

] V?! 1 1 ^ 1 1 1 соЗ

гу ху , уу I в вещественном пространстве ху , уу , гу , с началом координат в точке наблюдения, совмещённой с датчиком изображений (ДИ). Этой поверхности соответствует трёхмерная функция яркости объекта исследований

(ОИ) Ву =В у ^ , у\ , гу | в выбранном для исследований физическом поле.

Сцена в поле зрения датчика Б в общем случае содержит фон, другие объекты и помехи, которым соответствуют функции яркостей Вь , «натяну-

тые» на эквивалентные поверхности г* =Рк , у^ | . Математическая модель

ДИ с учётом управляющих воздействий д (£) , неизмеряемых возмущения р(() , подстраиваемых коэффициентов К(£) и приведённого ко входу шумового поля = представлена оператором

3:з{в}=з{вЬв,В,,ВУ,В1Г,«(0.0(0,#»(«),В(«),«}=ВП , (1)

где Вп есть поток изображений (кадров изображений) динамической сцены:

Вп =Б(х,у,п)=т|в; ,Ву ,ВЬ§ ,В1Г (2)

Т {. .) - составной оператор объединения изображений, В1 ,Ву ,ВЬд -

масштабные проекции функций яркостей В1 ,Ву ,ВЬб ,В1{. на плоскость чувствительного элемента датчика, п = 0,1,2,...,М - номер сцены в потоке. Сложный оператор (1) не является линейным в терминах и определениях линейной

алгебры, поскольку не имеет противоположного 3 1 , действует не взаимно однозначно и не отвечает свойствам аддитивности и однородности.

Задача САЛИ, по определению, заключается в выделении на двумерной функции яркости Вп , определённой в области Б , подобласти Бу объекта

исследований и в оценке некоторого вектора координат Су п , характеризующего местоположение изображения объекта Ву п =Ву (ху ,уу,п) . Такие оценки представляют собой решения систем уравнений, описывающих Ву , например, его моментные характеристики (М.К. Ни, Г.П. Шибанов):

т-, п тп ,

т

'1,0 '"од

; х=-, т

0,0 т0,0

где тр - начальный момент изображения Ву порядка (p+q) ■

Математическая модель САЛИ представлена оператором С

С: £{Вп}=£{з{Вп}]=Су,п =(уу (п), ху (п)|Т, (4)

который, как и оператор (1), также является нелинейным. Целевой функционал системы на интервале наблюдения N определён в виде N-1 „2

Су,п-СУ)П <6С, (5)

где ес >0 - допустимая средняя невязка, Су п - вектор истинных координат

ОИ. Истинные координаты недоступны непосредственному измерению и для их определения использованы сглаживание и экстраполяция оценок:

СУ,П =7,к (с^ , Су п_2 , ..., Су.п_к) (6)

где - предсказывающий полином порядка к . Отсюда, задача синтеза

САЛИ сведена к синтезу оператора (последовательности операторов) С ,

обеспечивающего выполнение критерия оптимальности С=тт2 или кри-

£

терия диссипативности системы (5), в котором под £с понимают допустимую область сходимости ее траекторий (в среднем). Вследствие непараметрической априорной неопределённости аналитического описания ОИ введена вспомогательная цель функционирования САЛИ:

2а =КП ( Ву „ , Ву „ )отах К„ [ Ву „ , В^ )>гк , (7)

где К (...)-некоторая функция подобия изображений, ек -допустимая величина коэффициента подобия, о - знак эквивалентности (конгруэнтности)

Целевые функционалы вида (5), (7) лежат в основе синтеза фактически любой САЛИ. Уравнение оператора системы (4) имеет множество решений, многообразие которых определяется полнотой учёта степеней свободы динамической сцены (2) и характеристик датчика (1). Однако определяющими факторами синтеза оператора С. являются методы локализации изображений ОИ и те ограничения на параметры изображений, которые они накладывают.

Теоретическая база и общая методология исследования объектов на последовательностях динамических сцен складывалась благодаря работам А. Ро-зенфельда, Л. Хармана, Л.П. Ярославского, Г.П. Шибанова, Д.К. Аггарвала, Л.С. Дейвиса, У.Н. Мартина, T.S. Huang, R.J. Shalkoff, H.H. Красильникова. Основное внимание в работах прежде всего уделялось анализу компонентов сцен (2), операторам объединения компонентов изображений Y{...} и уравнениям вида (3) для оценок координат ОИ. Первыми получили развитие параметрические методы локализации изображений, называемые также «контрастными» методами (Ф.И. Барсуков, А.И. Величкин, А.Д. Сухарев, К.В. Михалков, Е.П. Путятин, G.M. Flash, P.G. Pens, R.S. Rogers). Методы основаны на допущениях

вследствие которых функционал (7) заведомо выполняется, оператор САЛИ (4) вырождается в параметрическое преобразование изображения вида (3), сглаживание и экстраполяцию полученных оценок координат (6), что характерно для типовой задачи двухкоординатной следящей системы авторегулирования.

Преимущества параметрических методов заключаются в инвариантности по объектам, произвольным преобразованиям их изображений, изменениям интенсивности равномерного фона и в помехоустойчивости методов. Недостатками методов являются низкая достоверность выделения объектов на сценах и низкая помехозащищённость, что существенно ограничивает их применение.

Большую группу методов локализации объектов в потоках изображений динамических сцен относят к корреляционно-экстремальным. Их принципиальное отличие от параметрических методов заключается во введении модели

(эталона) объекта исследования В0=В еБ0 <В В классических пред-

ставлениях методов это иконические модели, т.е. изображения ОИ (A.M. Боч-карёв, В.К. Баклицкий, А.И Юрьев, У.К. Прэт, Е.П. Путятин), задаваемые либо априорно, либо на этапе обучения системы. Оператор системы имеет вид

где функция подобия эталонного и предъявляемых изображений Кп (V.V. Vmod, Н. Murase) представляет собой ту или иную форму неравенства

Bv,„ =Bv,n =в„ <=°; Bi 'B.f 'вь6 -const,

Коши-Буняковского для вещественных евклидовых пространств. Можно показать, что двумерные ограниченные вещественные функции (изображения), при выполнении несложных условий, образуют линейное пространство и удовлетворяют скалярному произведению SX^i (y,xj'B2 (у>х) > которое , в свою

очередь, отвечает четырём аксиомам евклидового пространства.

Корреляционные методы характеризуются достаточно высокими уровнями помехоустойчивости, достоверности выделения объектов, устойчивости к воздействиям иных изображений и инвариантны к широкому классу объектов при корректно заданных и неизменных моделях их изображений. Недостатки методов связаны с аномальными ошибками локализации, ограничениями на допустимые классы объектов и сложность сцен в условиях изменений изображений. Естественные изменения соотношений яркостей и «геометрии» различных частей динамических изображений порождают соотношения несоответствия

®v n ^ B0=>argmaxKn(m,j) Cv n ,

которые и вызывают расходимость алгоритмов автоматической локализации. Интегрирование Kn по неизвестным параметрам масштабов и плоских

поворотов изображений позволяет восстановить соотношения эквивалентности, но только для метрической группы аффинных преобразований ОИ (Е.П. Путятин). Определённый эффект стабилизации дают использование корреляции преобразованных изображений, их отдельных признаков (М.И. Либенсон, А.Я. Хесин, Б.А. Янсон, Л. Харман, А. Оппенгейм, Р. Шафер, A.B. Ковалевский) и периодическая замена модели ОИ. Прибегают также к преобразованиям Bn—>23n=GjBnj, B0->B0=G{B0} и корреляцию выполняют в пространстве преобразованных изображений В. В качестве G{...} используют операторы выделения контуров и силуэтов (Д. Кейсесент, Д. Псалтис, A.A. Васильев), операторы-маски Розенфельда, Робертса, Собела (А. Розенфельд, Л. Роберте, Р. Дуда, П. Харт) и другие. Операторы, по сути, выполняют функции «разбеливания» изображений, что согласуется с принципами оптимальной ви-неровской фильтрации двумерных сигналов. Однако эти и другие известные способы не решают в целом проблемы локализации изменяющихся изображений объектов корреляционными методами.

В анализе признаковых методов оператор САЛИ представлен в виде:

С: ¿{Bn}=f

argd(s{G{Bn}})

=Cv.n (8)

„)>о,да=1шс

где С: Вп—>Бп=С|Вп} - оператор преобразования кластеризации изображений, д-. Вп ->ЯЛП ={Пп}еЗ?4 , ->Пу п п , тЦ я^ п )Т -оператор формирования признаков объектов, ЯЛ - множества выборочных

векторов образов Пп объектов сцен, Пу п , Пг п - выборочные векторы образов ОИ и других объектов соответственно, d(n) - решающее правило в 9iq , q - размерность признакового пространства, f n j=С v п - некоторое

функциональное преобразование.

Целевой функционал (5) остается в неизменном виде, а вспомогательный функционал (7), или функционал адаптации, задан в пространстве образов-

Sa (nv,„ . Öv.nj-y Kn (llV:n , Üin]>sk (9)

(Ä)

где Q -область q-мерного пространства признаков, ITV =ПУ x -начальный истинный образ объекта, формируемый обучением на первой сцене. По сути, формулируется неординарная двухальтернативная задача распознавания образов, характеризуемая малой (единичной) обучающей выборкой, выборочными образами искомого и альтернативных объектов из одного или разных классов, динамическими образами объектов и предъявлением совокупности образов сценами. Методы её решения должны обеспечить соответствия, в смысле целевого функционала Q , вытекающие из соотношений (5) и (9):

Kn(BVin,BV!n)o/Cn[nVin,nVin]; BvngIIvn; Вц с Пп

Статистические методы распознавания классифицируют образы по априорным и/или апостериорным вероятностным характеристикам классов и позволяют получать оптимальные, в смысле байесовского риска, правила разделения классов (Р. Дуда, П. Харт, У. Гренандер, Э. Патрик, Дж. Ту, Р. Гонсалес, К. Фу-кунага). По условным и безусловным плотностям вероятностей потенциальных признаков и их ковариациям формируют словари признаков, критерии принятия решений, обучающие и контрольные выборки, линейные и нелинейные решающие правила (А. Л. Горелик, В.А. Скрипкин, В.Н. Вапник, А Я. Червонен-кис). Методы требуют больших, до сотен тысяч, объёмов наблюдений, значительного времени на обучение системы (Б.Р. Левин, Я.А. Фомин, Г.Р. Тарлов-ский) и, в силу особенностей САЛИ, не находят широкого применения.

Логические и алгебраические методы (Т. Павлидис, Ю.И. Журавлёв, У. Гренандер) предполагают описания объектов множествами локальных признаков, установление систем отношений между локальными признаками и их подмножествами, формирование логических и алгебраических соответствий подмножеств эталонным образам. При распознавании изображений признаки формируют процедурами сегментации, выделения контуров и некоторыми другими способами (Е. Gose, R. Johnsonbaugh, S. Jost, J.L. Mundy, A. Zisserman)

Синтаксические методы распознавания (или лингвистические, структурные) также основаны на множествах локальных признаков Совокупность признаков рассматривают как алфавит, классы образов - как грамматики и языки, предъявляемые образы - как предложения или цепочки символов алфавита.

Решения о классификации принимают по результатам грамматического разбора, устанавливающего соответствие предъявленного предложения формальным языкам (К.С. Фу, Ю.И. Журавлев, И Б. Гуревич, У. Гренандер, Р. Харалик).

Признаковые методы в целом позволяют решить главную проблему изменений изображений при условии расширения теоретических основ и методологии классических методов распознавания образов. При этом проблемная задача формулируется как выделение выборочного динамического образа в последовательностях предъявляемых множеств подобных образов, в условиях априорной непараметрической неопределённости их описаний, отсутствия контрольных и единственности обучающей выборок. Задача не имеет удовлетворительных решений в рамках классической теории распознавания образов.

В работе использован детерминистский подход к распознаванию (А.М Айзерман, Э.М. Браверман, Л.И. Розоноэр, Дж. Ту, Р. Гонсалес) при возможном учёте основных статистических характеристик изображений и их признаков. Предложена концепция, построенная на признаковой модели ОИ П0 и плавной её адаптации. Известный принцип подстраиваемой модели объекта управления (Д.П. Деревицкий, А.Л. Фрадков) применительно к изображениям и САЛИ формализован соотношениями:

По =ПУ =ПУД; П.,, =ПМ , я02)П,..., я0ч1П) ;

Для решения проблемы выбора адекватных признаков в работе принята гипотеза непрерывности изображений объектов в пространстве и времени, построена многоуровневая, 8=1, Я , система функционально-геометрических №

признаков (ФГП) П . Система описывает изображения как деталей, так и объектов в целом, взаимные связи признаков и их отношения в множествах.

Обеспечить разделение выборочных образов в едином признаковом пространстве, как это решается в классических методах распознавания, весьма проблематично даже при сколь угодно мощном решающем правиле, характеризуемом, например, дихотомизационной мощностью (Дж. Ту, Р. Гонсалес) УУ=2^+2) . Для решения проблемы предложено формировать обобщённое

признаковое пространство £1® как прямую сумму Я подпространств (об-(е)

ластей пространств) С1 и распределить по ним признаки и локальные решающие правила. Выдвинута и обоснована гипотеза умножения мощностей решающих правил для условий использования нелинейных и взаимно неоднозначных операторов —:

>У = >У(1)-...->У(е)-...-П>(Я) еслиП(П)=П(1)е...©П(()©...©П(й) (10)

Сформированную концепцию решения проблемы локализации изменяющихся изображений объектов в потоках динамических сцен отражает опера-

торная структура преобразований изображений, рисунок 1. Изображения Вп в

УХ

области Б, сИтБ=УхХ пространства изображений 0=5Я последова-

({)

тельно отображаются в пространства, или области пространств, П . Отображения обеспечивают формирование системы ФГП Локальные решающие функции , Пд1^, е^1^ на уровнях признаков 8=1, Я-1 класси-

ки

фицируют множества векторов признаков Ш п на две группы, а на уровне

признаков объекта, £=Я , обеспечивают выделение одного вектора объекта

(я)

Пу ц , включающего подвектор Су п . Модель ОИ П^ п формируется по по-

лучаемым оценкам векторов признаков и корректируется адаптером, а её компоненты используются для образования локальных моделей ОИ.

Рисунок 1. Структура преобразований изображений в САЛИ.

На основе полученных результатов и сформированной концепции построения методов локализации, в первом разделе сформулированы цель и основные задачи исследований, существо которых заключаются в следующем:

- синтез и конкретизация устойчивых признаков, операторов отображений пространств и решающих правил, удовлетворяющих требованиям к системе ФГП и концепции решения выявленных проблем локализации;

- теоретические и экспериментальные исследования свойств и статистических характеристик полученных признаков и операторов, методологических факторов, ограничивающих их применение;

- разработка базовых методов локализации изменяющихся образов на последовательностях их множеств для упрощенных условий, исследование их недостатков, способов ослабления и совершенствования методов в целом;

- развитие теоретических основ и предпосылок преодоления непараметрической априорной неопределенности описаний изменяющихся объектов, повышения пределов допустимой сложности сцен и создание методологических и алгоритмических инструментов их применения,

- уточнение базовых методов локализации в соответствии с полученными решениями, расчётная и экспериментальная оценка характеристик технических реализаций методов, рассмотрение практических приложений результатов диссертационных исследований.

Во втором разделе разрабатывается система ФГП изображений, вклю-

т

чающая множества векторов локальных признаков ^ и признаков объектов ЯЛц ^ , связи и отношения между которыми и Вп определяются операторами в, 0х ' . Исследуются свойства и характеристики операторов и признаков для рандомизированных изображений, полученные данные сопоставляются с результатами математического и имитационного моделирования.

В синтезе отображения в: С{ВП|=2?П использована априорная информацию качественного характера об ограниченности Ву областью Б, удовлетворительной аппроксимации В^ п линейными функциями, допустимости представления Вп одномерными функциями Ь=Ьу (х) , Ь=ЬХ (у) . Поиск отображения проведён в классе операторов свёрток конечных массивов:

0{в}:в(у,х)^(у,х,у)=в(и)=в, (И)

где g (...) -импульсная характеристика некоторого фильтра, у, х, 1, ^ - целочисленные аргументы функций (координаты). К неизвестной пока функции §(...) предъявлены простые требования качественного характера:

для флуктуационных помех;

2)с{в(у,х)}=0прив(у,х)=сопз1;

(12)

3)с{в(у,х)} = 0 при В(у,х)=р1у+р2х+рз, р, =001^;

5)|§(о,о)|>е(^), 1,.1*0

Первое требование из (12) означает повышение отношения сигнал/шум ц после фильтрации, второе и третье требования ослабляют влияние ВЬк п

на В , а четвертое и пятое требуют совпадения экстремума отклика фильтра на ограниченный по длительности сигнал изображения объекта его середине.

Исследование одномерных оптимальных фильтров импульсных сигналов

И II

протяжённостью I вида g(:r)=Ab( (-2) (Е. Эндрюс), где Ъ1 (...) - вторая

производная b^ (...) , х - непрерывный аргумент, а также их модификаций

привело к семейству фильтров g, (х) -

b,{x)*bi{x)*...*b,{x)

, удовлетво-

ряющих требованиям (12). Априорная неопределённость длительности сигнала поставила перед необходимостью выбора конкретного фильтра с вынужденными потерями помехоустойчивости в 2 ... 3 дБ относительно оптимального. При кратности свёрток к=4 выражение для импульсных характеристик переходит в тождество: g4 (0)*ша11 (©) , где * — символ свёртки,

©е^0,1 ^, \valj (©) - непрерывная функция Уолша с порядковым

номером г=1 . В работе показано, что это тождество является частным случаем семейства фильтров с импульсными характеристиками в виде автокорреляционных функций Уолша (АКФУ). В дискретной форме они имеют вид

1 , ч , _ гь>т

ег (х)=тг2^а1г О)™'8'1! (ь+х)> х=1-Н,Н-1, ша1г }1<0 =0 ,

где , , число функций в полном наборе И=Н=2Г ,

Н - "интервал определения", а Г = 1,2,... - порядок полного набора функций Функции Уолша определены в соответствии с выражениями:

wal (h)=Hv'

h

walr (h)=Hv<

0y-l idi 2Г

rj =2y 1 -Is tj =|o, 1,3,7,15,..}; y=l, 2,.., Г+1;

, r2 =2Y e t2 =¡2,4,8,16,..}; y=l, 2,..Г-1; wal^ (h) =vral^ (h)xwal^ (h), r3 =¡5,6,9,.., 14,..} щ +u,; 2r3 =2 г, Ф2 fj

,r 7dl

где

2 k

- двоичное представление номера функции, Ф - знак суммирования

[О, х<0,

по модулю 2, tj, r2 , t3 - подмножества функций, Hv(x)= | —-—-

функция Хевисайда. На рисунке 2 показаны АКФУ из набора порядка Г=4

В работе установлено, что АКФ базисных функций других ортогональ-

Н-1

ных преобразований, обобщаемые выражением gr (х)=~— ^/г (h)/r (h+x) ,

Frll h=0

где / - базисные функции Фурье, синусного, косинусного и наклонного (Slant Transform) преобразований с порядковыми номерами г , а ]|/г || - нормы функций, также удовлетворяют требованиям (12), что позволяет говорить о классе автокорреляционных функций (фильтров) для реализации отображения G .

Максимумы откликов АКФ совпадают с серединой входного импульсного сигнала, пропорциональны его амплитуде и протяжённости и отвечают сис-

тО)

теме ФГП, что предопределило отображение Q

в виде: 2 ' *"' i,q.

(!) (О J2, л

rti.4l =^;,3=argsupx5(x)

03)

-4S

И

Локальные признаки из (13) эквивалентны выражению П^ ,у. ) , су-

ществуют для произвольных сечении двумерной функции изображения, но описывают как детали объектов, так и шум.

Поскольку без потери общности невозможно принять реалистичные допущения о двумерных плотностях распределения признаков, то для условий их непараметрической классификации на принадлежность объектам применён эффективный оператор связности (Т. Павлидис, P.M. Narendra, К.А. Fukunaga, J.S. Sanches, F. Plaz, F.J. Ferri), ко-Рисунок 2. Вид АКФУ, r=l, 2 . ТОрЫй согласуется с гипотезой пространственной непрерывности изображений и вписывается в систему ФГП. Шестисвязные множества векторов удовлетворяют

условиям

У ~У-Л

=Д =1|И

X -X. ' J

= Дх4

где Ду , Дх - параметры связно-

сти по столбцам и строкам соответственно. Их проекции на координатную г. (О

плоскость пространства £21 ' , соединенные отрезками прямых, представляют собой ломаные траектории ^ , как показано на рисунке 3.

К

к-к

к

ч / / s \

\ / / N Sj

* t \ > \

t, / / f / \ \ 4

/ / \ N N ]\ t,

/ г t s \

✓ A К \

t 1 ч >

Рисунок 3. Формирование связных траекторий.

Задача определения веро-х ятности ложной тревоги (ВЛТ) выделения ложных связных множеств, формируемых под воздействием шума, математически сформулирована следующим образом. Задана выборка из I (число строк) положительных целых чисел, имеющих равномерный закон распределения на интервале от 1 до X (число

элементов в строке). Необходимо найти вероятность того, что в данной выборке найдется последовательность из I чисел, в которой рядом стоящие числа отличаются не более, чем на параметр связности |д х |<1 .

Теорема 1. Количество траекторий протяжённостью I , выходящих из начала координат, заканчивающихся в точке у| и хотя бы один раз достигающих линии х = и при 0<и<£, -1<у<и , равно

n,(u.vHZ

где Sj =

1=1

/-2u+v+l

2

/-2u+v

(2и-у)+2(1-1)

/-(2ч-у)-20-1)Д 1-1

>0 для нечётных (/+у)>0 ;

+1>0 для чётных (/+v)>0 .

- биномиальные

коэффициенты, а начало координат соответствует точке

Ы'хЧ)"

Доказательство теоремы позволило получить выражение для ВЛТ:

/

(/х+1)-3"-2 £ РГ,(и>

Q/ =

и=/ -/„ +1

Для инженерных расчётов ВЛТ при произвольных размерах области Б предложена приближённая формула

\-1

(1)

Ъ, = Сх +1)"/у_1 ['х +1_/у ('у -1)(2/у +1) Значения ВЛТ Таблица 1

Сопоставление расчетов с результатами математического моделирования по методу статистических испытаний с объёмом выборок 10 ООО реализаций (таблица 1) показало хорошее приближение полученного соотношения, высокие эффективность алгоритма выделения связных множеств и помехоустойчивость системы ФГП для объектов, протяжённостью 4 э д. и более, но недостаточную для объектов в 2. ..3 э.д. Предложен метод её повышения, основанный на гипотезах пространственно-временной непрерывности изображений объектов и статистической независимости реализаций шумовых полей. Метод реализован введением оператора С. пересече-

II

(6) № ния связных подмножеств п проекций П^ ' смежных сцен:

1У э д. -V Расчетные значения ВЛТ Значения ВЛТ

э д. по методу стат. испытаний

2 0 0.8520 0.8680

2 1 0,9967 0,9980

3 0 0,0508 0,0630

3 1 0,3559 0,3730

4 0 0,0015 0,0030

4 1 0,0364 0,0340

u,n

II-Д.,

п'«<?.-< n*»« п...n«SL,

i+!„-l>

где = ^ П^ - подмножество координатных проекций векторов, 1

(t)

2<ly~l=lu<Y , а мощность каждого связного подмножества card m^ = lu

Расчёты ВЛТ для тех же условий моделирования подтвердили эффективность метода уже при параметре временной связности Дп =2 .

По результатам исследований, оператор связности для формирования признаков объектов формализован в алгоритмической форме:

*4*>gW: ={п[й)л™„.„nf,»ЧЯ)};

Ш fO ill I I

< i"K/=0, n,Vk: я,+к,2 ±1=Ili+k±l,2 ' ^к.З ~я1+к±1,3

.....

В третьем разделе разрабатываются методы и алгоритмы локализации изображений объектов с системой ФГП. Рассматриваются базовые методы локализации малоразмерных и протяжённых изображений объектов в несложных динамических сценах, алгоритмические особенности их реализации, формирование признаковых моделей объектов и локальных решающих функций. Приводятся результаты экспериментальных исследований устойчивости и сходимости алгоритмов методов.

В разработке методов использованы принцип поэтапного усложнения решаемой задачи, концепция решения стоящей проблемы, результаты синтеза системы ФГП и структура преобразований, рисунок 1, предусматривающая no-

it) (я)

следовательное применение операторов G,Q , Q к изображениям Вп .

Пространство изображений D представлено прямой суммой YxX пространств действительных чисел В^у, xj . Оно отвечает восьми аксиомам линейных пространств при центрировании данных относительно нуля, а изображение произвольного объекта может быть разложено по базису е^:

+ ... +ByxeYX ' Однако последующие пространства £2 и Q при наращивании уровней признаков теряют однородность, а аксиомы сложения их элементов и умножения на константы утрачивают физический смысл. Вследствие этого использованы векторы признаков

(i) ( (t) ft) (t) ^ (t) Ц H n\i > ni2 ' •••> lq j ' множества которых ШГ ' образуют области од-

народных нелинейных пространств 12 ' , которые в свою очередь отвечают

условиям (10) и допускают формальные операции с элементами из выражений (13), (14) в базисах е(6): ех =(1,0,...,0)Т ,е^ =(0,0,...,1)Т .

С учётом допустимого произвола системы ФГП, векторы признаков объектов определены следующими выражениями:

чТ

пГ ' .......

т(2)

(1)

■ ,(2) =-.(2)

Яи,2 =пи,1 _тШ

К')

(1)

(15)

Т(2) и,3

Для начального обучения системы использованы оценки векторов признаков первой сцены, а модели признаков, гиперкубические решающие функции и правила сформированы применим процедур (11), (13),..., (15):

=К Л .Уу 'ху)Т =По?1 =(®0,1 >В0,1 >10,1>У0,1'Х0,1

=Гё0,п .Уо,п .Хо,и)Т Л =е0 -0,5в;

р(2) _(2) „(2) (2)^ ьйд' ' У х I

(16)

4 ' и,п п

Й(2) ; Д(2) =П[(2) У,П У,!1 и,п

шш с^п-с12)п1 <£р

и=Гй|| и,п М1 с

Представлением вектора модели ОИ как вектора истинных признаков

(2) (2)

объекта с некоторой погрешностью Пц п =Пу п ^ задача адаптации,

определяемая функционалом 2а (9), сведена к известной задаче построения предсказывающих полиномов или цифровых следящих фильтров погрешностей (В. Каппелини, А.Дж. Константинидис, П. Эмилиани). В частности, фильтр с астатизмом второго порядка вида

¿Л!?,, =а0ДП$ н-а, ДП^ +а2ДП^_2 -а3 -а4 ,

где ЛП(2 *П<2> -П^ ; +ДП[)2» , при а3=а4=1 обеспечит

ДПд2д =0 для постоянных и линейно изменяющихся векторов Пу п .

Выражения (11), (13),..., (16) обеспечивают выполнение целевого функционала Q (5), функционала адаптации <2а (9) и представляют собой алгоритмическое описание базового метода автоматической локализации объектов в потоках изображений динамических сцен. Оценка дихотомизационной мощности обобщённого решающего правила, с учётом гипотезы (10) и использования гиперсферических решающих границ (Дж. Ту, Р. Гонсалес), составит для него УУ-140 . То есть, базовый метод с двумя уровнями признаков (13), (15) позволят с высокой степенью достоверности линейно разделить примерно 140 хорошо размещенных на сцене объектов.

Однако, необходимые условия соответствия локальных признаков (13) системе ФГП в базовом методе перестают соблюдаться для протяжённых изображений, соизмеримых с протяжённостью АКФУ gr (х) . Способ, свободный от этого недостатка и сохраняющий процедуры и структуру метода, основан на теореме о градиентах откликов АКФУ:

Теорема 2. Градиенты откликов Бх (х) автокорреляционных фильтров Уолша на протяжённый гладкий сигнал Ь (х) имеют наибольшие экстремумы в областях его границ, не зависящие от порядковых номеров г и базисов Г фильтров и численно равные величине сигнала Ь :

(х)}]х_а а+1 =±тах|у{£г (х)}|=±|Ь|, Уг*0, Г>1 , (17)

где Ь(х)=

Ь, хе О, хй

а, а+Л,

^ , те 1,Н-1 ,Н=Н=21 ,/>2Н (18)

а, а+П 1 -1

В основе доказательства лежит следующая лемма:

Лемма I. Градиенты переходных характеристик фг (х) АКФУ совпадают с их импульсными характеристиками для всех порядковых номеров и базисов образующих функций фильтров:

У{фг (х)} = вг(х) Уг = 1,И-1, Г> 1

И, наконец, сущность формирования новых локальных признаков раскрывает решение обратной задачи, которое даёт следствие теоремы 2:

Следствие теоремы 2, Точки временной оси, в которых наибольшие экстремумы градиентов откликов АКФУ и аргументы этих экстремумов совпадают между собой для нескольких фильтров, соответствуют границам протяженного входного сигнала с точностью <1э.д.

То есть, если

шах х

V Д, (х)

агг тах х

-тах

У Вг, (х>

-•••-тах

X

Ц|=|ъ|,

{вГ[ (х>) =агё тах (х))

-■■•-аге тах

X

Сх)} =4

то Ь(х) есть протяжённый входной сигнал (18) и а}=а,а+1+1.

Признаки л!1] приобретают физический смысл протяжённостей по х

у -сечений функции изображения объекта, структура признаков и метода сохраняются, но его реализация требует использования двух и более АКФУ.

Необходимость и обязательность экспериментальных исследований сходимости и устойчивости алгоритмов методов (У. Гренандер, Дж. Ту, Р. Гонса-лес) применительно к решаемой проблеме обусловлены недоступностью прямого измерения состояний ОИ, непараметрической неопределённостью аналитического описания изображений сцен, использованием преимущественно детерминистского метода распознавания образов. В силу этих причин, вынужденный отказ от оптимальных критериев и переход к критериям диссипативно-сти систем предопределил в качестве методологии экспериментальных исследований метод прямых оценок вероятностей локализации. Стохастический характер изображений учтён заменой целевого функционала (5) в алгоритмах метода на функционал сходимости траекторий системы по вероятности (частости) Р(; в область, ограниченную ес (Д.П. Деревицкий, А.Л. Фрадков):

Су,п~С0,п У°\ ^С (19)

Искомые оценки получены имитационным и полунатурным моделированием алгоритмов локализации изменяющихся объектов на динамических сценах с шумами, помехами, простыми и сложными фоновыми изображениями. Использованы синтезированные и реальные изображения объектов и фонов. Полученные результаты для параметров моделирования /тш =3 э.д.,

/тах =16 э.д., г=1, ц0 >10, |ес|=3, Рс =0,95 подтвердили устойчивость и сходимость алгоритмов базового метода локализации, показали высокую помехоустойчивость, ц0 >3 , и хорошее совпадение с теоретическими расчётами. Моделирование также выявило наличие координатных областей расходимости алгоритмов, причины появления которых потребовали углубления исследований.

В четвёртом разделе исследуются возможности повышения допустимой сложности динамических сцен. Изучаются основные причины ограничений сложности сцен, предлагаются методологические и алгоритмические решения по их ослаблению, анализируется введение параллельной обработки и логических решающих правил. По результатам исследований уточняется алгоритмическое описание метода для сложных динамических сцен.

Используемые в операторе в (11) одномерные АКФУ имеют ярко выраженную пространственную анизотропию апертуры. Положительные свойства

анизотропии различных фильтров широко используются для направленного разложения, кодирования, сжатия и восстановления изображений (R.H. Bamberger, М. Smith, F.G. Meyer, R.R. Coifman, V. Velisavljevi'c, В. Beferull-Lozano, M. Vetterh, P.L Dragotti). Однако в нашей задаче размеры апертуры АКФУ существенно уменьшают разрешающую способность фильтров по горизонтали HR и тем самым ограничивают допустимую сложность изображений сцен.

Апертура КИХ-фильтра (фильтр с конечной импульсной характеристикой) с гладкой функцией отклика определяется длительностью её главного лепестка. Потенциальная (идеализированная, в отсутствии шумов) разрешающая способность такого фильтра пропорциональна величине апертуры при использовании критерия Релея и стремится к величине апертуры сверху при использовании экстремальных критериев измерений. Но для оценки HR АКФУ,

прежде всего, необходимо ответить на вопросы о разрешающей способности фильтров с осциллирующими импульсными характеристиками.

Теоуема 3. Потенциальная разрешающая способность дискретных одномерных АКФУ HR для экстремальных критериев локализации сигналов не

превышает интервала определения образующих функций Уолша Н , увеличенного на единицу, и не зависит от порядкового номера функции г из их полного набора:

HRg <Н+1, Vre[o,R-l]

(20)

В доказательстве теоремы использованы две леммы.

Лемма 2. Значения АКФУ в точках, отстоящих от главного максимума на ±Н /2 отсчётов, равны по модулю 0,5 , а вариации их знака при переборе порядковых номеров образующих функций г определяются функцией Уолша с порядковым номером г=И/2=Н/2 :

§Г(|)ЬК (-?)Ь0,5' ^п{ег(|)^а1н/2(г),Уг=0^=1

Лемма 3. Значения АКФУ в точках, отстоящих от главного максимума на ±ЗН / 4 отсчётов, равны по модулю 0,25 , а вариации знака при переборе порядковых номеров образующих функций г определяются функцией Уолша с порядковым номером r=ЗR/4=ЗH/4 :

8'(f)bM-f)

= 0,25, sign jg

'wal3H/4 <r)' Vr = 0>

Утверждения теоремы (20) позволили повысить сложность предъявляемых сцен, ослабить требования хорошего размещения образов путём выделяя локальных признаков нескольких объектов на каждой строке наложением усло-

вия

г«

bi3

(i+l)3

>Н+1 на отображение (13). Фактор анизотропии апертуры

АКФУ использован для дополнительного повышения сложности сцен. Для это-

го матрицы Вп в отображениях С{ВП} = ВП заменены на транспонированные Вп =>(ВП )Т =(В~ )Т =Вц , а после преобразований изменены обозначения координатных осей х' —»у , у'—>х . Эквивалентность преобразований не нарушена, однако НИ составила 1 э.д. ,ане (Н+1) Практически это

означает введение квадратурного канала обработки изображений.

Другое ограничение сложности сцен связано с отсутствием изоморфизма

(12\

координатных подпространств £1С в пространствах С2 и П , что стало причиной появления областей расходимости алгоритмов локализации на краях области Б вследствие нарушения соответствия признаков системе ФГП. Рисунок 4 иллюстрирует, что использование различных способов направленной обработки В не устраняет полностью эти области.

Б

В

В«

Б

•л 1 1! •ЩШ дан (П И1 |

Д.,

в;,,

в:

Рисунок 4. Соотношения координатных подпространств С2с в пространствах П , О

Способы обеспечения единства размеров областей исходного и преобразованных изображений хорошо известны (Л.П. Ярославский, У. Прэтт) и сводятся к применению циклической свёртки или искусственного доопределения

исходной матрицы Вп ^ . Од-

11

1 =52

¡¡§

1

нако возникают вопросы о размерах дополнительных областей

Ва(1 и способах получения значений их элементов.

Рисунок 5. Положение областей дополнительных элементов матриц Вп ^ .'

В нашей задаче, теорема 3 определяет размеры дополнительных областей равными апертурам АКФУ Н независимо от направлений обработки матриц Вп , рисунок 5. По результатам моделирования статистических и детерминированных способов доопределения, применено доопределение усреднёнными значениями В . Для ортогональных направлений анализа, рисунок 5, правая иллюстрация, значения дополнительных элементов определяются выражениями:

H-l

Bnad M ^[-H'"1]- i<0,I-l],

j=0

Bnad0.j)=i Z Bn Vje[j, J+H-l], ie[o,I-l]

j=J-H-l

Ещё одно ограничение сложности сцен также связано с условиями хорошего размещения объектов. Выделение оператором нескольких экстремумов на строках матрицы изображений может вызвать рост В ЛТ Q j в областях Вп , протяжённостью >HRg . Возникает задача дополнительного снижения ВЛТ в этих областях. Для её решения применён нелинейный метод фильтрации, известный как метод "к из п" (Б.Р. Левин, В.И. Тихонов, О.И. Шелухин), дающий близкие к оптимальным результаты в условиях априорной неопределённости параметров сигналов, многомодальных функций правдоподобия и негауссовских помех. Метод реализован применением Rj АКФУ из

набора порядка Г с номерами k,m^ej^Rj Jc^l.R—lj , введением one-ратора д*>: (гШ^, ={11^ , , fc^} пересечения

множеств проекций локальных признаков Шг п и наложением требования

совпадения я^ 3 не менее чем для двух фильтров. Для этих условий (В. Фел-

лер) составлено выражение для пессимистической оценки ВЛТ для точки х строки у по откликам не менее двух фильтров:

Rj-l Rj R.j R.j—2Rj— 1 Rj Rj R^

1iw* п (1-р«)+-+пр.

i—1 J=1+1 k=l i=l j=i+lk=j+l m=l 1=1

k*i,j m*k,i,j

(21)

Расчеты по выражению (21)для сопоставимых условий моделирования и использования АКФУ с г=1,2,3 дали следующие результаты:

Распределение вероятностей Р>2 по координатам Таблица 2.

X , э.д. 0 ±3 ±6 ±9 ± 12 ± 15

Р>2 0,952 0,00027 0,00017 0,00104 0,0004 0,0032

Из полученных данных следует, что вероятность аномальных погрешностей реально снизилась в 13,9 раза до 0,00944, в том числе за счёт нового свой-(21

ства оператора С?1 ' - не принятия решений о наличии признака объекта, позволяющего эффективно подавлять координатные шумы.

По результатам введения в базовый метод локализации предложенных процедур, изменена структура преобразований изображений, рисунок 1, уточнены алгоритмическое описание метода и оценка дихотомизационной мощности обобщённого решающего правила, которая составила УУ=59136 . То есть усовершенствованный метод локализации по мощности решающего правила превосходит базовый более чем в 400 раз, что подтверждает эффективность предложенных способов ослабления недостатков и существенно расширяет применимость метода для анализа сложных динамических сцен.

В пятом разделе развиваются теоретические предпосылки обобщения отображений в {Вп} одномерными вэйвлет преобразованиями (ВП) изображений. Представление функций одновременно в частотной и временной областях, или их ВП, рассматривается как средство преодоления неопределённости при выборе разрешающей способности АКФУ. Анализируется дискретное ВП и доказываются теоретические утверждения для построения его новых форм.

Признаковые методы локализации изображений объектов изначально сопряжены с проблемой разрешения нестационарных сигналов. Избирательность АКФУ к длительности сигналов и способ формирования локальных признаков по теореме 2 всё же не решают полностью проблему априорной неопределённости протяжённости изображений. Классическое решение проблемы предполагает интегральный анализ по неизвестным параметрам, что в нашем случае эквивалентно дополнению анализа изображений во временной области частотным анализом. Представить сигналы одновременно во временной и частотной областях позволяет их вэйвлет преобразование (I. БаиЬесЫез, Б.С. Ма11а1):

г г

где Ь (?) - непрерывная действительная ограниченная функция, ; г (¿) -

импульсные характеристики банка фильтров, определяемые как растянутые (сжатые) с масштабом 5 и задержанные на г версии одной и той же функции 1|/(£) , называемой базовым (материнским) вэйвлетом. Пара преобразований

существует, если у (£) является квадратично интегрируемой функцией с нуле-

00 00

вым средним и конечной энергией: ^ у(£)<Й=0; |"|\|/(£)|2 (И«х> . Принципи-

—00 —ОС

альная возможность использования АКФУ в качестве базовых вэйвлетов, по меньшей мере, в непрерывном ВП, доказана следующей теоремой:

Теорема 4. Если gr (£) , г , есть неполное семейство АКФ

Уолша непрерывного аргумента, то кусочно-непрерывный действительный сигнал 6 (г) конечной длительности и с ограниченным спектром можно предста-

вить с заданной точностью одной из функций gr (i) и её аффинниантами по масштабам s и смещениям г , и это представление определяется обратным вэйвлет преобразованием:

ОЭ 00 °0

b{t)=as2^ J] 4»(s,r)gr(sf-r) ,где Ч*(в,т)=л/в Jb(i)gr (st-r)dt

5=1 г=-°0 —ас

Отсюда сделан вывод, что операторы отображений G|BnJ представляют собой частные случаи ВП с материнскими вэйвлетами в виде АКФ ортогональных базисов. Вывод справедлив, по меньшей мере, для базиса Уолша.

Для аппроксимации функций вэйвлет рядами предъявленных к базовым вэйвлетам требований уже недостаточно. Набор вэйвлетов \|/ (t) должен

быть либо ортогональным, либо биортогональным (A. Cohen, I. Daubechies, J. Feauveau), в котором для разложения и восстановления используют ортогональные друг другу вэйвлеты k (i) и {¡/m k (t) , но масштабированные и

смещённые версии каждого из них не образуют ортогональных базисов.

Утверждение 1. Произвольная кусочно-непрерывная и квадратично интегрируемая на интервале bj функция b(t) может быть представлена бесконечным рядом взвешенных двупараметрических, компактно определённых на этом интервале функций, которые не образуют ортогональной системы:

KO=a0,oVo,o (O+ao.iVo.i (0+-+«i,oVi,o (0+-+от1кЧ>т1к (0+-

ь

где am к = |b(i) Vm к (0<Й=уР(т>к) ; у 0 0 (£) - вэйвлет с самым большим

а

масштабом s=s™ =1 и нулевым сдвигом k=xs™/Т=0 (базовый вэйвлет).

Для дискретных последовательностей, когда непрерывная функция представляется конечным числом выборок, а её спектр становится периодическим, построение дискретного вэйвлет преобразования (ДВП) требует совершенно особого подхода В классическом представлении (E.R Post, G. Uytterhoeven), для множества функций /(х) , определённых на оси действительных чисел в гильбертовом пространстве квадратично интегрируемых действительных функций U=U (9?) , вводят дискретные операторы масштабов S и смещений К . Пространство разбивается на вложенные (гнездящиеся) ортогональные подпространства равных объёмов, в них определяют масштабирующую функцию (отцовский вэйвлет) ф(х) и базовый (материнский) вэйвлет у (х), целочисленные аффинианты по масштабам и смещениям которых отвечают свойствам линейных операторов и формируют некоторые базисы. Тогда уравнение 00 00 00

b(x)= X Уфт0 (к) Фто,к (Х)+ X Е yvm (k)-Vm,k (х) (22)

к=-сс т=т„ к=-сс

есть формализованная форма ДВП квадратично интегрируемой функции b (х), где отсчёты на выходах масштабирующих у ф ивэйвлет у ^ фильтров удовлетворяют фундаментальным уравнениям мультиразрешения (A.M. Reza)

УФш (k)=V2^ЬР(2к-Ь)уфт+1 (h), yvm (k)=V2^HP(2k-h)yvm+1 (h) ,

h h

a LP(x) , HP(x) - коэффициенты масштабирующей и вэйвлет функций (фильтров). Для восстановления b (х) следует выполнить обратное ДВП с восстанавливающими фильтрами LP(x) , НР(х) (G.P. Nason, B.W. Silverman):

У cpm+l

(к)=Т2^уфт (h)LP(k-2h)W2£yvm (h)HP(k—2h) , (23)

Пример структуры трёхуровневого ДВП по выражению (22) приведен на рисунке 6. Стрелками обозначены операции двукратной децимации последовательностей. Структура преобразований соответствует банку фильтров с обменом вдвое разрешения по частоте на разрешение по времени согласно принципу

неопределённости Гей-

•Учв(х) зенбеРга' 4л ,

* (М. УеИегН ]. Коуасеу1с).

ни

-гН|р(13

i ¡чишнннн

к

j Учч(х)

Для конкретных

i AJÍ» KUHKptlHblA

»|HP(h)Kni!>Vl,-X) СР(Х) и анализи-

,_| Л „ ,уто(х) рующие и восстанавли-

•|ьр(п)|—«| 4. - вающие фильтры одно-т=3=М ш=2 ш=1 т=0=ш0 ЗНачны и уникальны.

Рисунок 6. Структура трёхуровневого ДВП. Сущность синтеза ДВП

как раз и состоит в отыскании таких фильтров. Исходя из утверждений теоремы 4 для непрерывного ВП, поставлена в определённом смысле обратная задача: по заданному набору базовых функций определить возможность выполнения и структуру ДВП. Для решения этой задачи исследованы свойства функций Уолша и АКФ на их базе.

Лемма 4. Сумма двух смежных функций Уолша из упорядоченного набора порядка Г , имеющих номера т=2[ и г+1=21+1 , где 1=0,1, 2,... , есть

удвоенная функция Уолша с номером 1 / 2 порядка Г-1 :

(Ь)

Лемма 5. Разность двух смежных функций Уолша из упорядоченного набора порядка Г , имеющих номера т=2\ и г+1=21+1,где 1=0,1,2,...,

есть функция Уолша с номером \/2 порядка Г-1 , задержанная на интервал своего определения и имеющая коэффициенты плюс 2 для чётных результирующих функций и минус 2 для нечётных:

ша1г Г 01)-ша1г+1Г (Ь)=(-1)г/2 2ша1г/2 гч (ь-2Г_1)

Поскольку каждая из функций порядка Г>1 , составляющих пару, может быть выражена через пары других функций, то леммы 4 и 5, по сути, описывают дерево (граф) сумм функций Уолша.

Теорема 5. Импульсная характеристика квадратичного сплайн-фильтра gsp (х) с точностью до задержек может быть разложена в конечный ряд рав-

новзвешенных автокорреляционных функций Уолша gr г (х) второго и выше

т- о Г"1

порядков Г с количеством членов ряда 2 : 2м-1

gsP<x>=-7ir Z Sr.rC*-1). (24)

2 r=0

где gsp <х)=^6(х>+5(х-1)+^5(х-2); gsp (z)=^2+1g (P.P. Vaidyanathan). 2 2 2z

Следствие теоремы 5. Сумма импульсных характеристик двух смежных АКФУ из первой половины их полного набора порядка Г , имеющих номера r=2i и r+l=2i+l,rfle i=0,1, 2,... , с коэффициентом 0,5 есть импульсная

характеристика АКФУ с номером i/2 порядка Г-1 :

§г,Г (x)+Sr+l,r (x)=2Sl г-1 (x); r=2ie [о, , i=0,1, 2,. . (25)

Теорема 6. Для перехода от квадратичного сплайн - фильтра gsp (х) к его квадратурному зеркалу gspm (х) достаточно в ряде разложения его импульсной характеристики заменить импульсные характеристики АКФУ порядка Г первой половины полного упорядоченного набора г=0,1,..., (2М-l) на

АКФУ второй половины того же набора г=2

2Г-1

gspm X gr,r ' (26)

2 г=2Г_1

где gspm (x) = (-l)x+1 gsp (х); gspm (z)=-gsp (-Z)=-i—f- (S. Qian)

2z

Следствие 1 теоремы 6. Сумма импульсных характеристик двух смежных АКФУ порядка Г , имеющих номера r=2i и r+l=2i+l , i=0,1, 2,... , с

коэффициентом 0,5 есть импульсная характеристика АКФУ с номером i / 2 порядка Г-1 :

gr,r(x)+gr+ir(x)=2gr/2,r-i<x>; r=2ie[o,R-l], i=0,l,2,... (27)

Соотношение (27) распространяет тождественность (25) на полный набор АКФУ любого порядка и позволяет представить их в виде дерева (графа) сумм.

Следствие 2 теоремы 6. Сумма откликов всех АКФУ порядка Г на ограниченный сигнал Ь(х) есть тот же сигнал с задержкой к=2 -1:

ух (х)=Ь(х)* |^]^г Г(х)|=Ь(х-к) (28)

Доказано существование разложения, в некотором смысле обратного разложениям (24), (26). Подходы к нему формируют следующие утверждения:

Теорема 7. Автокорреляционная функция Уолша с порядковым номером г из полного набора порядка Г , ге|^0, 2Г _1]=[0,11-1] , есть квадратурное зеркало функции с порядковым номером 11-1-г из того же набора:

(2)=ёк-1-г(2) ! ёг.г <п)=-(-1)п ЕК_!_Г)Г (П) (29)

Лемма б. Чётная и нечётная подпоследовательности отсчётов дискретной функции Уолша с номером г из первой половины их упорядоченного набора порядка Г совпадают между собой и с последовательностью отсчётов функции Уолша с тем же номером из набора порядка Г-1 :

=^а1гГ(Ю^ =™а1гГ_1(Ю, Уг<2Г_1,Г>2 (30)

Лемма 7. Чётная и нечётная подпоследовательности отсчётов дискретной функции Уолша с номером г=11/2+1 из второй половины их упорядоченного набора порядка Г совпадают между собой и с последовательностью отсчётов функции Уолша с номером г=11-1-1 из набора порядка Г-1 , если знаки в нечётной подпоследовательности изменить на обратные:

[™а1К /2+1,Г (Ь)]е =~[™а111/2+1,Г (Ь)]о =™а111-1->,Г-1 (Ы' Гг2 (31>

Использование (29),..., (31) позволили доказать искомое разложение:

Теорема 8. АКФ Уолша произвольного номера г из их набора порядка Г в г-области может быть представлена произведением Г функций ш квад-

„Г-1

ратичных сплайнов, степени которых не превосходят 2 :

8.,Г(2)=Пто(^р<2;>'г'у'2;2 )=ПУа12^ (Гг)68р^а12н (Гг)2^ }(32)

у=1 у=1

Следствие теоремы 8. Сумма АКФУ с номерами г и 11-1-г из набора порядка Г равна с коэффициентом 2 интерполированной вдвое и задержанной на один отсчёт АКФУ с номером г порядка Г-1 :

ё, г ^>+5к-г-1,г ^=2ег,г-1 (г2)г-1 (33)

Установленные свойства и разложения функций (24), . ., (33) использованы в синтезе отображений С}{ВП} для формирования множеств локальных признаков объектов на изображениях сложных сцен.

В шестом разделе решаются задачи построения алгоритмов и структур вэйвлет преобразований с автокорреляционными вэйвлетами Уолша для группового оператора отображения и уточняется метод локализации объектов на множествах образов со сложным размещением.

Существенные отличия дискретного от непрерывного ВП связаны с децимацией и интерполяцией дискретных последовательностей. На рисунке 7 показаны исходная уь (п) , децимированная у(п),8 = 4 и интерполированная в

такой же степени уц (п> последовательности и их идеализированные спектры.

УьН

Lili

О 2 1 й 8П

--Ч -2* \ ОI} я .-2* у4}[ '''Gn &t » < ^

i

У»

012

0 2 16 8й

-4л С 4л 8л

|Y,0»)l"

-л 0 я 2л

a,í

at

Рисунок 7. Иллюстрация децимации и интерполяции последовательности.

Наложение спектральных компонент при децимации, как видим, приводит к искажениям последовательностей (Л.М. Гольденберг, Б.Д. Матюшкин, М.Н. Поляк), которые следует аналитически точно учесть в синтезе ДВП.

Теорема 9. 2-образ уь (г) последовательности уь (п) и 2-образ уц (г) той же последовательности, децимированной и интерполированной в

Б=2М раз, М=1,2,» , связаны соотношением:

М т

1+соз(тт)+]Г 2т-1 ]~[аЦ214 тт)

т=2

i=2

(34)

В классических структурах биортогонального ДВП с квадратичными сплайнами, рисунок 8, для устранения искажений децимированных последовательностей (34) применены добавочные «максфлат» фильтры (Б. СНап) и их зеркала (г)=-^(-1+4г_1-2-2); gadd (п)=--^5(п)+15(п-1)--^8(п-2) .

^^^ ф,-(у) вое ДВП

„ /,л ГТП >0^-) ГТ71 П ГП „ I С каскад!

16

Многоуровне-

-Ч t2 Н *MZ) Н

Рисунок 8. Структура одноуровневого ДВП с квадратичными сплайнами.

сопряжено с каскадированием одноуровневых структур и последовательным применением двукратной де-

цимации. Исследования возможности замены таких преобразований эквивалентным одноуровневым ДВП позволили синтезировать ДВП с произвольными степенями децимации М=2,3,» , учитывающими утверждения теоремы 9, и

сформулировать инженерную методику его построения.

(V) ии Т8

>(и) ии К "Г 8

оцшЛ'' '

Рисунок 9. Структура одноуровневого ДВП со степенью децимации М=3 .

$ Пример струк-

туры ДВП с восьми-1 г Ь'и—ГТ 7^4 кратной децимацией г"|1'П приведён на рисунке

9, а диаграммы последовательностей -на рисунке 10. По-(х) ,

следовательности на входе и выходе схемы обозначены как Ъ(х) и Ьои1 в НЧ и ВЧ каналах до децимации - у[Ь (Ь) , а после интерполяции - у,и (Ь) .

МП

Ь(х)

ЯЕ

УОиМ

0 4 8 12162024

0 4 8 12162024 Ь

1

08 06 04 02 0

1 1 I 1

1 1 Г,

06 04

У1Ь(Ь) 0 2

"02 -0.4

1 I 1 1

— ------

Ч' !"—___ [ 1 1 >

У1и(Ь)

1

08 0.6 04 0.2 0

08 06 04 0.2 0 -02

М111

1

1 1..1 1

0 4 8 12162024 Ь

1 1 1

р н 1 1 1 1 1

0 4 8 12162024 "" 0 4 8 12162024 "" 0 4 8 12162024

х Ь 11

Рисунок 10. Диаграммы последовательностей в точках схемы по рисунку 9.

Проблемы синтеза в части интерференций, комплексных степеней аргументов и пропуска сигнальных подпоследовательностей решены введением степенных фильтров и повторной децимации. Так для схемы по рисунку 9 потребовалась 4-кратная повторная децимация, обозначенная четырьмя стрелками

Однако преобразования (22), (23) не описывают все формы ДВП. Разделив вэйвлет коэффициенты на НЧ и ВЧ составляющие, получим:

2 -2 оо 2 -1 оо

ых)= х Хч,2г(к)ч,к(х)+ Е

2г=0, к=-оо г=0,1,

2г+1=1, к=-«о г=0,1,

у (к)ш . (х)

т0,2г+1 /Тт0,к

(35)

где -<

1]2г(к):=72£ьР(2к-Ь).уГ;Ю+1(к),

ю,2г+1

(к)=л/2^НР(2к-Ь)-уг

т+1

(к) уом^=Ъ(к) (36)

Ь(х) —Ннр(Ь

Уз,о(х)

Структура прямого ДВП для М=3 в соответствии с выражениями (35), (36) показана на рисунке 11 Такая форма ДВП (11.11. Со1йпап, V. \Vickerhauser) названа разложением по алгоритму пакета вэйвлетов. Её преимущества заключаются в повышенной точности представления широкого класса последовательностей, что наилучшим образом согласуется с задачами формирования признаков и распознавания.

Преобразованием этой структуры в соответствии с теоремами 5 и 6, формулы (24), (26), получена новая структура ДВП, показанная на рисунке 12.

Схема имеет всего один уровень преобразования и степень децимации т=1 независимо от значений М и Г . Однако масштабирующей функцией и

материнским вэйвле-

1(4

, _ I У7.0 (X)

¡гШрсьНГЩ—-

. . ~~ I Уб.о(х)

! I У5. О (х)

НР(Ь НТгН Н НР(Ь ИП1—►

[ I У4.о(х)

ЕадНЩ-ЧШНЭ нр(ь КГ^-Н НР^нгЛг тенп^чьр^ит^^(х)

I ___ __.! У1.о(х)

НЩйНШг^х

т = 3 = М т = 2 га=1 ш = т0 = 0

Рисунок 11. Структура разложения сигнала трёхуровневым пакетом вэйвлетов.

Уо. 1 (х) I

8/11 X

ёЛ-иО^)

4-2

4 2 —»У«я(к)_

Т 2

-(-О" 8«р(п)

ЬМ.

2/Я

► 1 2

-.ОО-Лг-,

go(n)

12

'о(к)

т

Т 2 4 >—* ^рСп)

Рисунок 12 Структура пакетного ДВП.

-ёМ-г) g*l<l(z2)

м -бииС-г)

Ъй

ш

Ш

fi.Cz) 88, (г)

8во(г)

том остаются квадратичные сплайны. Схема занимает пере-1. ходное положение

(удушзу межДу банком фильтров и пакетом вэйвлетов и может рассматриваться как схема пакетного ДВП.

Разработка оригинальной методики, применение теорем 5,..., 8 и их следствий позволили синтезировать алгоритм и структуру биортогональ-ного ДВП с автокорреляционными

Ъ(г)

¡««(г).

Е«и(г) —

Рисунок 13. Структура биортогонального ДВП с АКВУ. вэйвлетами Уолша

(АКВУ), рисунок

13. Схема имеет дуальную и ортогональную формы, содержит одну масштабирующую функцию g() (2) иЗвэйвлета Структура преобразований может быть

biz).

g spm(z)

g.pm(Z )-l

i<pm(z4)

M?)

g>pm(z

Vs(z)

g5p(z")

Yl(z)

g<p(z)

g sp(z^)

gspm(Z )

Y1(Z)

gsp(z")

синтезирована для наборов АКФУ произвольных порядков Г формальными и простыми приёмами, что важно для инженерной практики.

Нелинейность классического ДВП, как и ДВП с АКВУ, по смещениям исходных последовательностей является основным препятствием их применения в САЛИ. Пакетное ДВП существенно y7(z) снижает остроту проблемы, но не решает

*■ её полностью. Поиски системных решений у* (z) проблемы привели к избыточному дискретному вэйвлет преобразованию (ИДВП). Доказано (G.P. Nason, B.W. Silverman), что отказ от децимации вэйвлет коэффициентов не нарушает свойств и структуры ДВП и лишь увеличивает вычислительные затраты на реализацию. Но y2(z) исключение операций децимации позволяет устранить причины нелинейности опе-vi (г) раторов преобразований в принципе.

Структура ИДВП по алгоритмам (35), (Зб)для трёхуровневого пакета вэйв-летов приведена на рисунке 14. Её преобразование с использованием теоремы 8 дало схему, показанную на рисунке 15. ИДВП с АКВУ обладает уникальным свойством обратимости фундаментального уравнения мультиразрешения, которое доказано следующей леммой:

Лемма 8. Последовательности коэффициентов избыточного дискретного вэйвлет преобразования с автокорреляционными вэйвлетами Уолша на уровне масштабов m с точностью до задержки выражаются весовыми суммами коэффициентов преобразования на уровне масштабов т+1 :

Лга+1,г(к) = Еа1Лт,, (к)'

(37)

А} (к)е{Ти (к), Ф0 (к)}

! spm(Z )

Yo(z)

Рисунок 14. Структура прямого трёхуровневого ИДВП по алгоритму пакета вэйвлетов.

Lj&i

b(z)

мь;

_ J.

'ЧрмФЬ

I-1 3

H g7.3(z) г*

4 fo.3(z) К3

_ :

'-ifeiW h-

-"Ч Ro.3(z) I

y7(z) = f5(z) y6(z) = T4(z)

у5(г) = ад

y4(z) = 4'7(z)

y2(z) = Y3(z)

yi(z) = f^z) y0(z) «= 0>o(z)

Рисунок 15. Структура прямого ИДВП по алгоритму пакета АКВУ.

То есть, при известном ИДВП порядка Г становятся известными все коэффициенты преобразований порядков Г-1,Г-2,...,1 .Появилась

возможность в методах автоматической локализации объектов объединить множества операторов Ога г |Вп|=Вт г п единым оператором множественного

отображения сцен G: с{вп (y,x)}=jBra r n (у,х) = Лт r п (у,х)

Теорема 10. Множество операторов свёрточных преобразований в представляют собой конечную аддитивную абелеву группу линейных преобразовании в пространстве ' =ГГ ' :

Г=т0 , П10-М

Отсюда структуру ИДВП в виде рисунка 15, дополненную схемой получения коэффициентов большего разрешения по лемме 8, следует рассматривать как структуру группового дискретного вэйвлет преобразования (ГДВП).

По результатам совершенствования метода локализации с системой ФГП для сложных динамических сцен, в структуру базового метода внесены коррективы. Учтены обобщение отображений единым оператором ГДВП, многока-нальность обработки, изоморфизмы подпространств и расширение пространств признаков, раздел 4, а также введение локальных признаков масштаба вэйвлет коэффициентов, разделы 3, 5. Полученная структура оператора локализации изменяющихся изображений объектов на сложных динамических сценах приведена на рисунке 16. Согласно схеме, иерархическая система ФГП включает уже Я=5 уровней, из которых признаки на уровнях 6=4,5 являются признаками объектов.

Рисунок 16. Структура составного оператора С, локализации объектов на изображениях сложных динамических сцен.

Оценка дихотомизационной мощности обобщённого решающего правила

5

дала следующий результат: >У=+2)=16 14-12-16-22=946176 . Отсюда

1=1

следует, что при минимальных размерах их изображений 2x2 э.д. метод позволяет разделять объекты в потоках сложных сцен размерами >1800x1800 э.д.

Таким образом, совокупность результатов исследований, разрешение основных недостатков, существенное повышение мощности обобщённого решающего правила и алгоритмическая гибкость методов позволяют считать главную проблему автоматической локализации изменяющихся изображений объектов в потоках динамических сцен решенной как в теоретическом, так и в практическом аспектах.

В седьмом разделе рассматриваются вопросы применения результатов исследований в решении прикладных задач.

Технические характеристики САЛИ, реализующей разработанные методы, рассмотрены в рамках проекта объемлющей системы дистанционного наблюдения (АСДН) с телевизионным датчиком. Интерес представляли, прежде всего, интегральные характеристики, вариантный системный анализ и сопоставление образцов различных систем на ранних стадиях их проектирования.

Для оценки и сопоставления характеристик различных САЛИ предложен коэффициент качества системы <3 , основанный на сопоставлении координатных портретов испытуемой и идеализированной систем. На рисунке 17

представлены зависимости <3 от площади изображения ОИ, полученные имитационным моделированием алгоритмов базового метода локализации. Кривые 1, 2 характеризуют САЛИ, а кривая 3 - АСДН. Полученные зависимости подтверждают результаты математического моделирования, раздел 3, отражают высокие характеристики САЛИ и влияние характеристик приводов и датчика изображений АСДН на снижение качества системы.

Задача выбора лучшего из 8 различных вариантов САЛИ по 10 характеристикам решена как задача многомерной векторной оптимизации систем по критерию «эффективность - затраты» (Л.С. Гуткин, В.А Омельченко). В таблице 3 приведены характеристики лучших вариантов: Т)1 - по разработанному методу для сложных сцен, Б1 - САЛИ с корреляционным алгоритмом локализации. Результаты моделирования подтвердили достижение качественно новых характеристик системы, эффективность разработанных методов и полноту решения проблемы автоматической локализации изменяющихся изображений

Рисунок 17. Коэффициенты качества системы с базовым методом локализации изображений.

Построение САЛИ для активных систем рассмотрено в проекте радиолокационной АСДН. При сохранении метода и алгоритмов локализации изображений объектов, существенной особенностью таких систем является предварительное формирование радиояркостного изображения по выходному сигналу радиолокационного датчика. Разработанный преобразователь формирует изображения 9100x4000 э.д. в режиме обзора, 846x400 э.д. в режиме секторного обзора, 282x1000 э.д. для отображения на мониторе наблюдателя. Алгоритмы предварительной обработки изображений включают их сглаживание банком КИХ-фильтров, пространственно-временную СДЦ, отображение траекторий движения объектов с компенсацией яркостных искажений. В алгоритмах САЛИ использованы коэффициенты ГДВП с тремя АКВУ vFm г, г=1,2,3, т=7,8,9. Испытания образца АСДН показали вероятность

достоверной локализации объектов Р>0,95 , а коэффициент подпомеховой видимости достигал значений 14 ... 29 дБ по напряжению, что можно отнести к очень хорошим результатам.

Наиболее критичным элементом медицинских информационных систем с точки зрения получения, интерпретации и выдачи информации является техника аппаратных клинических исследований. Для модернизации существующей аппаратуры предложено ввести программную обработку сигналов биоэлектрических датчиков. Задача обработки сформулирована как обнаружение, оценка параметров и распознавание нестационарных сигналов биомедицинских датчиков. Предложено использовать результаты выполненных исследований в части применения ГДВП, линейного по смещениям сигнала. Для практического решения задачи, синтезированы структура, алгоритм и определены параметры ГДВП. Использовано 11 вэйвлетов из полного набора в 128 функций с интервалами определения в 255, 127, 63 и 31 э.д. для четырех масштабов АКВУ, что достаточно для широкого круга медицинской аппаратуры клинических исследований. Пакет прикладного программного обеспечения прошёл апробацию на обработке ЭКГ, оценка достоверности автоматического выявления аритмии сердца больного составила 0, 92 . Полученные результаты позволили инициировать работы по созданию и внедрению специализированного пакета программного обеспечения для поликлинических учреждений здравоохранения.

Характеристики вариантов САЛИ Таблица 3

№ п/п Характеристики Варианты

D1 D7

1 Мин отношение сигнал/шум 2,5 5,0

2 Мин. контраст изображения объекта 0,05 0,05

3 Мин площадь изображения объекта, % 30 0,2

4 Допустимая кратность изменения масштаба 2:1 >50 1

5 Вероятность локализации при сложных изменениях изображений 0,15 0,95

6 Вероятность локализации при воздействии помех >0,30 >0,85

7 Формирование оценок параметров изображений объектов и сцен: - координаты - размеры, контраст - число разрешаемых объектов + 1 + + >30

В целом, решение прикладных задач и реализация результатов диссертационных исследований дали дополнительные свидетельства достоверности полученных решений и широты их практических применений.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. В рамках теории распознавания образов предложена концепция решения проблемы локализации изменяющихся изображений отдельных объектов на взаимосвязанных сценах для условий априорной непараметрической неопределённости их описаний и ограничений на обучающие процедуры.

2. Предложена обобщённая многоуровневая операторная модель систем автоматической локализации объектов в потоках изображений динамических сцен в виде иерархической последовательности операторов отображения множеств образов, локальных решающих правил и подстраиваемых моделей объекта, распределённых по признаковым пространствам.

3. Разработаны базовые методы и алгоритмы локализации объектов с отображением изображений в последовательность нелинейных признаковых пространств, которые применимы для сцен с хорошим размещением объектов.

4. Синтезирована устойчивая к изменениям изображений объектов система функционально-геометрических признаков, основанная на последовательном применении интегро-дифференциальных и нелинейных операторов.

5. Предложена и конкретизирована распределённая система решающих правил разделения образов для повышения дихотомизационной мощности обобщённого правила как альтернатива повышению размерности единого пространства образов.

6. Получены аналитические представления степенных сплайн-функций рядами автокорреляционных функций Уолша и любой из этих функций - произведением степенных сплайн-функций.

7. Синтезированы алгоритмы и структуры дискретного группового вэйвлет преобразования, ДВП с автокорреляционными вэйвлетами Уолша, пакетного ДВП и ДВП с повышенными степенями децимации для линейных операторов отображения изображений.

8. Разработаны метод и алгоритмы локализации объектов с групповым вэйвлет преобразованием изображений и расширенной системой иерархических признаков для потоков сцен со сложным размещением объектов.

9. Решены прикладные задачи структурного проектирования активных и пассивных автоматических визиров, распознавания и локализации биоэлектрических сигналов в медицинской технике.

10.Получены положительные результаты внедрения теоретических положений и методов с техническим эффектом в разнородных практических системах.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ РАБОТЫ

Е А Даев, Ю.Н Ересько, В.А. Савенков. Управляемый генератор пилообразного напряжения - А С. № 684727, Н03К 4/50, 1979

Ю Н Ересько, В.А. Савенков. Анализ корреляционно-экстремальных алгоритмов нормализации. / В сб «Элементная база устройств и систем когерентной оптики». - Тула: Тул-ПИ, 1981, с 95 -99.

]

3 Е.А Даев, A.A. Добрынин, Ю Н. Ересько, В М Лискин Управляемый генератор пилообразного напряжения. - A.C. № 984008, Н03К4/50, 1982

4. Ю.Н Ересько, Е.П Путятин. Многоапертурное препарирование изображений. / В кн «Обработка изображений и дистанционные исследования» Тезисы докладов всесоюзной научно-технической конференции ОИДИ-84. - Новосибирск, 1984, с. 87 - 89

5 Е А. Даев, А А Добрынин, Ю Н. Ересько, В М Лискин Устройство для поворота телевизионного растра. - А С № 1095445, H04N 3/16, 1984

6 ЮН Ересько, В А Гороховатский, С.Ф. Кацалап, Е П. Путятин, В.А Савенков Способ распознавания изображений и устройство для его осуществления - A.C. № 1238269, H04N 7/18, 1986.

7 В А. Гороховатский, Ю Н. Ересько, Е.П Путятин, В И. Стрельченко. Метод экстремальной логической фильтрации в задачах автоматической сегментации изображений. / В рес-публ междуведомственном сб. «АСУ и приборы автоматики» - Харьков' «Вища школа»,

1987, вып. 83, с 3-8

8 Ю Н. Ересько. Нормализация динамических изображений в системах обработки информации. / В сб. «Алгоритмы и структуры систем обработки информации». - Тула: ТулПИ,

1988, с 27-33.

9. В.А. Гороховатский, Ю.Н. Ересько, Е.П. Путятин, В.И. Стрельченко. Локализация объектов на изображениях визуальных сцен. - Автометрия, 1990, вып. 6, с. 3 - 7.

10 Ю Н Ересько, А А. Добрынин, Е.В Биткова, М.В Бредихина Исследование влияния краевых эффектов в алгоритмах свбрточных преобразований. / В сб «Алгоритмы и структуры систем обработки информации». - Тула. ТулПИ, 1990, с. 22 - 30.

11 Ю Н Ересько, В.А. Савенков Выбор концепции построения автоматических визиров / В кн. «Обработка растровых изображений в автоматических системах» Тезисы докладов межреспубликанской научно-технической конференции -Тула Старт, 1991, с. 3-5.

12.Ю.Н. Ересько, А А. Добрынин. Алгоритм автоматического обнаружения, инвариантный к размеру объектов / В кн. «Обработка растровых изображений в автоматических системах». Тезисы докладов межреспубликанской научно-технической конференции. - Тула: Старт, 1991, с 7-8

13 Ю.Н. Ересько, М.В Бредихина, A.A. Добрынин. Алгоритм автоматического обнаружения и локализации объектов и его использование в системах цифровой обработки изображений. / В кн «Обработка растровых изображений в автоматических системах». Тезисы докладов межреспубликанской научно-технической конференции. - Тула. Старт, 1991, с 15 -17

14.Ю.Н. Ересько, В.А. Гороховатский, A.A. Добрынин, Е.П. Путятин, О.В. Сытник. Определение параметров объектов по серии изображений. - Автометрия, 1992, № 4, с. 18-23.

15.Ю Н. Ересько. Робастные алгоритмы адаптивных систем позиционирования объектов. / Сборник научных трудов III международной научно-технической конференции «Управление в технических системах - XXI век». - Ковров: КГТУ, 2000, с 33 - 37.

16.Ю.Н. Ересько Адаптивное оценивание параметров протяжённых импульсных сигналов. / Сборник научных трудов III международной научно-технической конференции «Управление в технических системах - XXI век». - Ковров- КГТУ, 2000, с. 43-45.

17 Ю Н. Ересько, С В. Машталир Автокорреляционные вэйвлет фильтры для формирования признаковых моделей изображений. / Сборник научных трудов 7- международной конференции «Теория и техника передачи, приема и обработки информации» -Харьков: ХТУРЭ, 2001, с 434,435

18.Ю Н. Ересько Обнаружение границ сигнала по его вэйвлет - преобразованию. / Сборник научных трудов 7й международной конференции «Теория и техника передачи, приёма и обработки информации» - Харьков: ХТУРЭ, 2001, с. 436,437.

19 Ю Н. Ересько. Локализация изображений в автоматических визирах. - М.: Компания Спутник +, 2002. - 357 с.

20.Ю Н. Ересько Децимация и интерполяция в вэйвлет - преобразованиях дискретных последовательностей - Актуальные проблемы современной науки, 2003, № 2, с. 240 - 243

21 Ю Н. Ересько. Вэйвлет преобразования сигналов со степенным масштабированием коэффициентов - Актуальные проблемы современной науки, 2003, № 2, с. 235 - 239

22.Ю.Н. Ересько. Вэйвлет преобразования биоэлектрических сигналов в технике клинических исследований. - Вестник новых медицинских технологий, 2003, т. X, №3, с. 27-30.

23.Ю.Н. Ересько. Разложение автокорреляционных фильтров Уолша в задачах синтеза структур вэйвлет преобразования. — Физика волновых процессов и радиотехнические системы, 2003, т. 6, № 3, с. 47 - 52.

24.Ю.Н. Ересько. Эффективная апертура автокорреляционных фильтров Уолша. - Известия Тульского государственного университета. Серия радиотехника и радиооптика, 2003, т. 5, вып. 1, с. 135 -143.

25.Ю.Н. Ересько. Структурно-параметрический синтез ДВП с автокорреляционными вэйвлетамк Уолша. — Физика волновых процессов и радиотехнические системы, 2003, т. 6, №4, с. 73-78.

26.Ю.Н. Ересько. Пакетное вэйвлет преобразование сигналов на базе автокорреляционных функций Уолша. - Информационные технологии, 2004, № 1, с. 54-60.

27.Ю.Н. Ересько. Признаковый метод локализации объектов в потоках изображений динамических сцен. - Информационно-измерительные и управляющие системы, 2005, т. 3,№6, с 8-20.

28.IO.II. Ересько. Дискретное вэйвлет преобразование сигналов с повышенными степенями децимации. - Известия Тульского государственного университета. Серия радиотехника и радиооптика, 2005, т. 7, с. 118 -129.

29.Ю.Н. Ересько. Векторная оптимизация структуры автоматических систем дистанционного наблюдения. - Системы управления и информационные технологии, 2006, №2(24), с. 83 - 90.

30.Ю.Н. Ересько. Формирование системы признаков для автоматического распознавания изображений на динамических сценах. - Информационно-измерительные и управляющие системы, 2006, т. 4, № 6, с. 52 - 61.

31 Ю.Н Ересько Свойства автокорреляционных функций Уолша / Материалы первой международной конференции «Глобальные информационные системы. Проблемы и тенденции развития». - Харьков, ХНУРЭ, 2006, с. 51 - 52.

Изд. лиц. JIP№ 020300 от 12.02.97. Подписано в печать сиг, с/, с г Формат бумаги 60x84 1/16. Бумага офсетная. Усл. печ. л. 1 (,, Уч.-изд. л. &&

Тиражj00 экз. Заказ VOZ

Оглавление автор диссертации — доктора технических наук Ересько, Юрий Николаевич

Обозначения и сокращения

Введение

1 Структурный синтез систем локализации объектов в потоках изображений динамических сцен

1.1 Формализация описания систем локализации изображений в последовательностях взаимосвязанных сцен

1.2 Анализ параметрических и корреляционно-экстремальных методов локализации изображений динамических объектов

1.3 Проблемный анализ признаковых методов локализации

1.4 Концепция построения систем локализации изменяющихся изображений объектов

1.5 Постановка задач исследований

2 Синтез многоуровневой системы функционально-геометрических признаков изображений объектов

2.1 Синтез линейных интегро-дифференциальных операторов отображения изображений

2.2 Исследования автокорреляционных фильтров Уолша и оператора формирования локальных признаков

2.3 Характеристики класса автокорреляционных фильтров в базисах ортогональных преобразований

2.4 Выбор оператора формирования признаков объектов и анализ его вероятностных характеристик

2.5 Инженерный расчёт вероятности ложной тревоги и методы её снижения

3 Разработка базовых методов локализации объектов в потоках изображений динамических сцен

3.1 Формальное описание базовых методов с системой функционально-геометрических признаков

3.2 Алгоритмические особенности метода локализации изображений объектов малой протяжённости

3.3 Алгоритмический синтез метода локализации для протяжённых изображений

3.4 Экспериментальные исследования устойчивости и сходимости алгоритмов базового метода

4 Исследование методов повышения допустимой сложности динамических сцен

4.1 Анизотропия операторов отображения как фактор ограничения сложности сцен

4.2 Исследование способов достижения изоморфизма пространств локальных признаков

4.3 Анализ пересечений множеств локальных признаков

4.4 Структурно алгоритмический синтез методов локализации объектов для изображений сложных сцен

5 Теоретические предпосылки обобщения линейных отображений изображений их вэйвлет преобразованием

5.1 Вэйвлет преобразование изображений как способ преодоления неопределённости выбора апертуры фильтров

5.2 Особенности построения дискретного вэйвлет преобразования

5.3 Представление автокорреляционных фильтров Уолша BZ-области

5.4 Разложение квадратичных сплайнов в конечные ряды автокорреляционных функций Уолша

5.5 Представление автокорреляционных функций Уолша степенными сплайнами

6 Синтез дискретных вэйвлет преобразований для формирования локальных признаков изображений

6.1 Z-образы дискретных последовательностей с произвольными степенями децимации

6.2 Исследования дискретного вэйвлет преобразования с квадратичными сплайнами

6.3 Синтез ДВП с повышенными степенями децимации

6.4 Структурно-алгоритмический синтез ДВП с автокорреляционными вэйвлетами Уолша

6.5 Структурный синтез линейных по смещениям операторов множественного отображения

6.6 Обобщённая структура метода локализации объектов в потоках изображений сложных сцен

7 Применение результатов исследований в решении прикладных задач

7.1 Проект телевизионного автоматического визира

7.2 Особенности проектирования АСДН с активным зондированием пространства

7.3 Локализация биоэлектрических сигналов в технике клинических исследований

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Ересько, Юрий Николаевич

Дистанционные исследования объектов и явлений по своей сути являются исследованиями излучаемых и/или отражённых ими физических полей, регистрируемых в удалённой точке наблюдения. Это электромагнитные поля в различных диапазонах длин волн, акустические, радиационные, магнитные и другие, а их выбор определяется целями исследований выбранных объектов и явлений. Регистрируемые интенсивности поля в виде массивов действительных чисел представляют собой первичные данные и содержат информацию об объекте, которую необходимо выделить в процессе их обработки.

Наибольшей информативностью и адекватностью представления данных об объекте исследований обладают системы, которые позволяют массивы первичных данных упорядочить на плоской решётке целочисленных координат. Такие массивы ограниченных размеров обобщённо называют плоскими изображениями той или иной физической природы. Изображения описывают многомерными векторами, матрицами, дискретными функциями двумерных аргументов, а для обозначения их элементов и значений используют обобщающий термин яркостей точек изображения.

Типичные изображения в своём большинстве представляют собой сцены, матрицы которых помимо областей элементов, принадлежащих объекту исследований, содержат области, принадлежащие другим объектам и/или фону. И если одна или несколько характеристик (положение, форма, размеры, распределение яркостей точек) одной или нескольких таких областей функционально зависимы от времени, то соответствующие таким матрицам сцены относят к динамическим. Для представления динамических сцен необходимо уже иметь множество массивов взаимосвязанных данных, упорядоченных по оси дискретного времени и формирующих потоки изображений сцен или, иначе, последовательности кадров изображений. Изучение объектов в потоках динамических изображений сцен позволяет не только снизить искажения результатов, но и получить недоступные в исследованиях по единичным сценам данные об объо екте наблюдения, его эволюциях, о структурных отношениях и динамических связях с другими объектами и наблюдателем. В силу этих возможностей такие исследования объектов вызывают широкий интерес, имеют большое научное и практическое значение.

С задачей дистанционного изучения объектов естественным образом сопряжена задача локализации на сценах их изображений, описываемых эталонами или моделями. Эта задача понимается как выделение изображения интересующего объекта на сцене и определение его координат. Её решение заключается в поиске такой области двумерной функции изображения предъявленной сцены, в которой эта функция соответствует аналогичной функции эталона (модели). При этом оценки координат объекта получают решением системы уравнений или неравенств, составленных из линейных или нелинейных функций от значений и аргументов найденной области функции сцены. Для полученной последовательности оценок выбирают закон сглаживания и экстраполяции координат и подбирают такие его параметры, которые минимизируют целевой функционал в виде функции невязки истинных координат и их оценок.

Решение с должным качеством задачи автоматической локализации изображений объектов на динамических сценах позволяет реализовать в системах дистанционного исследования объектов целый ряд важных функций.

Распознавание объектов. Обеспечивает непрерывную идентификацию объектов, выбранных для исследований, на множестве других объектов сцены.

Оценивание характеристик объектов. Как правило, интересуют площадь, интегральная и максимальная яркости, контраст, текстура, ориентация, относительный масштаб, динамика перемещения и трансформации и др.

Селекция объектов. Обеспечивает выделение других объектов сцены, оценку их характеристик, взаимного влияния, структурных отношений и динамических связей с объектами исследований и наблюдателем. о

Автоматическое сопровождение объектов. Или автоматическое позиционирование изображения исследуемого объекта, как правило, в центре изображения динамической сцены. Реализуется автоматической подстройкой пространственного положения "поля зрения системы" замыканием координатных следящих контуров.

Автоматическое обнаружение объектов. Служит для упрощения функций наблюдателя, либо для замещения этих функций. Применяется для объектов с априорно известными характеристиками и/или с априорно заданными решающими правилами.

Стабилизация поля зрения системы. Обеспечивает дополнительную следящую стабилизацию пространственного положения поля зрения по координатам какого-либо статического объекта сцены.

Адаптация к объектам и условиям наблюдения. Одна из основных и проблемных функций. В общем случае реализуется структурными, алгоритмическими и параметрическими методами адаптации.

Важность и характер приведённых функций дают основания утверждать, что задача автоматической локализации изображений динамических объектов играет центральную роль в решениях объемлющей задачи их дистанционного исследования. Актуальность исследований по совершенствованию и созданию новых методов локализации, как основы повышения качества и функциональных возможностей технических систем дистанционного исследования объектов, дополнительно подчёркивается широтой их практических приложений.

Робототехника. Охватывает системы диспетчирования заготовок в цехах, сортировки деталей на конвейерных линиях, технического контроля готовой продукции, роботизированного автотранспорта, регистрации и поиска автомобилей в транспортных потоках, а также подсистемы ориентации космических аппаратов и другие системы.

Геодезия и картография. Включает системы автоматической регистрации деталей рельефа, точной топопривязки на местности, автоматического счисления пути.

Аэрокосмические исследования ресурсов. В сочетании со спектрозональ-ными методами анализа позволяют автоматизировать прогноз и оценки урожаев, водных и лесных ресурсов, поиск полезных ископаемых, обнаружение природных явлений и аномалий и др.

Метеорология и метеонаблюдения. Включают наземные, воздушные и космические системы автоматического обнаружения метеоявлений, оценки облачных образований, метеорологической дальности видимости.

Военное дело. Включают автоматические и автоматизированные информационно-управляющие и информационно-советующие системы управления, наведения, разведки и обнаружения.

Траекторные измерения. Охватывают информационно-измерительные и информационно-советующие автоматические системы регистрации траекторий метеоракет, исследовательских зондов, глиссад взлёта и посадки самолётов, фигур высшего пилотажа.

Системы видеонаблюдения. Включают автоматические системы охраны территорий, объектов, системы управления движением, контроля аэродромного и автодорожного трафика.

Телевизионная журналистика. Используют автоматизированные системы стабилизации и кадрирования высокодинамичных изображений, изображений при съёмках длиннофокусными объективами или/и при съёмках с движущихся платформ.

Даже краткая характеристика приложений задачи автоматической локализации даёт представление о том, какие высокие требования к качеству и условиям решения задачи предъявляет практика применения технических систем. Реализация этих требований и требований ближайшей перспективы целиком и полностью определяется применяемыми методами и алгоритмами автоматической локализации изображений объектов в динамических сценах.

Ставшие классическими хорошо известные параметрические, корреляционно-экстремальные и признаковые методы позволяют получить удовлетворительные решения задачи локализации изображений для простых сцен, известных или неизменных моделей объекта (иконических, статистических, признаковых). Существенный вклад в теоретическую базу и общую методологию исследований объектов на последовательностях динамических сцен внесли работы учёных А. Розенфельда, JL Хармана, Л.П. Ярославского, Г.П. Шибанова, Д.К. Аггарвала, Л.С. Дейвиса, У.Н. Мартина, T.S. Huang, RJ. Shalkoff, H.H. Красильникова. Создание и развитие теории параметрических методов локализации принадлежит трудам Ф.И. Барсукова, А.И. Величкина, А.Д. Сухарева, К.В. Михалкова, G.M. Flash, P.G. Pens, R.S. Rogers. Корреляционно-экстремальные методы оформились как самостоятельное перспективное направление исследований благодаря работам учёных A.M. Бочкарёва, В.К. Бак-лицкого, А.И. Юрьева, Е.П. Путятина, У.К. Прэтта, Дж. Ту, Р. Гонсалеса, V.V. Vinod, Н. Murase. Теория признаковых методов локализации изображений пог лучила своё развитие в работах Р. Дуды, П. Харта, У. Гренандера, Э. Патрика, Дж. Ту, Р. Гонсалеса, К. Фукунаги, A.JI. Горелика, В.А. Скрипкина, В.Н. Вап-ника, А.Я. Червоненкиса, А.М Айзермана, Э.М. Бравермана, Л.И. Розоноэра, Е. Gose, R. Johnsonbaugh, S. Jost, J.L. Mundy, A. Zisserman, а наиболее перспективные её направления, названные синтаксическими, структурными или лингвистическими методами, разработаны Ю.И. Журавлёвым, К.С. Фу, И.Б. Гуревичем, У. Гренандером, Р. Хараликом.

В рамках этих методов, разработаны и применяются разнообразные методы обновления и нормализации моделей, которые позволяют компенсировать метрическую группу аффинных преобразований изображений объектов (изменения координат, масштабов, поворотов) и тем самым расширяют применимость классических методов. К этим методам относят также беспризнаковые методы распознавания, компенсирующие нелинейные изменения координатной решётки иконической модели объекта. Значительный вклад в совершенствование методов внесли Д. Кейсесент, Д. Псалтис, A.A. Васильев, А. Розенфельд, JI. Роберте, Р. Дуда, П. Харт, М.И. Либенсон, А.Я. Хесин, Б.А. Янсон, Л. Харман, А. Оппенгейм, В.В. Моттль, Р. Шафер, A.B. Ковалевский. Однако, как следует из приведенных выше характеристик приложений, этого недостаточно для решения многих практических задач в реальных условиях наблюдения. Вследствие недостатков методов локализации, приходится ограничивать классы подходящих объектов, вводить дополнительные ограничения на условия применения, что накладывает на них статус узкоспециализированных, проблемно ориентированных методов.

Анализ прикладных задач также показывает, что многие из них неразрывно связаны с локализацией объектов, структура изображений которых в реальной динамической сцене претерпевает существенные изменения на интервале наблюдения. Такие изменения вызваны естественными эволюциями объектов и/или ракурса их наблюдения. Можно утверждать, что естественные изменения изображений объектов в сцене, подлежащих выделению, являются скорее правилом, чем исключением, и часто используемые в известных методах предположения о квазипостоянстве изображений объектов наблюдения малореалистичны.

Изменения изображений искомых объектов есть следствие изначального противоречия между трёхмерными объектами и их плоскими проекциями с наложенными на них рельефами яркости того или иного физического поля. Первичные данные именно таких проекций, или изображения, а не данные самих объектов, подвергаются обработке для получения целевой информации. Противоречие порождает априорную неопределённость анализируемых изображений, нарушение адекватности сопоставления триады объект - модель - область сцены, что в конечном итоге приводит к аномальным погрешностям локализации и срыву автоматического процесса как такового. В таких условиях классические методы локализации изображений либо не дают удовлетворительных решений в принципе, либо поднимают крупные теоретические проблемы. Даже их частичное решение требует существенных компромиссов в классах объектов, их динамике, сложности сцен, мощности их потоков, степени автоматизации процессов, временном масштабе реализации.

Таким образом, проблема изменений изображений исследуемых объектов представляется основной проблемой в решении задач их автоматической локализации в потоках изображений динамических сцен. Проблема существует вне зависимости от применяемых методов локализации. В этом смысле, а также с учётом центральной роли и широты практических приложений задач локализации, проблема характеризуется как крупная.

Настоящая работа посвящена углублению теории и разработке методологии локализации объектов в изображениях динамических сцен в реалистичных условиях изменений изображений этих объектов, наблюдаемых в автоматическом режиме.

В качестве общей теоретической основы решения этой проблемы в работе принята признаковая методология локализации объектов в рамках теории распознавания образов. Такой подход выбран на основании критического анализа других известных методов, который не выявил перспективы удовлетворительного решения основной проблемы в их рамках. Постановка задачи локализации изменяющихся изображений в рамках теории распознавания образов также далеко не стандартна. Она характеризуется двухальтернативным распознаванием, малой (единичной) обучающей выборкой, динамическим образом объекта, пересекающимися по совокупности сцен кластерами альтернативных образов, принятием решений о принадлежности образов по каждой сцене в реальном масштабе времени. Сформулированная таким образом задача выходит за рамки классических методов распознавания, требует пересмотра сложившихся подходов к синтезу признаков, признаковых пространств и решающих правил в силу возникающих проблем и противоречий с постановкой задачи.

В классической теории проблема формирования признаков молчаливо опускается. Ограничиваются лишь обобщёнными рекомендациями, проблему в целом считают «скорее искусством, чем наукой», а её решение практически всегда возлагают на эвристические подходы и интуицию исследователя. Применительно к изображениям, рекомендации сводятся к выявлению структурных различительных признаков, которые минимизируют внутриклассовые расстояния в признаковом пространстве. Противоречие выражается в том, что именно структурные признаки неинвариантны к типичным изменениям изображений объектов в потоках динамических сцен.

В классических методах решающее правило строится на представительной обучающей выборке центральных образов классов и остаётся неизменным в условиях последовательного предъявления образов. Используют, как правило, линейные разделяющие границы классов образов в едином признаковом пространстве и увеличивают его размерность для повышения мощности решающего правила. В рассматриваемой постановке задачи, каждая сцена из их потока одновременно содержит множество выборочных образов разных классов. Разделяющие границы требуется проводить между отдельными образами и изменять их от сцены к сцене. Очередная сцена играет роль, по сути, единственной обучающей совокупности, выдвигая на первый план проблему малой обучающей выборки при коррекции разделяющих границ для следующей сцены. Увеличение размерности признакового пространства, с одной стороны, ограничено проблемой выбора признаков, инвариантных к изменениям изображений объектов, а с другой стороны - опасностью переобучения в условиях малой обучающей совокупности.

Решение основной проблемы локализации изменяющихся изображений, а также проблем и противоречий, вытекающих из постановки задачи в рамках классической теории распознавания образов, привело к необходимости решения важных теоретических вопросов и проведения комплексных исследований. Существо и результаты исследований изложены в семи разделах.

В первом разделе рассматриваются вопросы структурного синтеза и формального описания систем автоматической локализации объектов в потоках изображений динамических сцен (САЛИ). Исходя из формального представления трёхмерных объектов наблюдения и основных функций компонентов систем, формируются обобщённые математические модели датчиков изображений и собственно САЛИ, вводятся целевые функционалы и критерии их выполнения. С позиций полученных моделей и целевых функционалов анализируются параметрические, корреляционно-экстремальные и признаковые методы локализации. Показаны их достоинства и недостатки, установлены методологические ограничения на возможности решения основной проблемы локализации изменяющихся изображений. Предложены концепция построения САЛИ на базе признаковых методов распознавания образов и обобщённая структура системы, реализация которых позволяет разрешить выявленные проблемы. Сформулирована цель и конкретизированы задачи исследований.

Во втором разделе исследуются вопросы аналитического синтеза многоуровневой системы функционально-геометрических признаков (ФГП) изображений объектов. В основу синтеза положены неформальные требования к линейным операторам отображения изображений, предложенная концепция и соответствующая ей структура системы. Исследуются свойства операторов, локальных признаков, признаков объектов. Делаются обобщения полученных ин-тегро-дифференциальных операторов на класс автокорреляционных фильтров в базисах ортогональных преобразований. Рассчитываются вероятностные характеристики помехоустойчивости операторов отображений, проводится сопоставление рассчитанных данных с результатами математического и имитационного моделирования.

Третий раздел посвящён построению методов и алгоритмов локализации изображений объектов, основанных на системе ФГП. Рассматривается построение базовых методов локализации малоразмерных и протяжённых изображений объектов в несложных динамических сценах. Пошаговые процедуры формирования признаковых моделей объектов, локальных решающих функций и обработки изображений в целом, соответствующие предложенным методам, представлены в алгоритмической форме. Приводятся результаты экспериментальных исследований как характеристик признаков, так и устойчивости и сходимости алгоритмов методов в целом.

В четвёртом разделе исследуются возможности повышения допустимой сложности динамических сцен в методах автоматической локализации изображений. Исследуются основные причины, порождающие ограничения на допустимую сложность изображений сцен, предлагаются методологические и алгоритмические решения по ослаблению ограничений. Выявляется возможность и оценивается эффективность введения логических решающих правил при формировании локальных признаков объектов. По результатам исследований, уточняется алгоритмическое описание метода локализации объектов для сложных динамических сцен.

В пятом разделе развиваются теоретические предпосылки обобщения множества операторов линейных отображений, необходимых для повышения допустимой сложности динамических сцен в САЛИ, одномерными вэйвлет преобразованиями изображений. Представление сечений функций изображений одновременно в частотной и временной областях, или их вэйвлет преобразование, рассматривается как необходимое и достаточное средство преодоления априорной неопределённости выбора разрешающей способности автокорреляционных фильтров. Предлагаются и доказываются теоретические утверждения, необходимые для построения новых видов дискретных вэйвлет преобразований, которые были бы согласованы с разработанными методами локализации.

В шестом разделе решаются задачи синтеза алгоритмов и структур вэйвлет преобразований с автокорреляционными вэйвлетами Уолша для группового оператора отображения изображений. Построены и исследованы вэйвлет преобразования с произвольными степенями децимации, с квадратичными сплайнами, степенными сплайнами, пакетное вэйвлет преобразование и избыточное вэйвлет преобразование с автокорреляционными вэйвлетами Уолша. Показано, что интегро-дифференциальные операторы отображений, фильтрация изображений автокорреляционными фильтрами Уолша и соответствующее избыточное вэйвлет преобразование являются частными случаями единого оператора группового дискретного вэйвлет преобразования. Полученные результаты позволили существенно повысить допустимую сложность динамических сцен за счёт ослабления требований к размещению множества объектов на сцене.

В седьмом разделе рассматриваются вопросы применения результатов исследований в решении прикладных задач. Приведены практические примеры структурного проектирования телевизионных автоматических визиров, визира с активными зондирующими сигналами и новое решение задачи совершенствования медицинских информационных систем.

Библиография Ересько, Юрий Николаевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. L.G. Roberts. Machine perception of three dimensional solids. - 1. J.T. Tippet, editor, Optical and Electro-optical Information Processing, MIT Press, 1965, pp. 159- 197.

2. H.H. Красильников. Оптическая теория передачи изображений. М.: Энергия, 1975.-192 с.

3. D. М. Lane. The investigation of a knowledge based system architecture in the context of a subsea robotic application. Ph.D. dissertation, Heriot-Watt University, Scotland, 1986.

4. H.H. Nagel. On the estimation of optic flow: Relations between different approaches and some new results. Artificial Intelligence, 1987, vol. 33, pp. 299-324.

5. K. Rohr. Modelling and identification of characteristic intensity variations. Image and Vision Computing, 1992, vol. 10, no. 2, pp. 66 - 76.

6. Л.П. Ярославский. Введение в цифровую обработку изображений. -М.: Сов. Радио, 1979. 312 с.

7. Image sequence analysis./ Ed. By T.S. Huang. Berlin - Hiedelberg -New-York: Springer - Verlag, 1981.-438 p.

8. R.J. Shalkoff. Digital image processing and computer vision. New York -Brisbane etc.: John Wiley & Sons, Inc., 1989. - 489 p.

9. R. A. Singer, R. G. Sea, K. Housewright. Detection and evaluation of improved tracking filters for use in dense multitarget environments. IEEE Transactions on Information Theory, 1974, vol. IT-20, pp. 423 - 432.

10. D.W. Murray, B.F. Buxton. Scene segmentation from visual motion using global optimization. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1987, vol. 9, no. 2, pp. 220 - 228.

11. G. M. Trimble. Underwater object recognition and automatic positioning to support dynamic positioning. / Proceedings of 7th International Symposium "Unmanned Untethered Submersible Technology". University of New Hampshire, 1991, pp. 273-279.

12. D. Koller, K. Daniilidis, T. Thorhallson, H. Nagel. Model based object tracking in traffic scenes. / Proceedings of Second European Conference on Computer Vision ECCV-92. Springer-Verlag, 1992, pp. 437 - 452.

13. F. Meyer, P. Bouthemy. Region-based tracking in an image sequence. / Proceedings of Second European Conference on Computer Vision ECCV-92. -Springer-Verlag, 1992, pp. 476 484.

14. Дж.К. Аггарвал, Л.С. Дейвис, У.Н. Мартин. Методы установления соответствия при анализе динамических сцен. ТИИЭР, 1981, т. 69, №5, с. 176- 190.

15. Г.П. Шибанов. Распознавание в системах автоконтроля. М.: Машиностроение, 1973.-424 с.

16. Дж. Ту, Р. Гонсалес. Принципы распознавания образов. М.: Мир, 1978.-416 с.

17. Handbook of pattern recognition and computer vision. / Ed. by C.H. Chen, L.F. Pau, P.S Wang. World Scientific Publishing Company, 1993. - 984 P

18. B.B. Chaudhuri, A. Rosenfeld. On a metric distance between fuzzy sets. -Pattern Recognition Letters, 1996, vol. 17, no. 11, pp. 1157 1160.

19. Д. Кейсессент, Д. Псалтис. Новые методы оптических преобразований для распознавания образов. ТИИЭР, 1977, т. 65, №1, с. 92 - 100.

20. А.А. Васильев. Перестраиваемые пространственные фильтры в устройствах преобразования оптических сигналов. Квантования электроника, 1977, №8, с. 38 - 49.

21. M.W. Koch, R.L. Kashyap. Using polygons to recognize and locate partially occluded objects. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1987, vol. PAMI-9, pp. 485-494.

22. F. Leymarie, M. D. Levine. Tracking deformable objects in the plane using an active contour model. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1993, vol. 15, no. 4, pp. 617 - 634,.

23. P. Delagnes, J. Benois, D. Barba. Active contours approach to object tracking in image sequences with complex background. Pattern Recognition Letters, 1995, vol. 16, pp. 171 - 178.

24. D. Geiger, A. Gupta, A. Costa, J. Vlontzos. Dynamic programming for detecting, tracking, and matching deformable contours. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, vol. 17, no. 3, pp. 294 -303.

25. M.H. Hueckel. An operator which locates edges in digitized pictures. -Journal of the Association for Computing Machinery, 1971, vol. 18, no. 1, pp. 113-125.

26. D. Marr, E.C. Hildreth. Theory of edge detection. Proceedings of the Royal Society, London, 1980, vol. B-207, pp. 187-217.

27. L. Kitchen, A. Rosenfeld. Gray-level corner detection. Pattern Recognition Letters, 1982, vol. 1, pp. 95 - 102.

28. R.M. Haralick. Digital step edges from zero crossing of second directional derivatives. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1984, vol. 6, no. 1, pp. 58 - 68.

29. А. Розенфельд. Нелинейный метод обнаружения ступенчатого сигнала. ТИИЭР, 1970,т. 58, № 6, с. 94 - 95.

30. JT. Роберте. Автоматическое восприятие трёхмерных объектов. / В сб. Интегральные роботы. М.: Мир, 1973, т. 1, с. 162 - 208.

31. Р. Дуда, П. Харт. Распознавание образов и анализ сцен. М.: Мир, 1976.-512 с.

32. I. Sobel. An isotropic 3x3 image gradient operator. / In H. Freeman, editor, "Machine Vision for Three-Dimensional Scenes". Academic Press, 1990, pp. 376-379.

33. R.M. Haralick, L.G. Shapiro. Image segmentation techniques. Computer Vision, Graphics, and Image Processing, 1985, vol. 29, pp. 100 - 132.55.