автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Адаптивно-динамическая сегментация и семантическая селекция видеоданных

кандидата технических наук
Зайцева, Александра Алексеевна
город
Санкт-Петербург
год
2009
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Адаптивно-динамическая сегментация и семантическая селекция видеоданных»

Автореферат диссертации по теме "Адаптивно-динамическая сегментация и семантическая селекция видеоданных"

На правах рукописи

ЗАЙЦЕВА Александра Алексеевна

АДАПТИВНО-ДИНАМИЧЕСКАЯ СЕГМЕНТАЦИЯ И СЕМАНТИЧЕСКАЯ СЕЛЕКЦИЯ ВИДЕОДАННЫХ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (технические системы)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург

2009 ^ ол-Л

003477769

Работа выполнена в Учреждении Российской академии наук Санкт-Петербургском институте информатики и автоматизации РАН (СПИИРАН).

Научный руководитель: доктор технических наук, профессор, залуженный деятель

науки и техники РФ Александров Виктор Васильевич

Официальные оппоненты: доктор технических наук, профессор

Тимофеев Адиль Васильевич

кандидат технических наук, Турнецкий Леонид Сергеевич

Ведущая организация: Санкт-Петербургский Государственный Политехнический Университет

Защита состоится «_/5_» октября 2009 г. в 12 часов 30 минут на заседании диссертационного совета Д.002.199.01 при Санкт-Петербургском институте информатики и автоматизации РАН по адресу: 199178, Санкт-Петербург, В. О., 14 линия, 39.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского института информатики и автоматизации РАН

Автореферат разослан « » 2009 г.

Ученый секретарь

диссертационного совета Д.002.199.01

кандидат технических наук Ронжин Андрей Леонидович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации. Актуальность темы диссертационной работы в первую очередь определяется её ориентацией на важную практическую проблему эффективного анализа семантических составляющих на видеоданных и изображениях. Традиционные подходы к решению задач сегментации видеоданных с целью селекции и распознавания образов не покрывают такие проблемы как видеонаблюдение, например face-control, а также передача в реальном времени больших объемов видеоданных с одновременной локализацией и семантическим описанием объекта. До сих пор обработка изображений в большей степени использовала математические модели, основанные на спектральном -интегральном анализе, которые сводятся к числовой обработке и выявлению специфических признаков. Однако развитие компьютерных технологий привело к расширению класса прикладных задач анализа видеоданных, появлению таких задач как: визуализация пространственных объектов в реальном времени, создание растрового покрытия территорий в неогеографии, управление беспилотными летательными аппаратами, требующее постоянного развития алгоритмов поиска цели, для которых необходимо решение задач селекции, идентификации объектов по семантическому содержанию, в том числе и современных проблем кодировки и сокрытия данных, а также выявления различных уровней семантического содержания.

Различные аспекты обработки и анализа изображений и видеоданных рассмотрены в работах Ю.И Журавлева, В.В. Александрова, Н.Д. Горского, В.В. Поповича, Д.Сэломона, Д. Ватолина, А. Ратушняка, М. Смирнова, В. Юкина, и многих других.

Возможности программируемой технологии и семантического анализа позволяют эффективно решать задачи, поставленные динамично развивающимися современными Hi-tech (высокими) технологиями. В данной работе предлагаются решения в области сегментации видеоданных для комплексного решения проблемы семантического анализа.

Цель работы и задачи исследования. Исследование и разработка иерархической структуры представления видеоданных, методов сегментации с целью выявления семантических фрагментов и интерфейса поиска ассоциативных семантических связей.

Для достижения поставленной цели в диссертационной работе решаются следующие задачи:

1. Исследование и разработка метода адаптивно-динамической сегментации.

2. Разработка алгоритма и программы многоуровневой древовидной сегментации изображения для выявления семантического порога г-идентифицируемости.

3. Разработка программы адаптивного поиска и локализации семантических фрагментов.

4. Экспериментальная апробация программно-инструментальной среды для выявления понятийных семантических составляющих.

Методы исследования. Для решения поставленных задач в работе используются цифровые технологии, математические модели итерационно-функциональных систем (рекурсивно-фрактальный подход) и инфологические методы. Компьютерная реализация разработанных алгоритмов производилась с использованием объектно-ориентированного программирования.

Положения, выносимые на защиту:

1. Метод «коллажа» как индексация древовидной структуры видеоданных, сохраняющая локально-пространственную (пиксельную) и семантическую идентификацию.

2. Алгоритм и программы адаптивно-динамической сегментации изображения. Селекция и идентификация семантических фрагментов.

3. Программа адаптивной интерфейсной поддержки индексации семантических фрагментов.

4. Оценка критерия качества изображения с позиции семантической б-идентифицируемости.

Научная новизна работы состоит в следующем:

1. Предложен метод «коллажа» для представления изображений и их фрагментов в виде индексной древовидной структуры данных, сохраняющей локально-пространственную и семантическую идентификацию, в отличие от известных интегральных методов (Фурье- и вейвлет-анализ и др.).

2. Разработаны алгоритм и программы многоуровневой древовидной индексации видеоданных, использующие адаптивно-динамическую сегментацию, обеспечивающую семантическую селекцию и индексную идентификацию фрагментов.

3. Разработана программа интерфейсной адаптивной поддержки выявления семантических фрагментов изображения, позволяющая представить исходное изображение как совокупность семантических фрагментов (метод коллажа).

4. Предложено использовать понятие е-идентифицируемости (эквивалентности) для оценки качества семантического восприятия в отличие от энергетических характеристик оценки качества изображения, таких как среднеквадратическое отклонение (СКО), пиковое отношение сигнала к шуму (РБИЯ) и др.

Обоснованность и достоверность научных положений, основных выводов и результатов диссертации обеспечивается опорой на математические модели интегральной геометрии, анализом исследований в

данной области, корректность предложенных алгоритмов подтверждается экспериментальной апробацией разработанных методов, а также апробацией основных теоретических положений диссертации в печатных трудах и докладах на научных конференциях.

Практическая ценность работы. Разработанные модели и алгоритмы позволяют расширить круг решаемых проблем обработки видеоданных:

1. выявления различных семантических уровней, что позволяет решать задачу компрессии с точки зрения семантико-смыслового восприятия;

2. локализации и семантического описания объектов при видео наблюдении, передаче видеоданных в реальном времени.

Для решения перечисленных проблем разработана инструментальная среда адаптивно-динамической сегментации для семантического анализа видеоданных. Программа адаптивной интерфейсной поддержки позволяет реализовать функции визуализации семантических фрагментов.

Реализация результатов работы. Полученные результаты реализованы в виде прикладных программных продуктов. Ряд программных продуктов был внедрен в виде составных фрагментов НИР в 2004-2008 при выполнении контрактов с ГОС НИИПП. Исследования, отраженные в диссертации были поддержаны грантами ОИТВС РАН (№4.8, 2003-2006), часть результатов была использована в проектах СПбНЦ РАН, 2003-2005.

Апробация результатов работы. Основные положения и результаты диссертационной работы представлялись на конференциях «Региональная информатика» (2000, 2004, 2008 гг.), «Информационные технологии и системы (ИТиС'08)», «Distributed Intelligent Systems and Technologies Workshop» (2009).

Публикации. Основные результаты по материалам диссертационной работы опубликованы в 10 печатных работах, среди них 3 работы в журналах из перечня ВАК.

Структура и объем работы. Диссертация объемом 125 машинописных страниц, содержит введение, четыре главы и заключение, список литературы (97 наименований), 2 таблицы, 47 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы диссертации, дается обзор современного состояния дел исследуемой проблематики, определяются объект и предмет исследования, сформулирована цель работы, описана ее структура и представлены положения, выносимые на защиту.

В первой главе рассматриваются различные подходы к обработке видеоданных. Для различных задач: видеонаблюдения, селекции целей и передачи видеоданных, например, беспилотным летательным аппаратом, и

принятия решения в реальном времени возникает потребность управлять битовым объемом данных.

Проблема заключается в том, что с развитием технологий постоянно увеличивается объем данных и возникает потребность в компрессии и целевой обработке данных. Традиционные методы обработки видеоданных (спектральные) не отвечают современным требованиям целевых задач. Компьютерные методы компрессии изображений на примере различных протоколов и форматов продемонстрировали необходимость адаптации качества хранимых и передаваемых видеоданных к различным задачам, например tiff - для типографий и jpeg - для компрессии и быстрой передачи изображений.

Известные подходы (MPEG, AVI, Д. Ватолин, А. Ратушняк, В.Юкин, S. G. Mallat, P. J. Burt, Е. Н. Adelson, D. Zhang, G. Lu), используя интегральные спектральные методы, ориентированы на обработку всего пиксельного объема данных, например с выхода видеокамеры. При этом критерием качества является среднеквадратическое отклонение (СКО), которое никак не связано с семантическими фрагментами на изображении. Поэтому популярный компрессатор MPEG-4 эмпирически выставляется на некий средний критерий качества при передаче видеоданных.

В данной работе предлагается адаптивно-динамическая сегментация (АДС) которая позволяет от попиксельного представления исходного изображения (видеоданных) перейти к послойной с разной степенью качества передаче изображения. Это позволяет, во-первых, выявить слой, достаточный для восприятия и распознавания заданных целей на изображении, во-вторых, выявить фрагменты, несущие семантическое содержание.

В этом случае принципиально возможно перейти от изображения к текстуальному его описанию, а следовательно осуществлять поиск изображений по понятийному семантическому описанию. В интернет-среде известны попытки реализации подобного механизма поиска.

Задача селекции семантических фрагментов сводится к поиску сегментов на различных слоях представления изображений, в которых содержатся сегменты или их совокупность, несущие семантическое содержание. Объединения таких сегментов называем семантическими фрагментами.

Во второй главе проводится исследование и разработка методов обработки изображений, основанных на АДС.

Адаптивно-динамическая сегментация состоит из этапа послойного представления исходного изображения («пиксельное» представление) с постепенным выделением слоев с разным значением б, где е задается в зависимости от целей решаемых задач, то есть допустимого загрубления качества исходного изображения. Таким образом формируются в-слои, происходит переход от пиксельного к сегментному представлению.

Следующий этап - выявление семантических фрагментов, которые формируются из различных сегментов различных слоев. При обработке изображений и видео семантическая идентификация основана на выявлении семантических понятий из двух- или трехмерной структуры представления данных (рис.1).

Рис. I. Индексная адресация и семантическая идентификация.

На рис. 2 приведен пример АДС изображения при редуцировании (детализации) до некоторого уровня, на котором еще сохраняется узнавание, позволяющее принять решение об идентификации объекта на изображении. Рисунки I, 2 иллюстрируют принципиальную возможность как компрессии исходного изображения, так и семантического узнавания -идентификации. Математическая модель предлагаемого подхода основана на теореме о «коллаже».

1=150 N=¡34

Рис. 2. Фрагментарные - семантические слои изображения.

Теорема. Пусть /- непустое компактное множество (исходное (попиксельное) изображение); ТиТ2,...,Тт - сжимающие отображения с

коэффициентами сжатия соответственно; Е - аттрактор

итерационно-функциональной системы (ИФС), связанной с этими

отображениями, и 5 = . Тогда, если для некоторого 8 >0 выполняется неравенство

то

1-5

Это формализованный критерий останова, т.е. близости исходного и фрагментарного изображений.

«Точка» Х(] - исходный информационный объект (изображение) I,

«неподвижная точка» ху - аттрактор Е, а (1(х0,х1) - метрика Хаусдорфа

- есть не что иное, как оператор формирования подмножеств (фрагментарных слоев)

нц^т)'

2

отсюда следует, что теорема о коллаже справедлива лишь при / е Р .

Математическая модель (коллажа) оптимальна для выявления подмножеств Тп однако в соответствии с критерием (¡(х0,х,) (метрикой

Хаусдорфа) «похожесть» исходного изображения и коллажа не учитывает специфику и семантику исходного изображения.

В работе показано, что метод адаптивно-динамического представления видеоданных и изображений вытекает из структуры вычислений итерационно-функциональной системы (теорема о коллаже).

Разработанный метод АДС работает от обратного: при е = 0 имеем исходное «попиксельное» представление изображения, увеличивая значение е, переходим к «послойным» изображениям. Каждый слой отражает е-уровень (качество) по отношению к исходному. Заданное значение е несет качественную характеристику «загрубления» исходного изображения объединением значений пикселов в сегменты (по слоям) в соответствии с уровнем е.

Приведем схему адаптивно-динамической сегментации. Пусть исходное изображение /* представлено в виде матриц пикселов размером а х Ъ ■ Алгоритм выполняет несколько разбиений исходного изображения на фрагменты:

реП„

Каждый фрагмент иг-го разбиения обозначается как Р™. Первый уровень разбиения представляет собой множество Ц={рр}> в котором каждый фрагмент F соответствует отдельному пикселу | Ь\ |= аЬ ■ Из механизма построения разбиений очевидно, что

1^255 И

Для каждого реОт существует ц е Дл41, такой что с. Р"*'. Этот

алгоритм похож на подобие теоремы о коллаже; его критерий останова АДС - это семантический поиск при шах е, не требующий полного перебора при 5-»0. Величины <| Ц [,| Ь21,...,| Ь255 1> имеют степенной закон

распределения измеряемых параметров пикселов.

Для описанного алгоритма возможна следующая интерпретация. Выбирается на изображении любая точка (пиксел) и, начиная с нее, расплывается «чернильное» пятно, последовательно захватывая соседние точки, если их перепад яркости не превышает некоторый заданный порог £. В результате формируются сегменты однородной яркости. Совокупное множество сегментов не зависит от выбора начальных точек, а определяется выбором последовательности устанавливаемых порогов. Исходное изображение - в равно нулю; при 8=256 все пикселы имеют одинаковые значения яркости. Итеративно меняя значение е, изображение разбивается на множество сегментов, адаптивно выявляя соответствующие семантические фрагменты. Внутри каждого сегмента проводится осреднение по яркости, и цикл обработки повторяется до тех пор, пока на изображении все локальные яркостные перепады не превысят е. Затем порог е увеличивается и процедура повторяется.

Послойное представление изображения позволяет реализовать принцип интерактивного операторного принятия решения за счет выбора слоя, наиболее адекватно соответствующего конкретной задаче (селекции цели, узнавания, идентификации и аутентификации). Иерархическое послойное представление с сохранением всех слоев служит универсальным для решения ряда задач, условия которых заранее неизвестны (меняющиеся виды объектов, тип камеры, условия освещенности и др.).

Для апробации работы метода АДС для селекции семантических фрагментов были проведены эксперименты по выделению семантически значимых участков (области интереса) на различных типах растровых изображений с фиксированным значением параметра порога с-идентифицируемости.

Пример работы, приведенный на рис. 3, показывает устойчивое выделение семантических фрагментов {сегментов, имеющих повышенную сложность) на фотографиях с большим количеством мелких деталей на заднем фоне. На рис, 3,а приведено исходное изображение, на рис. 3,6 — сумма исходного изображения и маски, определяющей область семантического фрагмента.

Разработанный метод АДС, в отличие от используемых алгоритмов поиска границ (дифференциальный оператор), обладает нечувствительностью к шуму, т.е. при его использовании выделения шума не наблюдается (пример использования алгоритма поиска границ приведен для сравнения на рис. 3, в).

Использование результатов выделения семантически значимого участка для динамического управления степенью компрессии позволяет уменьшать объем компрессированного изображения в два раза.

Совокупность полученных экспериментальных результатов показывает применимость описанного метода для объектной локализации в задачах селектирования семантических фрагментов на изображениях.

Результат обработки изображения с использованием АДС и динамической компрессии на этапе предобработки приведен на рис. 4. Компрессия производится за счет снижения точности пикселов в областях изображения, не несущих семантической нагрузки. 35% - те пикселы, которые передаются с исходной точностью (е=0); 65% пикселов передается с качеством е>0.

а б в

Рис. 3, Пример работы алгоритма на изображении с несколькими семантическими фрагментами: а - исходное изображение, б - пример работы АДС, в - пример работы стандартного алгоритма поиска границ.

АДС обеспечивает как прямую адресацию изображения (по пикселам), так и обратную индексную адресацию (по фрагментам изображения), в отличие от традиционной компрессии, управляемой критерием СКО.

Рис. 5. Формирование семантических фрагментов на тестовом изображении.

abe Рис. 4. Иллюстрация результатов работы алгоритма пирамидального представления изображений: а - исходное изображение, объем 100%, б -

изображение после обработки, объем (0.35+ 0.б5/т|)х 100%, где г) -коэффициент сжатия, зависящий от £, в - пример традиционного сжатия JPEG при объеме, равном объему (б).

Критерий е-идентифицируемости АДС изображений использован для выявления понятайных фрагментов. На рис. 5 приведен пример формирования семантических фрагментов на разных слоях для тестового изображения «дерево».

Такое представление видеоданных и изображений позволяет использовать £ как критерий качества семантического восприятия при различных уровнях представления изображения. Критерий е-и д ент ифи ц и р уемости (эквивалентности) используется для поиска семантических фрагментов на разных уровнях индексации.

В третьей главе рассматриваются вопросы, посвященные разработке интерфейс но й поддержки выявления семантических фрагментов изображений и видеоданных. Программа предназначена для интерфейсного поиска и шкалитцич семантических фрагментов с помощью многоуровневой адаптивно-динамической сегментации на основе е-идентифицируемо ста.

Такой подход структурного представления изображения позволяет использовать как априорную информацию о требуемом качестве обработки

и передачи видеоданных (например, распознавания цели беспилотного летательного аппарата) операторный режим управления е, и адаптивный метод выявления фрагментарных семантических составляющих. Фрагменты определяются объединением различных сегментов как внутри слоя, так и между слоями.

Априорная информация о цели селектируемого семантического фрагмента значительно упрощает процесс выявления фрагментарных составляющих в комбинаторном поиске сегментов на слоях.

Разработанный интерфейс обеспечивает построение и наглядную визуализацию дерева сегментов для изображений, а также автоматизированное выделение семантических фрагментов на изображениях, соответствующих узлам построенного дерева. Управляя степенью е-идентифируемости интерфейс позволяет выводить изображения послойно с различной степенью точности представления. Для разработанной программы е-идентифицируемость есть эквивалент точности представления, то есть является критерием оценки качества изображений. Схема обработки изображения в разработанной программе интерфейсной поддержки выявления семантических фрагментов изображений приведена на рис. 6. Обратная связь иллюстрирует итерационный процесс интерфейсной поддержки.

Рис. 6. Схема обработки изображения в программе интерфейсной поддержки выявления семантических фрагментов изображений.

Практическая польза разработанной программы интерфейсной поддержки в первую очередь определяется ее ориентацией на проблему эффективного и экономичного хранения и обработки больших объемов видеоданных. Фактически программа ориентирована на выделение и сохранение семантических составляющих изображения в процессе его компрессии и структуризации.

На рис. 7 приведен пример работы программного интерфейса для одного из тестовых изображений, где последовательно при сегментации устраняется не содержащие семантику элементы.

Рис. 1. Пример работы программы интерфейсной поддержки выявления семантических фрагментов для тестового изображения «самолет».

В главе 4 производится оценка эффективности методов адаптивно-динамической сегментации и выявления семантических фрагментов для операторного управления выбором г-разрешающей способности, позволяющей для хранения и передачи видеоданных использовать меньшую полосу пропускания, а также значительно увеличивать скорость принятия решения.

Распознавание и идентификация объектов последовательно опирается на селекцию и идентификацию на изображении семантических объектов. Под идентификацией в данном случае понимается присвоение выявленному фрагменту на изображении семантики-имени объекта. Оператор в процессе селекции и семантической идентификации присваивает ассоциативные метки-имена — результат процесса наблюдения, восприятия и распознавания. Автоматические системы, решающие проблемы распознавания, прежде всего, должны быть ориентированы на процесс семантической селекции и идентификации распознаваемых объектов.

Для объективной оценки эффективности разработанных методов в работе используется величины СКО и PSNR (peak signal-to-noise ratio) — пиковое отношение сигнала к шуму, которое обозначает соотношение между максимумом возможного значения сигнала и мощностью шума, искажающего значения сигнала. Поскольку многие сигналы имеют широкий динамический диапазон, PSNR обычно измеряется в логарифмической шкале в децибелах.

PSNR наиболее часто используется для измерения уровня искажений при сжатии изображений. Проще всего его определить через

среднеквадратичное отклонение (СКО), которое для двух монохромных изображений I и К размера тхп, одно из которых считается зашумленным приближением другого, вычисляется так:

1 т-\п~1 .

тп ¿=07=0

PSNR определяется так:

PSNR = 101og,o

f MAXj') _ (MAX A

СКО

v

= 201og10!

■J СКО J

где MAXj - нормировочный коэффициент - максимальный размах амплитуды, заданный разрядностью изображения. При разрядности пиксела 8 бит, MAXj = 255. Типичные значения PSNR для сжатия изображений лежат в пределах от 30 до 40 dB. Большему значению PSNR соответствует лучшее качество изображения на фоне шума.

Для цветных изображений с тремя компонентами RGB на пиксел применяется такое же определение PSNR, но СКО считается по всем трем компонентам (и делится на утроенный размер изображения).

Адаптивно-динамическая сегментация с точки зрения выявления семантических фрагментов имеет иной смысл оценки качества, чем искусственные оценки качества по интегральной энергетической характеристике PSNR.

Для изображений, содержащих семантические фрагменты, всегда существует возможность значительной их компрессии. Подход АДС обеспечивает изменение количества семантических фрагментов на разных уровнях. Для различных семантических фрагментов существуют свои слои е-идентифицируемости. Критерий качества представления изображения относится к каждому отдельному слою, который отображает исходное изображение с определенной е-разрешающей способностью.

Интерфейсная программа позволяет интенсифицировать процесс на основе априорного задания целевых функций.

Например, цель выявления баннеров априорно определяет критерий качества представления изображения. Если исходное изображение -совокупность пикселов - абстрактно является битовой характеристикой объема данных, то программный интерфейс АДС представляет для разных целей семантическую селекцию содержания изображения.

Слово «адаптивный» говорит об организации процесса подбора е-слоя, на котором возможно выделение нужных семантических составляющих. Фрагменты - замкнутые области пикселей, амплитудные значения которых , лежат в е-окрестности на разных уровнях. Семантическая составляющая может собираться из разных сегментов как на одном уровне, так и между уровней, что сводит традиционное распознавание образов к организации процесса узнавания семантической составляющей (голова, туловище, волосы, глаза).

Анализ амплитудных и цветовых значений пикселей для различных классов изображений показал, что их распределение подчиняется закону, названному «законом развития», который позволяет интенсифицировать процесс выявления семантически значимых фрагментов на изображении.

В таблице 1 приведено сопоставление СКО при оценке критерия семантической идентифицируемости (СКО( АОБ(1,г), АйБ(1,е — &£))) и СКО, вычисленного между исходным изображением и изображением на е-слое (СКО( А08((1,е),1)). Здесь I - исходное изображение, А05(1,г) -результат обработки изображения на е-слое, АВВ{1, е - Ае) - результат обработки изображения на (8 —Де)-слое. Выделенная на графике точка К является критерием кластеризации, т.е. точкой выявления семантического контента на изображении. Различные уровни (слои) представления исходного изображения (е=0) отождествляются с выбранными в автоматическом или операторном режиме программой АДС значениями е. К— пороговое значение е выявления семантики объекта. Поведение изменения кривых межуровневого СКО(АС>|£(/,е),ЛД5(/,Е-Де) и СКО(АОБ((1,ъ),Г) показано на рис. 8 и 9, там же иллюстрируется критерий семантической идентифицируемости, т.е. выбор уровня е-иденгифицируемости и соответствующая среднеквадратическая ошибка.

Таблица 1. Оценка качества изображений по е-уровням, СКО и РБКЯ.

значение е тестовое изображение «самолет»

число сегментов CKO(ADS((I, е), /)) PSNR CKO(ÂDS(I.t), ADS(I,t - Де))

0 54983 0 0 0

32 946 12,464 21.90 12,464

64 298 28,044 19.65 26,269

96 119 39,145 18,77 39,513

128 92 67,582 15,85 78,462

160 42 84,831 17.19 88,236

192 51 86,44 17.23 19,141

224 1 91,453 17,55 29,988

256 1 91,453 17,55 0

значение е тестовое изображение «дерево»

число сегментов СКО PSNR дско

0 53680 0 0 0

32 1703 18,74 25.01 18,74

64 299 44,649 17.45 38,288

96 153 44,449 17.46 70,928

128 588 40,498 18.30 62,487

160 87 53,222 15.90 41,836

192 1 57,563 15.22 21,608

224 1 57,563 13,84 0

256 1 57,563 13,84 0

исходное изображение, е-0 изображение е «точке перегиба»

при £=/60

Рис. 8, График зависимости СКО от значений £ и слой изображения, на котором еще сохраняется узнавание для тестового изображения «Самолет».

исходное изображение, е—0 изображение в «точке перегиба»

при £-96

Рис. 9. График зависимости СКО от значения е и слой изображения, на котором еще сохраняется узнавание для тестового изображения «Дерево».

ЗАКЛЮЧЕНИЕ

Совокупность сформулированных и обоснованных в диссертационной работе положений, а также ее практические результаты представляют собой решение актуальной задачи разработки методов адаптивно-динамической сегментации и семантической селекции изображений и видеоданных. Получены следующие научные и практические результаты:

1. Проведены исследования современного состояния проблемы семантического анализа видеоданных.

2. Предложен метод «коллажа» как индексная древовидная структура данных, сохраняющая локально-пространственную и семантическую идентификацию, в отличие от известных интегральных (Фурье- и вейвлет-анализ) методов представления изображений и их фрагментов.

3. Разработаны алгоритм и программы многоуровневой древовидной индексации описания изображения, использующие адаптивно-динамическую сегментацию.

4. Показано, что адаптивно-динамическая сегментация приводит к семантической селекции и индексной идентификации фрагментов.

5. Разработана программа интерфейсной поддержки выявления семантических фрагментов изображения, что приводит к представлению исходного изображения как совокупности семантических фрагментов (метод «коллажа»).

6. Разработан критерий «s-идентифицируемости» (эквивалентности) как критерий качества семантического восприятия, в отличие от традиционного подхода, использующего при оценке качества представления изображения среднеквадратическое отклонение, пиковое отношение сигнала к шуму (PSNR) и др.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Зайцева А. А. Метод и алгоритмы реализации адаптивно-динамической сегментации изображений. — «Информационно-измерительные и управляющие системы», №4, 2009 — С. 16-19. -(из перечня ВАК)

2. Кулешов С. В., Зайцева A.A., Аксенов А.Ю. Ассоциативно-пирамидальное представление данных. — «Информационно-измерительные и управляющие системы», №4, т. 6, 2008 — С. 1418. - (из перечня ВАК)

3. Кулешов С. В., Зайцева А. А. Селекция и локализация семантических фрагментов. «Информационно-измерительные и управляющие системы», №10, т. 6, 2008. — С. 88-90.- (из перечня ВАК)

4. Александров В. В., Кулешов С. В., Цветков О. В., Зайцева А. А. Концепция и теория нанотехнологии физической среды инфотелекоммуникации (прототип SDR) // Труды СПИИРАН., Вып. 6. — СПб.: Наука, 2008. — С. 51-57.

5. Кулешов C.B., Зайцева A.A. Локализация семантических блоков на растровых изображениях без предварительного обучения. // Информационные технологии и системы (ИТиС'08): сборник трудов конференции. - М.: ИППИ РАН, 2008. - С. 468-470.

6. Александров В.В., Александрова В.В., Зайцева A.A. Цифровая программируемая "нано" цивилизация. Электронный мозг — будущее уже здесь! // Труды Вторых Всеросийских научных чтений "Будущее сильной России - в высоких технологиях" — ООО "Издательство "Логос", СПб, 2008. — С. 20-27.

7. Кулешов С. В., Аксенов А. Ю., Зайцева А. А., Идентификация факта компрессии с потерями в процессе обработки изображений // Труды СПИИРАН. Вып. 5. — СПб.: Наука, 2007 — С. 60-65.

8. Кулешов С. В., Зайцева А. А., Аль-рашайда Хасан. Выявление несанкционированных вставок в видеопотоке методом ранговых распределений // Труды СПИИРАН. Вып. 3, т. 2. — СПб.: Наука, 2006 —С. 96-101.

9. Зайцева A.A. Методы — свойства и ограничения при построении стандартов передачи и хранения видеоданных II Труды СПИИРАН. Вып. 2 , том 2 — СПб: "Наука", 2005 — С. 191-200.

10. Зайцева А. А. Ассоциативная идентификация. — Труды СПИИРАН, вып. 1, т. 3, СПб, 2003 — С. 118-125.

11. Александров В. В., Зайцева А. А., Харинов М. В., Цветков О. В. Концепция динамического выделения семантических компонент аудиовизуального потока данных// Проблемы информатизации: теоретич. и научно-практич. журнал / РАН, Министерство науки и технологий РФ. — М. 2001. - Вып.З. — С. 45-48.

Издательство ООО «Анатолия» 199178, Санкт-Петербург, В.О., 14-я линия, 39 Подписано в печать 08.09.2009 г. Формат 80x84 1/16. Тираж 100

Оглавление автор диссертации — кандидата технических наук Зайцева, Александра Алексеевна

Основные обозначения и сокращения.

Введение.

Положения, выносимые на защиту.

Глава 1. Аналитический обзор методов обработки видеоданных.

1.1. Интегральные методы анализа изображений.

1.1.1. Преобразование Фурье. Алгоритм JPEG.

1.1.2. Вейвлет-анализ.

1.1.3. Кратноразрешающий анализ. JPEG 2000.

1.2. Метод и алгоритмы цифровой обработки видеоданных.

1.2.1. Алгоритмы и форматы цифрового представления изображений .:.

1.2.2. Форматы сжатия и хранения видеоданных.

Выводы по главе 1.

Глава 2. Метод и алгоритмы адаптивно-динамической сегментации изображений.

2.1. Дискретные методы обработки изображений.

2.1.1. Динамическая модель дискретного пространства.

2.1.2. Метод коллажа. Итерационно-функциональный подход.

2.1.3. Адаптивно-динамическая сегментация (АДС) изображений.

2.2. Концептуальная схема АДС.

2.3. Критерий оценки качества изображения.

2.4. Алгоритмы адаптивно-динамической сегментации.

2.4.1. Дизъюнктивная сегментация.

2.4.2. Конъюнктивная сегментация.

Выводы по главе 2.

Глава 3. Разработка программной среды интерфейсной поддержки селекции семантических фрагментов.

3.1. Описание метода интерфейсной поддержки.

3.2. Автоматический режим.

3.3. Операторный режим.

Выводы по главе 3.

Глава 4. Экспериментальная апробация.

4.1. Селекция семантических фрагментов.

4.2. Оценка качества передачи видеоданных.

4.3. Оценка качества восприятия изображений.

Выводы по главе 4.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Зайцева, Александра Алексеевна

Актуальность темы диссертации. Актуальность темы диссертационной работы в первую очередь определяется её ориентацией на важную практическую проблему эффективного анализа семантических составляющих на видеоданных и изображениях. Традиционные подходы к решению задач сегментации видеоданных с целью селекции и распознавания образов не покрывают такие проблемы как видеонаблюдение, например face-control, а также передача в реальном времени больших объемов видеоданных с одновременной локализацией и семантическим описанием объекта. До сих пор обработка изображений в большей степени использовала математические модели, основанные на спектральном — интегральном анализе, которые сводятся к числовой обработке и выявлению специфических признаков. Однако развитие компьютерных технологий привело к расширению класса прикладных задач анализа видеоданных, появлению таких задач как: визуализация пространственных объектов в реальном времени, создание растрового покрытия территорий в неогеографии, управление беспилотными летательными аппаратами, требующее постоянного развития алгоритмов поиска цели, для которых необходимо решение задач селекции, идентификации объектов по семантическому содержанию, в том числе и современных проблем кодировки и сокрытия данных, а также выявления различных уровней семантического содержания.

Различные аспекты обработки и анализа изображений и видеоданных рассмотрены в работах Ю.И Журавлева, В.В. Александрова, Н.Д. Горского, В.В. Поповича, Д.Сэломона, Д. Ватолина, А. Ратушняка, М. Смирнова, В. Юкина, и многих других.

Возможности программируемой технологии и семантического анализа позволяют эффективно решать задачи, поставленные динамично развивающимися современными Hi-tech (высокими) технологиями. В данной работе предлагаются решения в области сегментации видеоданных для комплексного решения проблемы семантического анализа.

Цель работы и задачи исследования. Исследование и разработка иерархической структуры представления видеоданных, методов сегментации с целью выявления семантических фрагментов и интерфейса поиска ассоциативных семантических связей.

Для достижения поставленной цели в диссертационной работе решаются следующие задачи:

1. Исследование и разработка метода адаптивно-динамической сегментации.

2. Разработка алгоритма и программы многоуровневой древовидной сегментации изображения для выявления семантического порога е-идентифицируемости.

3. Разработка программы адаптивного поиска и локализации семантических фрагментов.

4. Экспериментальная апробация программно-инструментальной среды выявления понятийных семантических составляющих.

Методы исследования. Для решения поставленных задач в работе используются цифровые технологии, математические модели итерационно-функциональных систем (рекурсивно-фрактальный подход) и инфологические методы. Компьютерная реализация разработанных алгоритмов производилась с использованием объектно-ориентированного программирования.

Научная новизна работы состоит в следующем:

1. Предложен метод «коллажа» для представления изображений и их фрагментов в виде индексной древовидной структуры данных, сохраняющей локально-пространственную и семантическую идентификацию, в отличие от известных интегральных методов (Фурье- и вейвлет-анализ и др.)

2. Разработаны алгоритм и программы многоуровневой древовидной индексации видеоданных, использующие адаптивно-динамическую сегментацию, обеспечивающую семантическую селекцию и индексную идентификацию фрагментов.

3. Разработана программа интерфейсной поддержки выявления семантических фрагментов изображения, позволяющая представить исходное изображение как совокупность семантических фрагментов (метод коллажа).

4. Предложено использовать понятие е-идентифицируемости (эквивалентности) для оценки качества семантического восприятия в отличие от энергетических характеристик оценки качества изображения, таких как среднеквадратическое отклонение (СКО), пиковое отношение сигнала к шуму (PSNR) и др.

Обоснованность и достоверность научных положений, основных выводов и результатов диссертации обеспечивается опорой на математические модели интегральной геометрии, анализом исследований в данной области, корректность предложенных алгоритмов подтверждается экспериментальной апробацией разработанных методов, а также апробацией основных теоретических положений диссертации в печатных трудах и докладах на научных конференциях.

Практическая ценность работы. Разработанные модели и алгоритмы позволяют расширить круг решаемых проблем обработки видеоданных:

1. выявления различных семантических уровней, что позволяет решать задачу компрессии с точки зрения семантико-смыслового восприятия;

2. локализации и семантического описания объектов при видеонаблюдении, передаче видеоданных в реальном времени.

Для решения перечисленных проблем разработана инструментальная среда адаптивно-динамической сегментации для семантического анализа видеоданных. Программа адаптивной интерфейсной поддержки позволяет реализовать функции визуализации семантических фрагментов.

Реализация результатов работы. Полученные результаты реализованы в виде прикладных программных продуктов. Ряд программных продуктов был внедрен в виде составных фрагментов НИР в 2004—2008 при выполнении контрактов с ГОС НИШ 111. Исследования, отраженные в диссертации были поддержаны грантами ОИТВС РАН (№4.8, 2003-2006), часть результатов была использована в проектах СПбНЦ РАН, 2003-2005.

Апробация результатов работы. Основные положения и результаты диссертационной работы представлялись на конференциях «Региональная информатика» (2000, 2004, 2008 гг.), «Информационные технологии и системы (ИТиС'08)», «Distributed Intelligent Systems and Technologies Workshop» (2009).

Публикации. Основные результаты по материалам диссертационной работы опубликованы в печатных работах [1-11], среди них 3 работы в журналах из перечня ВАК.

Структура и объем работы. Диссертация объемом 125 машинописных страниц, содержит введение, четыре главы и заключение, список литературы (97 наименований), 2 таблицы, 47 рисунков. '

Заключение диссертация на тему "Адаптивно-динамическая сегментация и семантическая селекция видеоданных"

Выводы по главе 4

Результаты экспериментальных исследований успешно подтвердили выдвинутые ранее теоретические положения. Тестирование программной реализации разработанных методов и алгоритмов показало высокую точность и корректность полученных значений.

Проведенная экспериментальная апробация эффективность оценки качества восприятия изображения с точки зрения идентификации неразличимости.

В результате использования АДС проблема распознавания сводится к проблеме узнавания, в отличие от существующих подходов компрессаторов, работающих на сопоставлении всех точек со всеми точками.

Получены следующие результаты:

Правильно выбранный критерий е-идентифицируемости позволяет выделять семантические слои на изображениях;

Для оценки близости межуровневого представления изображения используется критерий е-идентифицируемости для иерархического представления, в отличие от общепринятой оценки по минимуму СКО (среднеквадратического отклонения);

Структура данных позволяет реализовывать принцип узнавания.

Вместе с тем стоит отметить сложность оценки полученных результатов, и значительное влияние субъективной составляющей, присутствующей при оценке.

Заключение

Совокупность сформулированных и обоснованных в диссертационной работе положений, а также ее практические результаты представляют собой решение актуальной задачи разработки методов адаптивно-динамической сегментации и семантической селекции изображений и видеоданных. Получены следующие научные и практические результаты:

1. Проведены исследования современного состояния проблемы семантического анализа видеоданных.

2. Предложен метод «коллажа» как индексная древовидная структура данных, сохраняющая локально-пространственную и семантическую идентификацию, в отличие от известных интегральных (Фурье- и вейвлет-анализ) методов представления изображений и их фрагментов.

3. Разработаны алгоритм и программы многоуровневой древовидной индексации описания изображения, использующие адаптивно-динамическую сегментацию.

4. Показано, что адаптивно-динамическая сегментация приводит к семантической селекции и индексной идентификации фрагментов.

5. Разработана программа интерфейсной поддержки выявления семантических фрагментов изображения, что приводит к представлению исходного изображения как совокупности семантических фрагментов (метод «коллажа»).

6. Разработан критерий «е-идентифицируемости» как критерий качества семантического восприятия, в отличие от традиционных подходов, использующих при оценке качества представления изображения среднеквадратическое отклонение, пиковое отношение сигнала к шуму (PSNR) и др.

Программное обеспечение, разработанное в рамках диссертационной работы, нашло свое применение в проводимых в лаборатории автоматизации научных исследований СПИИРАН НИР в 2004-2008 годах, в качестве модулей семантического анализа видеопотоков в различных системах.

В качестве направлений дальнейших исследований можно выделить:

• разработка и реализация интегрированного Internet-сервиса для индексации, обработки и поиска изображений в базах данных;

• разработка алгоритма и формата семантической компрессии видеопотоков.

• разработка метрологической системы оценки качества компрессированных изображений и видеопотоков.

Библиография Зайцева, Александра Алексеевна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Зайцева А. А. Метод и алгоритмы реализации адаптивно-динамической сегментации изображений. — «Информационно-измерительные и управляющие системы», №4, 2009 — С. 16-19.

2. Кулешов С. В., Зайцева А. А., Аксенов А. Ю. Ассоциативно-пирамидальное представление данных. — «Информационно-измерительные и управляющие системы», №4, т. 6, 2008 — С. 14—18.

3. Кулешов С. В., Зайцева А. А. Селекция и локализация семантических фрагментов. — «Информационно-измерительные и управляющие системы», №10, т. 6, 2008 — С. 88-90

4. Кулешов С. В., Зайцева А. А. Локализация семантических блоков на растровых изображениях без предварительного обучения. // Информационные технологии и системы (ИТиС'08): сборник трудов конференции. М.: ИППИ РАН, 2008. - С. 468-470.

5. Кулешов С. В., Аксенов А. Ю., Зайцева А. А., Идентификация, факта компрессии с потерями в процессе обработки изображений // Труды СПИИРАН. Вып. 5. — СПб.: Наука, 2007 — С. 60-65.

6. Кулешов С. В., Зайцева А. А., Алъ-рашайда Хасан. Выявление несанкционированных вставок в видеопотоке методом ранговых распределений // Труды СПИИРАН. Вып. 3, т. 2. — СПб.: Наука, 2006.

7. Зайцева А. А. Методы — свойства и ограничения при построении стандартов передачи и хранения видеоданных // Труды СПИИРАН. Вып. 2 , том 2 СПб: "Наука", 2005 — с. 191-200

8. Зайцева А. А. Ассоциативная идентификация. — Труды СПИИРАН, вып. 1, т. 3, СПб, 2003 — С. 118-125.

9. Александров В. В., Кулешов С. В., Цветков О. В., Зайцева А. А. Концепция и теория нанотехнологии физической среды инфотелекоммуникации (прототип SDR) // Труды СПИИРАН. Вып. 6. — СПб.: Наука, 2008.

10. Александров В. В. Биоинформационный процесс познания и моделирования// Журн. «Информационные технологии в проектировании и производстве». 2003. № 3. — С. 70-74.

11. Александров В. В. Развивающиеся процессы и системы. Степенные законы// Журн. «Информационные системы и технологии». 2007. -№1(1). —С. 58-83.

12. Александров В. В. Глаз и визуальное восприятие// Оптич. журн. 1999. Т. 66, №9. —С. 54-63.

13. Александров В. В. Интеллект и компьютер. — СПб.: Изд-во «Анатолия», 2004. — 282 с.

14. Александров В.В. Развивающиеся системы в Науке, Технике, Обществе и Культуре. — СПб: Изд-во СПбГТУ, 2000. — 244 с.

15. Александров В. В., Арсентьева А. В. Информация и развивающиеся структуры. — Л.: ЛНИВЦ АН СССР, 1984. — 186 с.

16. Александров В. В., Блажис А. К, Скурихин А. В. О новой парадигме информационной связи// Информационные технологии и интеллектуальные методы, 1999. Вып.З. — С. 289-299.

17. Александров В. В., Горский Н. Д. Представление изображений. Рекурсивный подход. — Л.: Наука, 1985. — 190 с.

18. Александров В. В., Горский Н.Д. ЭВМ видит мир. — Л.: Машиностроение, 1990.

19. Александров В.В., Кулешов С.В. Нарротивные представления информационных процессов. // Электронный науч. журн. «Информационные процессы».2004. Т. 4, №2. - С. 160-169. — http://www.jip.ru

20. Александров В.В., Кулешов С.В. Этерификация и терминальные программы "Информационно-измерительные и управляющие системы", №10, т.6, 2008. - С. 50-53.

21. Александров В. В., Кулешов С. В., Цветков О. В. Цифровая технология инфокоммуникации. Передача, хранение и семантический анализ текста, звука, видео. — СПб.: Наука, 2008. — 244 с.

22. Александров В. В., Кулешов С. В., Цветков О. В. Концепция программируемой технологии цифровой теории связи: от герц к бит/с // Информационно-измерительные и управляющие системы. 2007. № 6. — С. 62-72.

23. Александров В. В., Лачинов В. М, Поляков А. О. О рекурсивной алгоритмизации кривой, заполняющей многомерный интервал // Изв. АН СССР Техническая кибернетика. 1978. — № 1.

24. Александров В.В., Полонников Р.И. Об одном способе решения задачи опознавания объектов // Изв. Академии наук СССР. Техническая кибернетика. 1967. № 1 —С. 92-102.

25. Александров В. В., Харинов М. В. Представление изображений ранговыми распределениями. Препринт ЛНИВЦ АН СССР № 61, 1988.47 с.

26. Барон Д. Рекурсивные методы в программировании. — М.: Мир, 1974.

27. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. — М.: ДИАЛОГ-МИФИ, 2002. —384 с.

28. Воробьев В. И., Грибунин В. Г. Теория и практика вейвлет-преобразования. — СПб.: Изд-во ВУС, 1999. — 208 с.

29. Горский Н., Анисимов В., Горская Л. Распознавание рукописного текста. От теории к практике СПб.: Политехника, 1997. — 126 с.

30. Грибунин В. Г. Глоссарий по цифровой обработке сигналов. — http ://www. autex.spb.ru

31. Дорофеева А. В., Чернова М. Л. Карл Вейерштрасс (К 170-летию со дня рождения)// Сер.: Математика и кибернетика. — Изд. «Знание», 1985.48 с.

32. Емелъченков Е.П., Емелъченков В.Е. Вычислимость. Введение в теорию алгоритмов. — 2000.

33. Жаблон К, Симон Ж.-К. Применение ЭВМ для численного моделирования в физике. 1978 / Пер. с франц. А.В. Арсентьевой; под ред. В.В. Александрова и Ю. С. Вишнякова. — М.: «Наука», Главная редакция физ.-мат. литературы, 1983.

34. Искандеров П.М., Слиозберг Н.С., Харинов М.В. Итеративно-рекурсивный метод предварительной обработки полутоновых изображений в задаче выделения конкреций // Информационные проблемы распознавания. — Л.:ЛИИАН, 1988. — С. 107-117.

35. Колмогоров А. Н. Теория информации и теория алгоритмов. — М.: Наука, 1987. —304 с.

36. Колмогоров А. Н. Три подхода к определению понятия «количество информации»// Проблемы передачи информации. 1965. Т. 1, № 1. — С. 3-11.

37. Колмогоров А. Н., Успенский В.А. К определению алгоритма// Успехи математических наук. 1958. Т. 13, вып. 4. - С. 3-28.

38. Кроновер P.M. Фракталы и хаос в динамических системах. Основы теории. — М.: Постмаркет, 2000. — 322 с.

39. Кулешов С. В. Фрактальное шифрование // Труды СПИИРАН. — Вып. 2, т. 1. — СПб.: Наука, 2004. — С. 231-235.

40. Лайков Е.В. Компрессия изображений с частичной потерей данных // Сб. науч. трудов аспирантов СПИИРАН «Информационные технологии и интеллектуальные методы» — СПб. 1996. — С. 71-78.

41. Левкович-Маслюк Л. И. Нахождение порождающих матриц для фрактальных интерполяционных функций с помощью вейвлет-анализа. // Регулярная и хаотическая динамика. — 1998. Т. 2.

42. Лейбниц Г. Новые опыты о человеческом разумении автора системы • предустановленной гармонии. Сочинения в 4-х томах, т.2, М.: Мысль, 1983, 686 с.

43. Манделъброт Б. Фрактальная геометрия природы. — М.: Ин-т компьютерных исследований, 2002. — 656 с.

44. Манин Ю.И. Вычислимое и невычислимое. — М.: Сов. радио, 1980.

45. Марков А. А. Теория алгорифмов. — Тр. МИАН СССР, 1951, т. 38, с. 176-189

46. Марков А. А. Теория алгорифмов. — Тр. МИАН СССР, 1954, т. 42, с. 3375

47. Мейер Б., Бодуэн К. Методы программирования. — М.: Мир, 1982.

48. Полонников Р.И. Основные концепции общей теории информации. — СПб.: Наука, 2006. — 204 с.

49. Пирс Дж. Символы, сигналы, шумы: закономерности и процессы передачи информации. М.:Изд.: «Мир», 1967. — 234 с.

50. Спиридонов- В.П. Самоподобие, всплески и квазикристаллы. // Компьютерра. 1998. № 8 от 02 марта:

51. Степанов В: Д. Теорема Литтлвуда-Пэли для интегралов. Фурье / ВЦ ДВНЦ АН СССР. — Владивосток, 1985. — 35 с. (Препринт).56: Таръян Р. Э. Сложность комбинаторных алгоритмов// Кибернет. сб. — М.: Мир, 1980. Вып. 17. — С. 60-109.

52. Тимофеев А. В., Дерин О. А. Анализ сложных мультиизображений в режиме реального времени: — Приборостроение, — Санкт-Петербург, Россия, № 10,-20081

53. Тойнби А. Дж. Постижение истории: — Пер. с англ./Сост. Огурцов А.П.; Вступ. ст. Уколовой В. И.; Закл. ст. Рашковского Е. Б. — М.: Прогресс. 1996 — 608 с.

54. Храмов А. В. Проблемы теории телевидения. // РЭТТ. 2006.

55. Цифровая модернизация штурмовиков А-10. — http://rnd.cnews.rU/naturscience/news/top/indexscience.shtml/2007/07/09/2 578741

56. Цветков О. В. Цифровые технологии обработки аудиовидеосигналов: компрессия и семантический анализ // Труды СПИИРАН. Вып. 2 , т. 1.

57. СПб.: Наука, 2004. — С.145-158.

58. Шилов В.В. Слово алгоритм: происхождение и развитие. — http://ru.wikibooks.org

59. Шредер М. Фракталы, хаос, степенные законы. Миниатюры из бесконечного рая. — Ижевск: НИЦ « Регулярная и хаотичная динамика», 2001. — 528 с.

60. Электронная Интернет-энциклопедия. — http://ru.wikipedia.org

61. Adelson Е. Н., Anderson С. Н., Bergen J. R., Burt P. J., and Ogden J. M. Pyramid methods in image processing// RCA Engineer. 1984. Vol. 29(6).1. P. 33-41.

62. Alexandrov V.V., Frenkel B.E., Kharinov M.V. Object-fitting Approach to Image Representation, Computer Applications in Industry /Proc. Fourth IASTED Intern. Conf. Cairo, Egypt (ARE). 1995.

63. Alexandrov V.V., Gorsky N.D. From Humans to Computers: Cognition through Visual Perception. — Singapore; New Jersey;London;Hong Kong. 1991. —203 p.

64. R. Alterson, M. Spetsakis. Object recognition with adaptive Gabor features. Proceedings from the 15th International Conference on Vision Interface. -Oct. 2004.

65. Berry G. Bottom-up computation of recursive programs // Rev. Franciase, d'automatique, d'informatique et de recherche operationnelle. 1976. Vol. 10, №3. —p. 47-82.

66. Besicovitch A. S., Ursell H. D. Sets of fractional dimensions (V): On dimensional numbers of some continuous curves//. The London Mathematical Society. 1937.-Vol. 12. —P. 18-25.

67. Brunelli R., Mich. O. Histograms analysis for image retrieval. Pattern Recognition, v 34, n 8, Aug. 2001, pp. 1625-37

68. Byung-Gyu Kim and Dong-Jo Park. Unsupervised video object segmentation and tracking based on new edge features. Pattern Recognition Letters, Volume 25, Issue 15, November 2004, Pages 1731-1742

69. Soong-Der Chen and Abd. Rahman Ramli. Preserving brightness in histogram equalization based contrast enhancement techniques. Digital Signal Processing, Volume 14, Issue 5, September 2004, pp. 413^28

70. Falconer K.J. Fractal Geometry: Mathematical Foundations and Applications. John Wiley & Sons, 2003. — 337 c.

71. Fractal Creations (Paperback) by Tim Wegner, Mark Peterson. Paperback: 335 pages. Publisher: Waite Group Press; 1st ed edition (1991).

72. Fridich J., Goljan M. Practical Steganalysis of Digital Images — State of the Art // Proc. SPIE Photonics West. Vol. 4675. Electronic Imaging 2002, Security and Watermarking of Multimedia Contents. San Jose, California, January, 2002. P. 1-13.

73. Hofstadter D.A. Godel, Esher, Bach: An eternally golden braid. N.Y.: Harvester Press, 1979. — 843 p.

74. Jadegari S. D. Self-similar Synthesis on the Border between Sound and Music. Ph.D. Thesis, MIT, 1992. — 146 p.

75. A.K. Jain and F.Farrokhnia. Unsupervised texture segmentation using Gabor filters. Pattern Recognition 24, 1167-1186, 1991.

76. Kurugollu F., Sankur В., Harmanci A.E. Color image segmentation using histogram multithresholding and fusion. Image and Vision Computing, v. 19, n. 13, 2001, pp. 915-928

77. Mallat S. A Theory for multiresolution signal decomposition: the wavelet representation// Proc. IEEE Trans on Pattern Anal, and Math, intel. 1989. -Vol. 11, N7.

78. Mandelbrot В. B. The Fractal Geometry of Nature. — San Francisco: W.H. Freeman and Company, 1982. 258 p.

79. Mandelbrot Benoit. Some noises with 1/f spectrum, a bridge between direct current and white noise.// IEEE Transaction, Information Theory. 1967. Vol. 13 (2).-P. 289-298.

80. Morales E., Shih F.Y. Wavelet coefficients clustering using morphological operations and pruned quadtrees. — Pattern Recognition 33, 2000, p. 16111620.

81. Prusinkiewicz P. and Hanan J. Lindenmayer systems, fractals, and plants. Springer-Verlag: New York, 1989.

82. Gerhard X. Ritter, Joseph N. Wilson. Handbook of Computer Vision • Algorithms in Image Algebra. Second Edition. 2001.

83. John C. Russ. The Image Processing handbook. Fourth Edition. 2000.

84. Simon J. C. L'education et L'information de la societe: Rapport an President de la Republique. — 1980.

85. Shapiro J. Embedded image coding using zerotrees of wavelet coefficients 11 IEEE Transactions on Signal Processing. 1993. Vol. 41(12). Dec. — P. 3445-3462, Dec. 1993.

86. G.K. Wallace. The JPEG still picture compression standard. // Communication of ACM. Volume 34. Number 4 April 1991.

87. Westfeld A., Pjitzmann A. Attacks on Steganographic Systems //Proc.3rd Info. Hiding Workshop, Dresden, Germany, Sept. 28-Oct. 1, 1999. P. 61-75.

88. Zipf G.K. Human behavior and the principle of least effort. Addison Wesley Publ.Co., Inc., Cambridge, Mass., 1949.96. http://vslovar.ru/comp/97. http://www.bfm.ru/news/2009/06/12/ssha-pereshli-na-cifrovoe-televidenie.html