автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Теория и методы первичной обработки видеоинформации

доктора физико-математических наук
Лебедев, Дмитрий Савельевич
город
Москва
год
1993
специальность ВАК РФ
05.13.17
Автореферат по информатике, вычислительной технике и управлению на тему «Теория и методы первичной обработки видеоинформации»

Автореферат диссертации по теме "Теория и методы первичной обработки видеоинформации"

Кб

о ъда

РОСИЙССКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ

На правах рукописи

ЛЕБЕДЕВ Дмитрий Савельевич

ТЕОРИЯ И МЕТОДЫ ПЕРВИЧНОЙ ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ 05.13.17 - "Теоретические основы информатики"

Диссертация на соискание ученой степени доктора физико-математических наук в форме научного доклада

Москва 1993

Работа выполнена в Институте проблем передачи информации РАН

Официальные оппоненты:

академик РАН, доктор физико-математических наук,

профессор Ю. И. Журавлев; доктор технических наук,

профессор М. П. Гришин; доктор физико-математических наук, профессор Р. Л. Добруиин

Ведущая организация - Институт космических исследований РАН

Защита состоится " " 1993 г. в часов мин.

на заседании Специализированного совета Д. 003. 29. 01 при Институте проблем передачи информации РАН по адресу: 101447 Москва, ул. Ермоловой, 19.

Доклад разослан " " 1993 г.

Ученый секретарь Специализированного сорета доктор технических наук

С. Н. Степанов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Видеоинформацией называют сведения о пространственной структуре предметов окружающего мира. Необходимая человеку видеоинформация доставляется посредством зрения.

Созданы разнообразные технические средства передачи, хранения, обработки и отображения видеоинформации - видеоинформационные системы (ВИС). Широко распространены изображающие системы (ИС), расширяющие возможности зрения: оптические инструменты; фотографические и телевизионные системы; электронные микроскопы; инфракрасные, рентгеновские и ультразвуковые приборы; томографы; радиоло-локаторы бокового обзора; полиграфические системы воспроизведения иллюстраций. К ним можно отнести и информацонно-измерительные комплексы, с помощью которых результаты измерений физических полей различной природы представляются в форме изображения для интерпретации их человеком, например, систему построения геологических разрезов по данным сейсморазведки.

Сенсоры на входе ИС воспринимают приходящие от предмета электромагнитные излучения, звуковые или упругие волны, поток электронов или других микрочастиц и формируют сигналы. После обработки сигналов на выходе системы создается особое световое поле - изображение предмета, рассматривая которое человек (зритель, интерпретатор или оператор) получает видеоинформацию, позволяющую судить о пространственной структуре предмета. Дальнейшая обработка и интерпретация видеоинформации осуществляется человеком таким же образом, как при непосредственном рассматривании предметов невооруженным глазом.

Быстро развиваются системы компьютерного зрения (СКЗ), в которых сигналы сенсоров обрабатывается для того, чтобы на основе полученной видеоинформации управлять транспортным средством, манипулятором или иным исполнительным устройством.

Все большее применение находят системы обработки изображений (СОИ), которые дают возможность улучшать изображения, анализировать их и получать количественные характеристики изображенных предметов, отображать видеоинформацию в преобразованной форме, например, строить карту по данным аэросъемки. Эти системы часто используются для исследования и разработки других ВИС, поскольку позволяют моделировать практически любые процессы преобразования видеоинформации.

Алгоритмы обработки сигналов ВИС можно разбить на два класса: первичной обработки видеоинформации (ПОВ) - выделения признаков, необходимых для воспроизведения выходного изображения ИС или для дальнейшей обработки в других БИС, и интерпретации - решения задач распознавания образов, анализа сцен и понимания изображений. На такие же этапы, осуществляемые различными подсистемами, разделяется обработка информации в зрительной системе человека.

Необходимость ПОВ вызвана тем, что сигналы сенсоров, с одной стороны, подвержены детерминированным и случайным искажениям, разрушающим полезную видеоинформацию, и, с другой стороны, могут нести излишнюю информацию, которая не нужна для воспроизведения выходного изображения или интерпретации сцены.

Методы ПОВ в технических системах описаны в литературе по телевидению, обработке изображений, космическим исследованиям, компьютерному зрению, искусственному интеллекту й другим дисциплинам. Однако большинство из них найдено эвристически, исходя из неформализованных интуитивных представлений о возможных простран-венно-структурных свойствах изображаемых предметов. Одним из немногих исключений являются линейные методы ПОВ такие, как винеро-вская фильтрация, которые часто оказываются малоэффективными.

Для того, чтобы оценить степень совершенства существуцющих методов ПОВ и, главное, улучшить их, необходимо разработать теорию ПОВ. На ее основе можно будет найти оптимальные или близкие к ним методы ПОВ, что позволит при заданных характеристиках сенсоров и других элементов ИС получить выходное изображение, дающее более полное представление о пространственной структуре изображаемого предмета, или сократить время передачи изображения. В СКЗ использование таких методов облегчит реализацию известных и разработку новых алгоритмов интерпретации. Оптимальные или близкие к ним методы ПОВ могут быть применены также для повышения эффективности процедур улучшения и анализа изображений в СОИ. Таким образом, разработка теории и основанных на ней оптимальных или близких к ним методов ПОВ является актуальной проблемой.

Цель и задачи исследования. Цель исследования - решение сформулированной выие проблемы. Для ее достижения надо решить следующие частные задачи.

1) Определить круг задач НОВ и выбрать подход к разработке алгоритмов их решения.

2) Найти и обосновать способ описания общих для типичных изображений особенностей их пространственной структуры.

3) Измерить характеристики реальных изображений.

4) Уточнить модель механизма формирования сигнала в ВИС.

5) Выбрать способ описания свойств зрения человека, которые следует использовать при решении задач ПОВ.

6) Разработать алгоритмы ПОВ.

7) Исследовать пути реализации разработанных алгоритмов.

Методы исследования. Для решения главной проблемы и частных

задач применялись методы теории информации и теории статистических решений, методы теории гиббсовских случайных полей и минимизации функций многих переменных. Для исследования эффективности разработанных алгоритмов и сравнения их с ранее известными использовались методы цифрового моделирования посредством системы цифровой обработки изображений ИППИ АН СССР.

Научная новизна работы. Дана формулировка задач ПОВ в ИС, СКЗ и СОИ, входящих в круг задач теории информации и теории статистических решений.

Введено понятие составного ансамбля изображений, позволяющее интерпретировать оценки вероятностных характеристик ансамбля по его отдельным представителям и обосновать необходимость применения адаптивных методов обработки сигналов.

Показана непригодность гауссовых случайных полей для моделирования большинства ансамблей реальных изображений. Предложены две марковские вероятностные модели ансамбля исходных изображений с неквадратическими потенциалами парного взаимодействия, реализации которых близки по структуре к реальным изображениям.

Развит физический подход к моделированию гиббсовского ансамбля изображений, позволяющий на основе аналогии между потенциальной функцией и мерой гладкости функции, описывающей изображение, использовать понятия дифференциальной геометрии и теории упругости для разработки новых моделей.

Разработана концепция многоуровневых (иерархических) моделей ансамблей изображений в виде гауссового марковского случайного поля со случайным изменением потенциалов взаимодействия. Предложена двухуровневая вероятностная модель ансамбля изображений с фрагментами почти одинаковой яркости и марковская модель рисунка границ между фрагментами.

На " основе различных вероятностных моделей ансамбля исходных изображений разработаны близкие к оптимальным алгоритмы улучшения и сегментации изображений в ИС, СКЗ и СОИ. Подтверждена связь эффективности алгоритмов с полнотой описания моделью ансамбля проз

странственно-структурных свойства типичных изображений.

Показана связь байесового метода исправления искаженного изображения с методом регуляризации некорректных обратных задач.

Решена задача об обращении неполной циклической матрицы, что. дает возможность предотвратить краевые искажения при использовании ДПФ для исправления однородных линейных искажений изображения

Разработаны адаптивные варианты байесовых алгоритмом ПОВ, со-сохраняющих работоспособность при неполной априорной информации.

Найдена связь архитектуры специализированного вычислительного устройства параллельного действия, осуществляющего байесовы алгоритмы ПОВ, с моделью ансамбля исходных изображений.

Показана плодотворность применения психофизической концепции подпорогового множества стимулов к разработке методов кодирования изображений. Разработаны метод цифрового кодирования, использую-ющий парамиду лапласианов, и метод повышения помехоустойчивости передачи видеоинформации по каналам связи на основе предсказания.

Практическая ценность работы. Теория и методы ПОВ, изложенные в работе, использовались в ряде организаций при разработке и усовершенствовании систем передачи, хранения, обработки и отображения видеоинформации и обеспечили существенное повышение их эффективности. Программы, реализующие найденные алгоритмы, применялись в ЖППИ АН СССР и других учреждениях для улучшения и анализа изображений посредством систем цифровой обработки. Результаты работы нашли применение при выполнении заданий ВПК и ГКНТ при СМ СССР, в частности, для обработки снимков поверхности Луны и планет, переданных советскими AMC; пръ разработке методов улучшения изображений космических летательных аппаратов, искаженных турбулентной атмосферой; для восстановления архивных фотографий.

Заказчиком или соисполнителем исследований выступали такие организации, как ГОИ им., С. И. Вавилова, ВНИИТелевидения, ГосНИИХим-фотопроект, НИИИнтроскопии, ВНИИПриОоростроения, НИИТочПрибор, ВНИИМедПрибор, ГосНИЦИПР, ВНИЦТехДокументации, ВНИПКО "Агроресур-сы", Институт кибернетики АН УзССР и многие другие.

Материалы работы использовались для подготовки квалифицированных кадров для научно-исследовательских учреждений и вузов Москвы, Ленинграда, Ташкента, Тбилисси, Каунаса, Казани, Баку, Еревана и других городов, в том числе тринадцати кандидатов наук. Они послужили основой для курсов лекций "Теория изображений" и "Статистические методы обработки видеоинформации" для слушателей организованной автором специализации "Обработка изображений" на фа-

культете по переподготовке кадров МФТИ в 1977-1990 гг.

Апробация работы. Результаты работы докладывались на Международных симпозиумах по теории информации (Дубна, 1969; Цахкадзор, 1971; Таллин,1973) и кодированию изображений (Лос-Анджелес,1973); на Международных конференциях по цифровой обработке сигналов (Флоренция, 1975,1981); по неразрушающему контролю (Москва, 1982) на XIV Международном конгрессе по высокоскоростной фотографии и фотонике (Москва, 1980); на ХХи Генеральной ассмблее оизг (Прага, 1990); Европейской конференции по обработке сигналов (Лозанна, 1980); Международном коллоквиуме по микроволновой связи (Будапешт 1970); Советско-французском симпозиуме по оптико-спектральным приборам и приборам для обработки изображений (Москва. 1976); на ХХш Всесоюзной научной сессии НТОРиЭ (Москва, 1967); на Всесоюзных конференциях по теории кодирования и передачи информации (Баку, 1965; Ужгород, 1967; Ташкент,1969; Горький, 1972; Томск, 1975; Вильнюс, 1978; Куйбышев, 1981); по космической радиосвязи (Москва, 1967,1968); по автоматизированным системам обработки изображений (Москва, 1981; Львов, 1986); по оптическим изображениям и регистрирующим средам (Ленинград, 1982); по некорректно поставленным задачам (Фрунзе, 1979); по искусственному интеллекту (Переславль-Залесский,1988); на Всесоюзных симпозиумах по субъективной оценке качества кино- и телевизионных изображений (Москва, 1970); по проблемам цифрового кодирования изображений (Тбилиси, 1980); по проблеме избыточности (Ленинград, 1983); по сокращению избыточности в цифровых телевизионных системах (Тбилиси, 1983); по зрению организмов и роботов (Вильнюс, 1982); по методам и программному обеспечению обработки информации и прикладного статистического анализа (Минск, 1985), а также на других конференциях, симпозиумах и семинарах.

Публикации. Материалы диссертации отражены в 97 работах, опуб-ликованых в отечественных и зарубежных изданиях. 57 основных работ приведены в конце доклада.

1. ФОРМУЛИРОВКА ЗАДАЧ ПЕРВИЧНОЙ ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ [11-13, 25, 37]

1.1. Первичная обработка видеоинформации лля улучвения выходных изображений

Представление изображений. Воспроизводящие устройства большинства современных ИС позволяют получить лишь простейшее изобрахе-

ние предмета - плоское одноцветное и неподвижное, либо несколько простейших изображений, например, стереопару, тройку цветоделен-ных изображения, последовательность кинокадров. Плоское одноцветное неподвижное изображение, рассматриваемое из фиксированной точки пространства, можно описать одной функцией двух переменных, v(x,y) - яркостью в точке плоскости с декартовыми координатами (x,y)es, где S - часть плоскости, называемая полем зрения. Для упрощения обозначений ограничимся полем зрения квадратной формы:

В работе, как правило, изучаются изображения, подвергнутые дискретизации - разбиению на малые элементы квадратной формы прямыми x=nh, y=mh, n,m=o,...,n, где n - целое число; h-x/n - шаг дискретизации. Дискретизованное изображение представляется массивом чисел (таблицей) из N строк и N столбцов

v={v(m,n); л|,л=0,. . . ,N-1 }, где (т,п) - номер строки и номер столбца, или дискретные координаты элемента изображения, ограниченного прямыми x=nh, х=(л+1)л, y=mh, y=(m+l)h; v(m,n) - средняя яркость этого элемента. Зритель не замечает искажений, вызванных дискретизацией, если шаг дискретизации не превышав,т одну угловую минуту.

Перенумеровав элементы изображения в произвольном порядке, получим с-вектор v=(vt.....v ), где q=i? - число элементов изображения. Множество всевозможных дискретизованных изображений {v} есть подмножество g-мерного векторного пространства к. Обычно значения яркости принадлежат интервалу lv п, уваж1- Если на множество (v) не наложено других ограничений, то

{v: VBi <v(m,n)<viiix ; т,п=0, ..., W-1) - Б с Я, где Б - g-мерный гиперкуб.

Ансамбль исходных изображений. Получатель заинтересован в том, чтобы выходное изображение ИС доставляло ему максимум сведений о структуре предмета. Для суждения о качестве выходного изображения, его надо сравнить с эталоном - изображением этого же предмета, полученного посредством ИС с идеализированными характеристиками. (Степень идеализации может быть разной в зависимости от решаемой задачи). Такое изображение будет называться исходным, или оригиналом. Исходное изображение есть результат редукции первоначального описания пространственной структуры предмета, в процессе которой может быть утрачена часть видеоинформации, например, сведения о цвете предмета на идеальном (в частности, лишенном шумов зернистости) черно-белом фотоснимке. Эти потери заранее заплани-

рованны при выборе типа ИС.

Исходное изображение также может быть дискретизовано и представлено массивом и={и(л!,п)} е е. (Указание л?,л=0,___,N-1 будет

обычно опускаться).

Разнообразие предметов окружающего мира приводит к разнообразию их изображений. Однако типичные для данной ИС исходные изображения обладают характерной структурой, которая отличает их от исходных изображений других типов или от выходных изображений, воспроизводимых этой системой. Граница между "типичными" и "нетипичными" изображениями размыта. Говоря о характерной структуре, обычно подразумевают не свойства отдельного изображения, а те, которые являются общими для многих типичных изображений. Опыт, накопленный в теории информации, показывает, что такие характерные свойства удобно описывать на вероятностном языке.

Будем считать конкретные дискретизованные исходные изображения результатами случайного эксперимента, вероятности исходов которого определяются р(и) -плотностью вероятности £?-го порядка. Многократно повторяя эксперимент, будем, как правило, получать изображения, которым соответствуют больше значения плотности вероятности, и очень редко - изображения, для которых значения этой величины малы.

Следовательно, плотность вероятности может служить для описания характерной структуры типичных (высоковероятных) изображений данного типа. Иными словами, функция р(и) является признаком принадлежности массива и ансамблю исходных изображений {и}с е. Разным плотностям вероятности соответствуют ансамбли исходных изображений разных типов.

Вместо случайного эксперимента можно говорить о случайном поле и-{[/(т,л)}, определяемом плотностью вероятности р(и). Массивы и={и(т,п)), описывающие конкретные изображения, являются реализациями этого случайного поля.

Плотность вероятности с-го порядка, где о - число элементов изображения, которое достигает сотен тысяч и даже миллионов, есть слишком громоздкая характеристика ансамбля. Даже для расчета наиболее сложных методов НОВ обычно достаточно знать плотность вероятности яг-го порядка, где к - число элементов небольшого фрагмента изображения.

Средний риск. Сигнал, несущий информацию о пространственной структуре предмета, формируется в результате измерения сенсорами ИС порождаемого предметом входного поля - излучения, волн или по-

тока частиц. В большинстве практически важных случаев можно считать, что сигнал определяется только исходным изображением, а не польам (нередуцированным) описанием предмета. Тогда сигнал

s=.Fu, (1)

где f - оператор формирования сигнала.

На формирование сигнала влияют флуктуации измеряемых физических величин, ошибки измерений, шумы и помехи в звеньях ИС, а также изменчивость состояния внешней среды и характеристик ИС. Действие этих факторов нарушает однозначную связь сигнала с исходным изображением. Процесс формирования сигнала описывается на вероятностном языке посредством <j(s/u) - условной плотности вероятности сигнала s при заданном исходном изображении и.

В результате преобразования сигнала детерминированным обратимым оператором g образуется выходное изображение

v-ffs. (2а)

Процесс воспроизведения изображения можно рассматривать как* переход в пространстве r от точки иее к точке ves, где v=gfu.

Данное исходное изображение и порождает {v)u-условный ансамбль выходных изображений, который характеризуется плотность вероятности g(s/u). Системам разного типа или разным экземплярам ИС данного типа могут соответствовать разные условные ансамбли выходных изображений.

Если воспроизводится изображение v, отличающееся от исходного,, изображения и, то получатель теряет часть заключенной в нем видеоинформации. Эти потери измеряются величиной §(u,v) - функцией 2Q аргументов. Выбор функции потерь определяется свойствами получателя с учетом конечной цели, в которой используется видеоинформация. Если, например, нужно воспроизводить изображения, почти неотличимые получателем от соответствующих оригиналов, то в качестве функции потерь берут меру различия (несходства) воспроизведенного и исходного изображений.

Конкретное исходное изображение есть результат случайного выбора из ансамбля {и}, определяемого плотностью вероятности р(и), а выходное изображение v - из ансамбля {v-Cs} с плотностью веро-

ц

ятности g(s/u). Функция потерь получателя - случайная величина. Усреднив ее значения по ансамблям изображений {и} и {v)u> найдем средний риск

r=X/g(u, Gs)p(u)qr(s/u)dsdu. (3)

Эта величина характеризует процесс воспроизведения выходного изображения в целом, поскольку она определяется структурными ха-

рактеристиками исходных изображений, задаваемыми плотностью вероятности р(и); механизмами формирования наблюдаемого сигнала и выходного изображения, представляемыми условной плотностью вероятности g(s/u) и оператором G, а также свойствами получателя видеоинформации, которые описываются функцией потерь g(u,v).

Оптимальный оператор улучвения изображения. Улучшение выходного изображения, то есть приближение его к оригиналу (с точки зрения получателя), достигается преобразованием оператором н сигнала s в сигнал

s-tfs. (4)

Тогда выходное изображение (2а) будет описываться массивом

v"GHs. (26)

Очевидно, что оптимальный оператор улучшения выходного изображения должен минимизировать средний риск (3):

Я -arg min(J"J"Q(u, G№3)p(u)g(s/u)dscfu). н

Воспользуемся формулой Байеса, определяющей апостериорную плотность вероятности

р (u/s)=p(u)g(s/u)/g(s), (5)

Ря

где

<7(s) - J"p(u)g(s/u)du - безусловная плотность вероятности для ансамбля сигналов- {s}, порожденных всевозможными исходными изоббражениями. Апостериорная плотность вероятности характеризует {и} - апостериорный ансамбль

S

исходных изображений, которые могли привести к данному сигналу. Из формул (3) и (5) следует, что средний риск

r=J"rpa( s)<j(s)ds,

где

Г (s)= ÍQ (u, GHs)p (u/s)<fu (6)

pe pe

- апостериорный риск, измеряющий средние потери получателя при

заданном сигнале.-

Очевидно, что средний риск достигает минимума, если при каждом

значении сигнала минимален апостериорный риск. Следовательно,

HQ* arg min (fg (u, GHs)p (u/s)du) ДЛЯ Всех s6{s). (7)

я ps

Оптимальное выходное изображение

u-ßf s -arg min(/g(u, v)p (u/s)<iu) (8)

v p"

является оценкой исходного изображения по наблюдаемому сигналу, которая минимизирует средние потери получателя. Она, называется б айесовой.

МСКО и MAB оценивание. Чтобы найти оптимальный оператор обработки сигнала (6), надо знать функцию потерь получателя. Пусть она есть квадрат евклидового расстояния между точками и и v:

g(u,v) = (u-v)T (u-v)"Sp( (u-v) <u-v)T). Средний риск (3) с такой функцией потерь будет средним квадратом отклонения (СКО) выходного изображения от оригинала

<g(u,v)>= <Sp((u-v) (u-v)T ) >. (9)

Оптимальное выходное изображение в этом случае называется МСКО оценкой исходного изображения (то есть минимизирующей СКО). Известно, что оно представляется массивом апостериорных средних:

u =fup (u/s) du. (10)

Оценка (10) остается отимальной, если

Q(u,v) = (u-v)T^(u-v)

при любой положительно определенной матрице л.

Если функция потерь получателя не сводится к квадрату обобщенного евклидового расстояния между точками и и v, то МСКО оценка исходного изображения будет субоптимальной (не приведет к минимизации среднего риска). Можно показать, что когда потери видеоинформации при формировании сигнала малы и потенциальное качество выходных изображений высоко, МСКО оценка будет близка к оптимальной при разумной функции потерь.

При этом же условии окажется близкой к оптимальной оценка

u -arg max р (u/s). (11)

и

которая называется MAB оценкой (максимизирующей апостериорную вероятность). Оценки (10) и (11) являются байесовыми.

При сделанных предположениях о высоких потенциальных возможностях данной ИС, не зная истинной функции потерь получателя, можно получить близкие к оптимальным выходные изображения, хотя и нельзя оценить теоретически степень этой близости. Как показывают результаты цифрового моделирования, представленные в пп. 3.2 и 3.5, МСКО или MAB оценивание, основанное на достаточно полных моделях ансамбля исходных изображений и механизма формирования сигнала, при высоких потенциальных возможностях ИС нередко дает выходные изображения, практически неотличимые от оригинала.

1.2. Кодирование изображений

Кодирование для повышения помехоустойчивости передачи видеоинформации. Термин кодирование изображений имеет два значения. Бу-

дем здесь понимать его как преобразование сигнала сенсоров в сигнал для передачи по каналу с шумом, которое вместе с соответствующим преобразованием принятого сигнала в выходное изображение - декодированием позволяет сократить отношение размаха передаваемого сигнала к эффективной амплитуде шума. В следущем пункте рассматривается кодирование как представление дискретизованного исходного изображения комбинацией цифр.

Пусть с обозначает обратимый детерминированный оператор кодирования , преобразующий улучшенный сигнал сенсоров (4) в ограниченный передаваемый сигнал

s -(s ,...,s )=Cs; s 4s <s , g=1,...,Q.

1 4 1/1 I/O Hin 1 ,<j ill ^ '

Искаженный шумом в канале принятый сигнал

s2-si+C = Cs+C. (12)

где с - реализация шума, преобразуется детерминированным оператором декодирования d в выходное изображение

v=GDS2. (13)

Если шум в канале отсутствует, то при D-C1 и оптимальном операторе hq изображение (13) будет совпадать с изображением (8), которое следует принять за исходное и сравнивать с ним выходное изображение при наличии шума. Определенное так исходное изображение задано сигналом s:

u-Gs. (14)

Связь принятого сигнала с исходным изображением описывает условная плотность вероятности gc(s2/u), которая зависит от оператора кодирования (этим кодирование существенно отличается от улучшения изображений, когда плотность вероятности g(s/u) описывает заданный механизм формирования сигнала сенсоров).

При фиксированном операторе кодирования, оптимальный оператор декодирования

Dq «arg n>in( J"g(u, GDs2 )p ^ (u/s2 )<Ju), (1 5)

где

Pps (u/s2 ) -p(u) g(s2 /u) /Jp(u)gc (s2 /u) da

и функция g(u,v) имеет смысл меры различия изображений и и v.

(p(u) - плотность вероятности ансамбля изображений (14)). При таком операторе потери получателя измеряются средним риском

с) =/ (/е (u, GD0 s2)%( s2 /и) ds) р (и) cíu. (16)

Изменяя оператор кодирования (и соответствующий оптимальный оператор декодирования), можно сделать пренебрежимо малыми потери получателя, когда

г (с)<е, (17)

где е>0 - постоянная, смысл которой будет разъяснен в гл. 4. Чем меньше потери получателя, тем меньше учитывается при декодировании априорная информация о свойствах исходных изображений, которая содержится в плотности вероятности р(и), и тем ближе к с"1 оптимальный оператор декодирования (15).

Подставив р-х>о=с 1 в формулу (13), получим в силу (12) и (14) V ««Г1 (сС'и+О-

Приняв, что ев'1 и ><, разлагая правую часть в ряд и ограничиваясь членами ряда первого порядка, получим выходное изображение

у«и+би(82), (18)

которое отличается от оригинала вызванным шумом возмущением 5и(вг)-ФцС,

где

Ф *{ду /дэ ; д,г-1,----О) (19)

и д 2 , г*

- матрица, зависящая от исходного изображения. Подставив выражение (18) в формулу (16), получим средний риск

г ( С) =/ (/9 (и, и* 5и (в2)) дс (зг /и) Йз) р(и) Л.,

измеряющий заметность обусловленных возмущением узоров, наложенных на оригинал.

Заметность этих узоров мало зависит от выбора исходного изображения, лишь бы оно было типичным для ансамбля. Мало сказываются и различия структуры типичных изображений разных ансамблей, то есть средний риск слабо зависит от характеристик ансамбля изображений и определяется, в основном, свойствами канала связи. Поэтому заменим условие (17) формально более сильным условием

г(и, с)<е, (20)

где

г (и, С) -/8 (и, и+би(5г ))яс(вг /и) <3в2

- условный риск, измеряющий средние потери получателя при заданном исходном изображении.

Разные операторы кодирования будут обеспечивать выполнимость этого условия при разном отношении

«-Ч.х"8.,->/"<• <21>

где - стандартное отклонение шума, оптимальным оператором кодирования естественно называть такой, при котором это отношение минимальное.

В отличие от оператора обработки сигнала для улучшения выходного изображения, оптимальный оператор кодирования нельзя отыс-

кать теоретически без знания меры различия изображений. Поскольку такая мера неизвестна, будем искать лепсо реализуемые субоптимальные методы помехоустойчивого кодирования изображений, используя экспериментальные психофизические данные о различительных свойствах зрения.

Цифровое кодирование изображений. Рассмотрим теперь кодирование как представление дискрегизованного исходного изображения u={u(m,n)} комбинацией цифр - кодовым словом ке.{О.....К- 1J, которое можно передать по цифровому каналу связи или записать (например, в память ЭВМ). В процессе декодирования воспроизводится изображение V 6 {v • J-0.....tf-1}.

л z

Вследствие конечного числа воспроизводимых изображений, цифровое кодирование неизбежно связано с искажениями - отличиями декодированного изображения от оригинала. Оптимальный алгоритм цифрового кодирования должен обеспечить минимальное число к при условии, что эти отличия почти незаметны наблюдателю. Условие "почти незаметности" может быть сформулировано как

g(u,vfi)<e. (22)

Пространственную структуру исходных изображений не будем принимать во внимание на начальном этапе цифрового кодирования: исходное изображение может представляться любой точкой гиперкуба

E={u-. u , <u(m,n)<u ; (m,n)eQ). (23)

min max

Таким образом, разработка оптимального алгоритма цифрового кодирования требует отыскания минимального набора декодированных изображений (v^), при котором выполняется условия (22) для любого исходного изображения uet?, то есть посгрения минимальной г-сети во множестве Б.

Основная трудность решения этой задачи - отсутствие формального описания функции g(u,v). Но даже, если s-сеть построена, в общем случае практически невозможно реализовать процедуру кодирования - отображения и => к.

Поэтому был разработан легко реализуемый квазиоптимальный алгоритм, основанный на использовании экспериментальных психофизических данных о пороговых свойствах зрения человека и нейрофизиологических данных о преобразовании сигналов в зрительной системе животных.

Следует отметить, что две группы задач, сформулированных в п. 1.1 и п. 1.2, связаны между собой чем-то вроде принципа дополнительности: методы улучшения изображений опираются на априорную

информацию о пространственной структуре исходных изображений и почти не учитывают свойства получателя. Для методов кодирования изображений ситуация полностью противоположна.

1.3. Первичная обработка видеоинформации в системах компьютерного зрения и обработки изображений

Сегментация изображения сложной сцены. Изображение сцены, образованной различными предметами, обычно может быть расчленено на фрагменты, соответствующие отдельным предметам. Такая сегментация - важнейшая задача ПОВ в СКЗ.

Часто изображение сложной сцены состоит из пятен - совокупностей связных элементов почти одинаковой яркости с резкими границами между ними. Выделение этих границ - контуров есть одна из основных задач сегментации. Контуры играют важную роль в характеристике пространственной структуры сцены, поскольку с ними часто совпадают границы образующих ее предметов. Выделение контуров осуществляется в зрительной системе человека, будучи первым звеном в цепи преобразований, преводящих к пониманию видимой сцены. При сравнении воспроизведенного изображения с оригиналом в первую очередь обращают внимание на исчезновение контуров, имеющихся на оригинале, и на возникновение ложных контуров, например, вызванных действием шума.

Другая задача сегментации состоит в выделении из изображения сложной сцены фрагментов одинаковой текстуры, то есть заполненых характерным узором, свойственным поверхностям предметов или природным образованиям. Текстура играет значительную роль в интерпретации сцен.

Признаки, показывающие наличие контура или характеризующие текстуру, суть'символьнозначные переменные (метки). Они непосредственно не наблюдается, а проявляются косвенно, влияя на пространственную структуру поля яркостей - исходного изображения. Это влияние описывает условная плотность вероятности р(и/а), где а - совокупность меток. Чтобы найти эту величину, надо построить модель ансамбля исходных изображений, состояния которого зависят от набора меток. Такие модели рассмотрены в п. 2. з следующей главы.

Исходное изображение непосредственно не наблюдается. Мы располагаем только сигналом сенсоров, связь которого с исходным изображением описывается условной плотностью вероятности д(з/и). Усредняя по ненаблюдаемым параметрам - яркостям элементов исходного

изображения, получим условную плотность вероятности

(s/a)-/g(s/u)p(u/a)iiu, (24)

описывающую связь сигнала сенсоров с набором меток.

Введение вероятностной модели ансамбля наборов меток - симво-льнозначного случайного поля а (см. п. 2. з) позволяет найти р(а) - априорную вероятность набора меток а. Апостериорная вероятность Ppe (a/s)-P(a)?i (s/a)/ £ Р(а- (s/a- ). (25)

Зная апостериорную вероятность, задачу сегментации сводят к МСКО или HAB оцениванию меток по сигналу сенсоров.

Первичная обработка видеоинформации в СОИ. Выходное изображение может быть улучшено не только обработкой сигнала внутри ИС, но и обработкой его самого посредством СОИ. В этом случае ИС (чате всего фотографическая) и СОИ включаются последовательно, образуя сложную ИС, на выходе которой воспроизводится улучшенное изображение. Существуют задачи, например улучшение архивных фотографий, которые можно решить только таким способом.

Пусть выходное изображение (20) подлежит улучшению посредством СОИ. В результате обработки воспроизводится изображение

\i-Rv-RGHs. (26)

Найдем апостериорную плотность вероятности

Р (u/v)=p(u)<?' (v/u) /д' (v), (27)

Ра

где

Я' (v)-Jp(и)9' (v/u)du.

Поскольку операторы н и G детерминированные, условная плотность вероятности д'(v/u) полностью определяется плотностью g(s/u). Будем использовать МСКО и MAB оценки исходного изображения

"клв-arg max Pps(u/v). (29)

Если оператор н не вырожден, то эти оценки совпадают с (10) и (11), то есть обработка изображений посредством СОИ дает такой же результат, как непосредственная обработка сигнала сенсоров.

СОИ позволяет также производить анализ изображений, в частности, выделение контуров и текстур. Эти процедуры важны при анализе аэроснимков сельскохозяйственных и геологических объектов, изображений микрошлифов в материаловедении, микроскопических изображений биологических препаратов. Для сегментации изображений реализуются алгоритмы МСКО и MAB оценивания меток а по изображению v на основе апостериорной вероятности

где

Рр> (а/у)«Р(а)д; (т/а) / £ Р(а- )д; (т/а- ) , , а' (у/а) -/д' (у/и)р(и/а) ¿и,

(31)

Сложные алгоритмы улучшения и анализа изображений, требующие многих итераций, в настоящее время могут быть осуществлены только с помощью СОИ. Их реализация в ИС и СКЗ станет возможной лишь тогда, когда будут доступны устройства параллельной обработки сигналов, воспоизводящие архитектуру нейронных сетей зрительной системы живых существ,

2. ВЕРОЯТНОСТНЫЙ ПОДХОД К ОПИСАНИЮ СТРУКТУРЫ ИЗОБРАЖЕНИИ"

2.1. Измерение статистических характеристик реальных изображений [1-4, 7]

Составной ансамбль. Плотности вероятности случайного поля являются средними по ансамблю значениями некоторых функций яркостей элементов изображения. Обычно их нельзя найти из теоретических соображений, а приходится оценивать по результатам измерений статистических характеристик отдельных реальных изображений - представителей ансамбля, заменив усреднение по ансамблю усреднением по реализации.

Необходимым условием возможности такой замены является однородность ансамбля изображений, то есть независимость локальных вероятностных характеристик, относящихся к небольшим фрагментам изображений, от положения последних в поле зрения. Однородность есть свойство ансамбля изображений в целом, а не отдельных изображений, разные фрагменты которых могут иметь различную структуру. В однородном ансамбле такие различия не обусловлены положением фрагментов в поле зрения. Располагая одним изображением, нельзя ни подтвердить ни опровергнуть гипотезу об однородности ансамбля, то есть априорном равноправии (невыделенности) любых участков поля зрения.

Большинство ансамблей исходных изображений предметов внешнего мира могут считаться однородными, поскольку однородны свойства самого мира. Пример неоднородного ансамбля изображений - множество фотопортретов для паспорта. Свойства всех изображений этого ансамбля в центре поля зрения (лицо) отличаются от свойств на периферии (фон). Неоднородность данного ансамбля есть результат специальной композиции изображаемой сцены, нарушившей естественную однородность окружающего мира.

В теории случайных процессов, то есть случайных функций одного переменного - времени, указывается, что,для возможности оценивания вероятностных характеристик случайного процесса по одной его реализации этот процесс помимо однородности (стационарности) должен обладать еще эргодичностью, когда почти любая реализация может представлять весь процесс.

Изображения, типичные для данной ИС, которые надо считать различными исходами случайного опыта, то есть элементами одного ансамбля изображений, могут обладать существенно разными структурными свойствами, например, снимки водной поверхности и горной местности, сделанные одним аэрофотоаппаратом, или разноплановые кадры одного кинофильма. Такой ансамбль будем называть составнын, то есть состоящим из подансамблей изображений различной структуры. Случайный выбор конкретного изображения составного ансамбля осуществляется в два этапа: сначала выбирается подансамбль, а затем - изображение из выбранного подансамбля. Множество подансамблей может быть конечным, счетным или несчетным. Его можно рассматривать и как множество различных состояний ансамбля, которые определяют структуру типичных изображений. Подансамбль представляется случайным полем, плотность вероятности которого р(и/о() зависит от параметра л, характеризующего подансамбль или состояние ансамбля в момент выбора конкретного изображения.

При оценивании вероятностных характеристик по отдельному изображению получают статистические характеристики подансамбля, из которого оно выбрано, но не ансамбля в целом. Следовательно, составной ансамбль заведомо- не является эргодическим. Но эргодичность важна в том случае, если оценки вероятностных характеристик случайного поля, найденные по одним реализациям, использовать при обработке других реализаций. При составном ансамбле приходится применять разные алгоритмы обработки сигналов для исходных изображений различной структуры, принадлежащих разным подансамблям. Характеристики ансамбля изображений в целом не представляют практически интереса и не возникает вопрос об эргодичности.

Параметр определяющий выбор алгоритма обработки, является ненаблюдаемым (скрытым). Следовательно, обработке должна предшествовать оценка этого параметра. Таким образом, составной ансамбль исходных изображений требует адаптивных методов обработки 'видеоинформации, подстраивающихся под конкретное исходное изображение.

Оценивание моментов. Непосредственным измрением можно получить лишь простейшие статистические характеристики изображений - оцен-

ки моментов и плотностей вероятности первого и второго порядков. Для измерений использовалась система цифровой обработки изображений ИППИ АН СССР (СЦОИ). Несколько разнохарактерных фотографических изображения (транспорантов) сканировались микроденситометром и вводились в ЗВМ. Они рассматривались как визуализированные реализации дискретизованного однородного случайного поля. (Предположение об однородности приемлемо, так как не обнаружились факторы, нарушающие априорное равноправие различных участков поля зрения).

Были найдены оценки средних яркостей и 'дисперсии для этих изображений, а также оценки коэффициента корреляции для фрагмента из 7X7 элементов. Полученные данные показывают, что оценки моментов, найденные по разным изображениям, как правило, существенно отличаются друг от друга. Разные оценки дают даже разноплановые кадры одного кинофильма, которые по определению являются элементами одного ансамбля. Такой ансамбль изображений надо считать составным.

Оценивание плотностей вероятности. Введенные в ЭВМ изображения использовались также для оценивания плотностей вероятности первого и второго порядков. Измеряли распределение частот квантованных значений яркости и строили гистограмму - ступенчатый график этого распределения, которая есть оценка графика функции pf(u) - плотности вероятности первого порядка. Оценки, полученные для разных изображений, оказались существенно различными.

Распределение частот пар квантованных значений яркости (u=u(m,n),u'=u(m+i,n+j)), m=0,...,N-i-1, n=0, . . . ,N-j-1, i,j>0, служит для оценивания плотности вероятности второго порядка - функции pi(и,и';(i,j)). Для его визуализации можно построить ступенчатую поверхность -"двумерную гистограмму", которая будет аппроксимацией поверхности, определяемой этой функцией. Можно визуализировать распределение частот и как картинку на плоскости (и, и')-Но проще всего построить семейство гистограмм - оценок условной плотности вероятности - функции

р(и'/и; (i,j))-pi (и. и'; (i, j) ) /р. (и).

Хотя распределения частот второго порядка для разных изображений также отличаются друг от друга, четко выявляется их общее свойство: соседние элементы изображения имеют, как правило, близкие яркости. Когда числа i и j малы, то гистограмма условного распределения имеет узкий высокий пик вокруг значения яркости и', которое близко к и - яркости соседнего элемента, и длинные "хвосты", указывающие на то, что изредка яркости и и и' существенно отличаются друг от друга.

Эти черты обусловлены свойствами изображений, для которых характерны области почти одинаковой яркости с резкими границами между областями. Большинство пар соседних элементов изображения попадают в одну область и имеют близкие яркости (с ними связан пик на гистограмме). Сильно отличающиеся яркости могут иметь только небольшое число пар элементов, принадлежащих разным областям.

2.2. Марковская вероятностная модель ансамбля изображений

Гиббсовское случайное поле. Увеличение порядка оцениваемой плотности вероятности приводит к быстрому росту объема измерений, и при к > 3 они становятся практически невыполнимыми. Чтобы найти оценки плотностей вероятности нужного порядка, вводят вероятностную модель ансамбля исходных изображений, то есть такое случайное поле, структура типичных реализаций которого близка к структуре исходных изображений предметов окружающего мира, а его плотности вероятности представляются либо в параметризированной форме так, что их оценивание сводится к значительно более простой задаче -оцениванию параметров, либо как комбинации неизвестных, но доступных для оценивания функций небольшого числа переменных.

Разработка вероятностных моделей ансамбля изображений - основная задача теории ПОВ. В ходе работы были испробованы различные подходы к ее решению: изучались авторегрессионные модели [22], делались попытки построить случайное поле с изображениеподобными реализациями посредством преобразования поля с независимыми элементами [20], применялась "составная" модель фрагмента [23, 29], конструировались специальные марковские поля, сводимые к марковским цепям [31].

Наиболее удобными в качестве моделей ансамбля изображений оказались гиббсовские случайные поля и основанные на них иерархические конструкции.

Плотность вероятности х-го порядка (то есть совместная плотность вероятности значений случайных величин и{т1 ,п'),..., и{тх,пх)) для гиббсовского случайного поля есть

p(u(Qx))= ехр[-и(и(ох))]/гк, (1)

где Q -{(т .п ), к-1.....к} - множество элементов фрагмента слу-

К Я Я \

чайного поля; u(q^) - {u(т,п): (m,n)eQx) - /г-вектор значений случайных величин с/(л1й,ла); л(и(оя)) - потенциальная функция; . ■ /exp[-n(u(Qx)) ]е?и(ох) - нормирующая постоянная.

Потенциальная функция гиббсовского случайного поля играет роль

признака, определяющего размытые границы множества типичных исходных изображений: для типичных изображений ее значение близко к среднему по ансамблю, а для нетипичных - как правило, значительно превышает среднее, что приводит к малым значениям плотности вероятности.

Частным видом гиббсовского поля будет гауссово случайное поле с квадрагической потенциальной функцией

и(«(0,))-П ь ^-^Ни -и,)-(и-й>тв(и-й>.

л, 1= 1

где Ь - элементы (кхк) -матрицы в, обратной относительно ковари-

Ь , I

. ационной (кхк)-матрицы с = {с =<(и -и )(и -м,)>; к,1=л,.. .,к}-,

Ь. I Л л 1 I

Й=(Н1,...,РК) - вектор средних значений; т - индекс, обозначающий транспонирование; <...> - знак усреднения по ансамблю.

Результаты оценивания плотностей вероятностей первого и второго порядков по реальным изображениям (п. 2.1) свидетельствуют о существенных отличиях огибающих гистограмм от гауссовых кривых, что отражает разную локальную структуру таких изображений и реализаций гауссовых полей. Как уже говорилось, для изображений характерны области почти одинаковой яркости с резкими границами, а яркость визуализированных реализаций гауссовых полей меняется от элемента к элементу, как правило, более плавно. Применение более сложных, чем квадратические, потенциальных функций позволит получить модели ансамблей изображений с лучшими свойствами.

Марковское случайное поле. В общем случае неквадратическую функцию большого числа аргументов слишком сложно задать и, тем более, идентифицировать по реальным изображениям. Однако существуют гиббсовские случайные поля специального вида - марковские, которые просто описываются. Их удобно использовать как модели ансамбля изображений.

Пусть \з={и{т,п)) есть дискретизованное случайное поле, центры элементов которого с координатами хт = (л<-1/2)Л, ут = (т+ 1/2)й, и,л-0.....»-1, образуют квадратную решетку; и'=и\и(га,л) - совокупность яркостей всех элементов изображения за исключением (т,п); и •1и(1,у): (1,1)ео } - совокупность яркостей элементов, при-

т » п ш , п

надлежащих множеству ю^ : 0<(m-л)г + (n-j)г«?} - окрестно-

сти элемента (т,л). Согласно Р. Л. Добрушину (1968) случайное поле называют й-марковским, если условная плотность вероятности

р(и( т,п)/и>) = р(и(л1,л)/и ),

т ,П

то есть, если на вероятность значений случайной величины и(т,п) влияют только ближайшие соседи элемента (т,п) - элементы, центры

которых удалены от его центра не более, чем на hd.

Для простейшего марковского поля (d-1) множество

D« п"' О"'"-1). (m-1,n), (m, л+1), (т+1,л)} (2)

включает только четырех ближайших соседей элемента (m, л). В случае 21Уг<д<2 (для упрощения обозначений примем <7-1.5) к ним добавляется еще четыре элемента:

DM_n = {(m+i, л+j): i,j=-1,0,1; (i,J)*<0,0)). (3)

Элементам из этого множества присвоим номер к-1.....8 от элемента

(т-1,л-1) по ходу часовой стрелки, а их яркости будем обозначать как и . Тогда набор яркостей и »{и, к-1.....8).

te n, n Й

М. Б. Аверинцев (1970) доказал, что условная плотность вероятности для d-марковского случайного поля является гиббсовской:

plu /и ) -exp [ -IX ( u / и „)1/2(и ), (4)

О m, п О m • n m, п

где ио-и(т,п) и нормирующая постоянная

Z(u )-/exp(-U(u/и ))du m.n о то » n и

Потенциальная функция U(u /и ) есть сумма потенциалов взаи-

0 m, n

модействия групп элементов, центры которых разделены расстоянием не большим, чем hd. В каждую группу должен входить элемент (m, л). При d-1 потенциальная функция состоит из четырех слагаемых - потенциалов парного взаимодействия элемента (m,л) с элементами из окрестности (2). Если d-1. 5, то число слагаемых увеличивается до восьми потенциалов парного взаимодействия элемента (и,л) с элементами из окрестности (3), двенадцати потенциалов взаимодействия троек элементов таких, как ((ш-1,л), (m,л),(га,л+1)) и ((т-1,л+1), (л,л), (л;,л+1 )), а также четырех потенциалов взаимодействия четверок элементов таких, как ((т-1,л-1 ), (т-1,п), (т,л-1 ), (m,л)).

Для моделирования ансамблей изображений ограничимся 1.5-марко-вским случайным полем со взаимодействием только пар элементов. Будем предполагать также однородность, то есть независимость потенциалов от положения пары элементов в поле зрения. Тогда из восьми потенциалов парного взаимодействия достаточно задать четыре для различных ориентаций пары элементов, например, wft(u0>ил)> fc-1,.,.,4, а остальные потециалы будут выражаться через них:

W (и , и )- W (и , и ) , к-5.....8

i 4 .0 ь' М-4 4 А О '

Потенциальная функция условной плотности вероятности (4) для 1. 5-марковского случайного поля с парными взаимодействиями есть

tt(uo/u„.n) * Е ^VJ' <5>

А= 1

Четыре функции И'(и,и), к-1,.... 4, определяют потенциальную

А О Я

функцию совместных и условных плотностей вероятности любого поря-

дка для этого случайного поля. В частности, потенциальная функция совместной плотности вероятности О-го порядка значений яркости веек элементов изображения и-{и(т,п)) есть сумма потенциалов взаимодействия веек пар элементов изображения из множества

0"{(т,п): т,п=0,...,М-1} и краевого потенциала, учитывающего влияние элементов, лежащих за пределами поля зрения. Условившись, что , и^)-0, если и^еф,

имеем

8

и(и) = У(и )♦ I- ..I X »(и(в.л).и)/2, (6)

с (П, П> ео

где и - совокупность яркостей элементов множества о - <">,п):

с с

т, л-1..... N-2) - "рамки" поля зрения; 7(и_) - краевой потенциал.

Подставив (6) в формулу (1), подучим совместную плотность вероятности о-го порядка

р(и)= ехр[-и(ч))]/2, (7)

где нормирующая постоянная

2-/. .. /ехр[-и(и) ]йи. (8)

При справедливости рассмотренной 1. 5-марковской модели ансамбля изображений потенциалы парного взаимодействия полностью определяют пространственно-структурные свойства типичных изображений.

Потенциалы парного взаимодействия [42]. Пусть потенциал парного взаимодействия 1. 5-марковского поля есть квадратичная форма переменных ио и ий:

где Л - и -и - разность яркостей соседних элементов, или локальна О к

ный контраст; в , в -в , в -3,, в -в , Р.-в - положительные ко-

О 15 26 37 4 8

эффициенты; и - средняя яркость. Потенциальная функция плотности вероятности любого порядка, будучи суммой квадратичных форм есть квадратичная форма своих аргументов. Поэтому марковское случайное поле с квадратическими потенциалами взаимодействия соседних элементов является частным видом гауссового поля. Оно называется гауссовым марковским.

Плотности вероятности первого и второго порядков такого поля будут гауссовыми. Но, как уже говорилось, это не согласуется с результатами измерений статистических характеристик многих реальных изображений. Чтобы приблизить свойства реализаций марковской вероятностной модели к свойствам представителей моделируемого ансамбля, надо выбрать потенциал взаимодействия пары соседних элементов, возрастающий медленнее квадрата разности их яркостей для того, чтобы увеличить вероятности больших значений этой разности

по сравнению с соответствующими вероятностями для гауссовой модели. При этом желательно сохранить выпуклость функции ,.) и, следовательно, потенциальной функции (6) с тем, чтобы последняя имела единственный экстремум.

Среди выпуклых потенциалов парного взаимодействия с увеличением абсолютного значения разности яркостей соседних элементов медленнее всего возрастает потенциал

< V "»>"'«> <ио > + К> 1 \ 1' .....8- <10>

Слагаемые, зависящие от яркости одного элемента мало влияют на пространственную структуру реализаций марковского поля. Выберем их так, чтобы ограничить возможные значения яркостей:

^ ("„)={ ° е0ЛИ и».х>ио>и..„ . (11)

0 I со в противоположном случае

Функцию и )•I и-и I нельзя дифференцировать по ее аргумен-

А А

там. Поэтому удобно взять потенциалы парного взаимодействия

и (и ,и (и (и )+э О'Д2/?2)1'2. (12)

л4 о ъ' о4 о/ о4 ъ' "л4 л 4 '

С ростом разности при ее малых значениях функция (12) растет как А?, то есть как потенциал (9), а при больших значениях - изменяется как Iй I. Постоянная о служит порогом, условно разделя-

3* А

ющим участки квадратичного и линейного роста потенциала.

Подставив потенциалы (ю) или (12) в формулу (б), получим потенциальную функцию, значение которой определяется значениями разности яркостей соседних элементов. Если разность велика для многих пар конкретного изображения и-{и(га,л)), то функция и(и) будет иметь большое значение. Но в силу (7) вероятность такого изображения мала. Напротив, типичные (высоковероятные) изображения моделируемого ансамбля должны иметь, как правило, малые изменения яркости от элемента к элементу. Можно сказать, что потенциальная функция играет роль меры гладкости изображения, представленного массивом и, и что типичные изображения должны быть гладкими.

Потенциальная функция (б) гауссовой марковской модели с квад-ратическими потенциалами парного взаимодействия (9) также является мерой гладкости изображения при эо< т!п(э , Но с ростом разностей яркостей соседних элёментов она возрастает быстрее, чем мера гладкости с потенциалами (10) или (12). В результате негауссово 1.5-марковское случайное.поле оказывается лучшей моделью многих ансамблей изображений, чем гауссово, поскольку среди реализаций первого чаще встречаются массивы с большими перепадами яркости, если только число таких перепадов не слишком велико.

.Оценивание параметров марковских моделей. При разработке мар-

ковской модели ансамбля изображений потенциалы взаимодействия соседних элементов заранее не известны и их надо оценивать по реальным изображениям, которые считаются представителями этого ансамбля. А. А.Безрук (1983) разработал простой прямой способ оценивания потенциалов парного взаимодействия. Для нескольких реальных изображений была измерена их зависимость от разности яркостей соседних элементов. Оказалось, что эта зависимость хорошо аппроксимируется функцией (12) с различными наборами значений параметров и у для разных изображений. Если считать, что измеренные изображения принадлежат одному ансамблю, то его придется признать составным.

Более тщательный анализ результатов оценивания показывает, что для некоторых изображений функция (12) хорошо аппроксимирует реальную зависимость потенциала от разности яркостей соседних элементов лишь при небольших и умеренных ее значениях, а при больших значениях потенциал изменяется медленне, чем по линейному закону. Легко подобрать функцию разности яркостей соседних элементов, например, дробно-рациональную, которая будет аппроксимировать такую зависимость. Но потенциальная функция - сумма столь медленно возрастающих потенциалов взаимодействия уже не будет выпуклой. Если свойства типичных изображений приводят к необходимости иметь более медленный, чем линейный, рост потенциалов парного взаимодействия, следует обратиться к иерархической модели с разрывом связей соседних элементов.

Физическая модель гиббсовского ансамбля изображений [50]. Как известно (Л.Д.Ландау и Е. М. Лифшиц, Статистическая физика), плотность вероятности состояний тела из к частиц, которое находится в равновесии с окружающей средой, представляется распределением Ги-ббса (каноническим распределением):

р(ия)= ехр[ -Н(мк)/в]/гк, где ик - {и1,...,ик) - совокупность обобщенных координат частиц, описывающих состояние тела; И(ик) ' его потенциальная энергия и и в - температура среды (в энергетических единицах).

Эта формула совпадает с (1), если положить я(ик)/е -и(и(ок)) и и - и(т ,п ), (т ,п )ео . Следовательно, каждому ансамблю изобра-

к Ъ )г & 2ъ К

жений, представляемому гиббсовским случайным полем с плотностью вероятности (1), можно поставить в соответствие воображаемую физическую систему, состояния которой описываются обощенными координатами ик, а потенциальная энергия есть я(ик)-0и(и(ои)).. Примером физической модели ансамбля изображений может служить

система расположеных в 3-х мерном пространстве частиц с индексами (т,п), т,л=0,...,N-1. Декартовы координаты частиц хт п'(п*1/2)й и у п=(л1*1/2)Л фиксированы, и они могут перемещаться только в направлении оси и, перпендикулярной к плоскости (х,у). Каждая частица соединена с соседями упругими связями (пружинами), стремящимися выравнить их и-координаты. Другие связи удерживают эти координаты вблизи от среднего или в заданном интервале значений.

Набор координат и-{ип ; т,п=0,...,N-1} характеризует состояние системы. Она будет находится в этом состоянии, если к частицам приложить направленные вдоль оси и силы, преодолевающие сопротивление связей. Пусть приложенная сила и растяжение пружины связаны линейной зависимостью (законом Гука). Тогда потенциальная энергия пружины будет пропорциональна квадрату растяжения. Если пружины установлены так, что их растяжение пропорционально разности и-координат соседних частиц или разности и - и, то система

Я» , я

будет физической моделью гауссового марковского ансамбля изображений. Суммарная потенциальная энергия всех пружин пропорциональна потенциальной функции (6) с потенциалами (9).

Для физического моделирования марковского ансамбля изображений с потенциалами парного взаимодействия (ю) или (12) убирают пружины, соединяющие частицы с плоскостью и=ц и устанавливают ограничители значений координаты и, реализующие условие (11). Соседние частицы соединяют пружинами, приложенная сила и растяжение которых связаны нелинейной зависимостью. Например, чтобы обеспечить линейную зависимость потенциальной энергии пружины от абсолютного значения растяжения, как в формуле (10), сила, дествующая на частицу 1т,п) со стороны соседней частицы, должна быть равной

¿^(л!,л)-аез1дп(ит

где £ - коэффициент пропорциональности.

Как уже говорилось, потенциальная функция и(и) может рассматриваться как мера гладкости профиля, описываемого массивом и. Физическая аналогия подверждает разумность такой интерпретации, поскольку потенциальная энергия упругой системы является естественной мерой гладкости профиля, описывающего состояние системы.

Физическую модель ансамбля изображений можно построить и для недискретизованных изображений. Если устремить к нулю шаг дискретизации, то потенциальная функция перейдет в функционал - интеграл по полю зрения потенциалов взаимодействия бесконечно малых элементов изображения. Используя понятия дифференциальной геометрии и теории упругости, можно конструировать упругие системы -

мембраны или пластинки с различной потенциальной энергией и затем строить гиббсовские вероятностные модели ансамблей изображений.

2.3. Иерархические модели [43, 47, 48, 54]

Символьнозначное марковское поле. Пространственная структура некоторых предметов описывается не действительнозначной функцией пространственных переменных, а совокупностью символов, качественно характеризующих различные участки поверхности предмета. Вероятностной моделью ансамбля исходных изображений - совокупностей символов будет символьнозначное случайное поле. Обычно распределение символов непосредственно не наблюдается, а проявляется косвенно, влияя на пространственную структуру некоторого наблюдаемого физического поля. Комбинация символьнозначного поля и физического поля моделируется иерархической конструкцией - гауссовым марковским случайным полем с потенциалами, управляемыми символами.

Пусть А-[А(т,п)} обозначает символьнозначное однородное 1.5--марковское случайное поле. Случайные величины д(т,л) принимают конечное число значений: ,на месте (т,п) может стоять один из l символов, которым присвоены порядковые номера i-o, ...,l-i. Эти символы качественно характеризуют соответствующие участки поверхности предмета. Совокупность символов (меток) а-{а(л,л)}, где а(л!,я)е{0,..., L-1) - значение случайной величины л(т,п), разбивает поле зрения на области связных элементов с одинаковыми метками

qj'{(m,n) : а(т,п) -I(j) }, 1( j>e{0,. . . , L-1), j-1.....j.

Символьнозначное однородное 1.5-марковское случайное поле задается потенциалом взаимодействия четверки элементов

W ' ff(a(m,n), a(m,п+1), a(m+1 ,л), а(лм-1, л+1)). (13)

Этот потенциал определяет распределения вероятностей любого порядка. Условная вероятность

P(a(m,n)/a ) - exp[-S(a(ni, n)/a )l/z(a ),

, т. п ш »7% т, п

где

потенциальная функция

3(а(т, л)/а ) - № *И +W ; (14)

m.n »i-l.n-l m-1 ,n m.n-1 m.n

и нормирующая постоянная £- 1

z(а ) - У ехр[-Я(а(ш,л)/а )].

ш , т» т , п

а (тп, п) = О

Потенциальная функция для совокупности всех меток есть

»■Он* О

где v(a(Q )) - краевой потенциал, зависящий от символов a(Qc) на рамке Q . Вероятность этой совокупности меток выражается формулой Гиббса:

Р(а) - ехр[ - Я(а)]/гж, (15)

где нормирующая постоянная

z, - I expl - Я(а)1. а

Потенциал (13) однородного ¿-значного 1. 5-марковского поля можно задать таблицей его значений для L4 комбинаций значений четырех аргументов. Некоторым комбинациям должны соответствовать одинаковые значения потенциала в силу однородности поля и, возможно, инвариантности его свойств относительно поворота изображения на 180°. Чем меньше значение потенциала, тем чаще будет встречаться соответствующая- четверка символов в типичной реаализации. Набор этих значений управляет характерной формой областей, заполненных одинаковыми символами.

Марковская модель ансамбля рисунков. В процессе дискретизации изображение, представляемое функцией и(х,у). разбивается на малые

элементы прямыми x=nh; y-mh\ л, m=1,___,W-1. Будем использовать

отрезки прямых длины л, которые совпадают с границами элементов, для аппроксимации рисунка - двоичного изображения, состоящего из тонких линий и фона.

Точку пересечения прямых x-nh и упЛ обозначим tm, л] и назовем узлом рисунка. Четыре узла tm+i,n+j], i,j=0,l, суть вершины квадрата, ограничивающего элемент (m,n). Множество узлов • G-{[m, л]; тп,л=1, ... ,Я-1}

образует решетку, сдвинутую на (А/2, Л/2) относительно решетки, состоящей из центров элементов {(л>,л); т,п=0,..

Назовем ребром рисунка Ь2ь(т, п), к-1.....4, обдую границу элемента (т,л) и его 2к-го соседа из множества (2). Положим

Ь (m r>)-í 1 0СЛИ элементы (т,л) и 2& разделены линией рисунка г* I 0 в противоположном случае. Очевидно, что í>2 (га,л)-Ьб (я1-1 ,л) и bg (a,n)-bt (ш,л-1). Ребро í>2(m,n)-1 соединяет узлы [т,л] и [ш,л+1], ребро Ь8(л1,л)-1 - узлы

(п,п].И [т+1,л] И Т.Д.

•Узел [т,п] может быть изолированным или соединяться с одним, двумя, тремя или четырьмя соседними узлами. Шестнадцать его возможных состояний определяются значениями четырех ребер

ь[«,п) ~(Ь2 (л1'л)'г>4 (я-1/П-1),Ь6 (л-1,п-1),Ь8 (т,л)).

Конкретный рисунок описывается совокупностью состояний всех узлов

- массивом (дм)2 четырехразрядных двоичных чисел

Ь-{Ь ; [ш,п]ес}

I В ) П 1

или набором значений всех ребер - массивом 2«(ы-1) двоичных цифр.

Будем рассматривать этот массив как реализацию двоичного однородного марковского случайного поля в - вероятностной модели ансамбля рисунков. Это поле задается потенциалом узла й(Ь, ), то

[ ■■ п]

есть потенциалом взаимодействия четверки подходящих к нему ребер. Потенциал узла может принимать шестнадцать значений ..., ^ соответствующих его состояниям.

Условная вероятность значений ребра, например

Р(Ьг (л,л)/Ь (л,л))-ехр[-»(Ь[И1П] )-»(Ь[в> ] )]/г(Ьг (я,я)), (16)

где Ьг (т, л) -

(.Ьк (т-1 ,п-1) ,Ь6 (лг-1,л-1),Ье (т,п),Ьг (а,л+1) , (лг-1 ,п),Ьв (лг,л+1))

- шесть ребер, соединяющихся с ребром Ьг (га,л);

*(Ьа <«,!»))- 1ехРГ -~*(Р ) "»О», +1,)Ь

Потенциальная функция всего рисунка

В(Ь)-Е I »(Ь „,) ♦ КЬс), (17)

I в, п1'

где У(Ъ ) - краевой потенциал. Вероятность рисунка выражается фо-

с

мулой Гиббса:

Р(ь) - ехрГ - В(Ъ)1/гъ, (18)

где нормирующая постоянная

2-Е ехр[ - в(ь)]. ь Ь

Однородное двоичное поле, предлагаемое в качестве модели ансамбля рисунков, является 1. 5-марковским. От двоичного 1. 5-марковского поля меток оно отличается тем, что в потенциальную функцию условной вероятности (16) входит только два потенциала взаимодействия четверок ребер вместо четырех слагаемых в формуле (13).

Если,отождествить состояния узла, переходящие друг в друга при повороте на 180° и сдвиге вдоль осей х и у, то модель рисунка будет определяться девятью значениями потенциала узла. Чем больше значение потенциала, тем реже будут встречаться в типичном рисунке узлы в состоянии к. В частности, если значения потенциала, соответствующие состояниям узла (0,0,0,1); (0,0,1,0); (о, 1,0, о) и (1,0,0,0), значительно больше остальных значений, то типичные ри-

сунки практически не будут иметь разрывов линий внутри поля зрения. Такая модель задается семью значениями потенциала узла.

Иерархическая модель ансамбля изображений, состоящих из фрагментов почти одинаковой яркости. Многие реальные изображения состоят из фрагментов почти одинаковой яркости с резкими границами, отделяющими один фрагмент от другого. Вероятностная модель ансамбля таких изображений строится как иерархическая двухуровневая конструкция. Верхним уровнем мбдели служит управляющее двоичное однородное 1. 5-марковское случайное поле рисунков в. Линии рисунка, представляемого массивом ъ - реализацией поля в, трактуются как границы, разделяющие фрагменты почти одинаковой яркости.

Нижний уровень - гауссово 1.5-марковское случайное поле с парными взаимодействиями и/Ь, реализации которого суть совокупности яркостей элементов видимого изображения. Поле и/Ь характеризуется потенциалами взаимодействия соседних элементов

("о ' "*> - ("о (( "о * < V»)2 )А»)/2, к-1.....8. (19)

Эта формула отличается от (9) только зависящим от рисунка коэффициентом е (т,п), который может иметь два значения, О и 1. При че-

А

тном к коэффициент е}>(я,л) -1 л), то есть соседние элементы

вертикальных и горизонтальных пар не взаимодействуют, если они разделены линией рисунка. При к - 1,3,5,7 в (л,л) -о, если линия рисунка пересекает прямую, соединяющую центры элементов диагональных пар.

Гауссово марковское случайное поле и/Ь не будет однородным: конкретный рисунок границ Ь структурирует поле зрения и различные участки его перестают быть априори равноправными.

Подставив выражение (19) в формулу (5), найдем потенциальную функцию условной плотности вероятности

и(и0/ив п,Ь(т,л))-((?о(ио-р)2^ Э}1Ел(я,,л)А^(т/л))/2, (20)

»= 1

где Ъ(т,п)-(Ьг (л?,п), Ь^ (т, л), Ь (т,-п), Ьд (т,п)) -четверка ребер, окружающих элемент (т,л), которые определяют значения коэффициентов ей(л!,л). В силу (4) условная плотность вероятности .

р(и /и ,Ь(я?,л))-ехр[-и(и /и ,Ь(т,л))]/г(и ), (21)

О щ » п О т.п и,п

где нормирующая постоянная

г(ии в,Ь(и,п))-/ехр[-И(и /и п,Ь(т,п)) ]с?и. (22)

В силу (б) потенциальная функция совместной плотности вероятности видимого изображения, представляемого массивом яркостей и, при заданном рисунке ь есть

и(ч/Ь)-у(и /Ь )♦ £ Е(Э„ (и(я1,п)-ц)2 £ Э 6 (л1,п)А2(щ,п>)/2,

с с (т.п)60 2*=» " * *

где У(и /Ьс) - краевой потенциал.

Эта плотность вероятности определяется гиббсовской формулой: р(и/Ь) - ехр[-Ц(и/Ь)]/2(Ъ), (23)

где нормирующая постоянная

г(Ь) - ../ехр[-И(и/Ь)]<Л1. Изображение и можно считать результатом двухэтапного случайного выбора. На первом этапе выбирается рисунок линий, разделяющих невзаимодействующие элементы, а на втором - яркости всех элементов.

Если коэффициент Э0< »1п(0.....то случайное поле о/Ь от-

отличается сильным взаимодействием соседних элементов изображения внутри связной области. Они будут иметь почти одинаковую яркость. Элементы, разделенные линией, не взаимодействуют, их яркости не связаны друг с другом и по воле случая могут существенно различаться. Значит типичные реализации этого случайного поля будут состоять из фрагментов почти одинаковой яркости.

Свойства реализаций этого поля становятся наглядными, если обратиться к физической модели. Рассмотрим систему соединенных пружинами частиц, в которой разорваны пружины, пересекаемые линиями рисунка. Соединенные жесткими пружинами частицы, входящие в один фрагмент, имеют почти одинаковые координаты. Группы частиц из разных фрагментов не соединены между собой и могут иметь существенно различные координаты.

Величины Ь^(т,п)еъ, описывающие рисунок границ, являются ненаблюдаемыми. Поэтому видимое изображение, представляемое массивом и, надо считать реализацией однородного (в отличие от и/Ь) составного случайного поля о с плотностью вероятности . р(и) - I Р<Ь)р(и/Ь), (24)

где Р(Ь) - вероятность рисунка (18).

Составное случайное поле а - двухуровневая вероятностная модель ансамбля изображений, состоящих из фрагментов почти одинаковой яркости, характеризуется тринадцатью параметрами: семью значениями потенциала марковского поля рисунков, средней яркостью и пятью коэффициентами гауссового 1. 5-марковского поля яркостей. Если эти параметры неизвестны и их нужно оценивать по реальным изображениям - представителям ансамбля, то следует прибегнуть к итеративной процедуре, чередуя оценивание параметров модели и ненаблюдаемых величин, описывающих рисунок.

Модель сложного изображения. Многие реальные изображения сос-

тоят из разнохарактерных фрагментов, например, соответствующих различным предметам, которые образуют изображаемую сцену. Вероятностную модель ансамбля сложных изображений строят как иерархическую двухуровневую конструкции с управляющим 1.5-марковским сим-вольнозначным случайным полем меток а на верхнем уровне и гауссовым 1. 5-марковским случайным полем о/а с управляемыми потенциалами парного взаимодействия соседних элементов на нижнем уровне.

Пусть имеется х типов гауссовых 1. 5-марковских случайных полей с парными взаимодействиями 01, 1-0,1,... ,£-1, которые отличаются средней яркостью р(г) и набором коэффициентов ..., Типичная реализация случайного поля иг имеет структуру, характерную для изображения 1-го типа. Конкретное видимое изображение, представляемое массивом яркостей и-{и(т,л)}, рассматривается как результат двухэтапного случайного_выбора. На первом этапе выбирается а-{а(л!,п)} - реализация управляющего ь-значного 1.5-марков-ского случайного поля меток а, которая разбивает поле зрения на J областей связных элементов с одинаковыми метками. На втором этапе выбирается представляющий видимое изображение массив

и - {и{л,л):(л1,л)€С)-(и(01),. ...4(0^), (25)

где связная область Ъ~{(т,в): а(га,п)«1(^)), 1О)е{0.....ь-1) и

и(о^)-{и(я,л): (я,л)ео^}, - фрагмент реализации случай-

ного поля VгlJ)■

Можно сказать, что на первом этапе определяется форма и тип фрагментов изображения, то есть его макроструктура, а на втором этапе - микроструктура изображения. При известных метках массив (25) есть реализация неоднородного гауссового 1.5-марковского случайного поля и/а с потенциалами парного взаимодействия

Ч-Юг<(ЙП <«л-и)г)^8г.г(*,<1> А»)/2. (26) где 1(к)*ак - метки элементов пары; ?>- дельта-символ,

показывающий, что соседние элементы взаимодействуют, только если они принадлежат одной области (когда 1*1'); к-1,...,8.

В силу (26) потенциальная функция условной плотности вероятности этого поля есть

?г = 1

а потенциальная функция совместной плотности вероятности д-го порядка при заданном распределении меток в поле зрения

1Г(и/а)-( Е I ру (»<*.»)-»'"^а-Ь,

(т.п)ео

Эта плотность вероятности

р(и/а)-ехр[-И(и/а)]/2(а), (28)

где нормирующая постоянная

Z(a) - /.. . Jexp[-ll(u/a)]du.

Метки a-{a(m,n)} обычно ненаблюдаемы. Поэтому видимое изобра-хение надо считать реализацией однородного составного случайного поля о с плотностью вероятности

p(u)-I P(a)p(u/a), (29)

а

где р(а) - вероятность совокупности меток (15).

Составное случайное поле и - двухуровневая вероятностная модель ансамбля сложного изображений, состоящих из разнохарактерных фрагментов, описывается L* значениями потенциала управляющего ь-значного 1. 5-марковского поля меток и бь параметрами L гауссовых 1. 5-марковских полей яркостей. Оценивание их по реальным изображениям обычно осуществляется в рамках итеративной процедуры.

3. БАИЕСОВЫ МЕТОДЫ ПЕРВИЧНОЙ ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ 3.1. Вводные замечания

Классификация задач первичной обработки видеоинформации, основанных на байесовом оценивании. В гл. 1 было показано, что большинство задач ПОВ сводится к МСКО или MAB оцениванию признаков, необходимых для воспроизведения выходного изображения или анализа видеоинформации в СКЗ и СОИ. Дальнейшая классификация задач улучшения и сегментации изображений обуславливается принятыми моделями ансамбля исходных изображений и механизма формирования сигнала сенсоров, так как эти модели определяют вид апостериорной плотности вероятности или распределения апостериорных вероятностей.

В пп. 3.2, 3.4 и 3.5 будут рассмотрены задачи улучшения изображений: восстановление испорченных элементов; фильтрация - ослабление действия аддитивных помех; исправление линейных искажений. Они решаются при разных предположениях о модели ансамбля исходных изображений. П. 3.3 посвящен задачам сегментации - выделению контуров и текстур.

Поскольку для вывода алгоритмов ПОВ безразлично, на каком уровне будет производится обработка в реальных ВИС, для сокращения текста все задачи рассматриваются применительно к обработке выходного изображения в СОИ.

Обработка при неполной априорной информации. На практике часто приходится производить обработку сигнала, располагая неполной априорной информацией о структурных свойствах исходного изображения или (и) о механизме формирования сигнала. Априорная плотность ве-

роятности p(u/<j() может зависеть от ненаблюдаемых параметров а, характеризующих состояние ансамбля исходных изображений, а условная плотность вероятности <j(s/u, ß) - от ненаблюдаемых параметров ß, которые обычно описывают изменчивость состояния среды и характеристик ВИС. Не только значения, но часто и вероятностные характеристики ненаблюдаемых параметров неизвестны, а некоторые из них могут быть неслучайными. Апостериорная плотность вероятности

р (u/s,ß)=p(u/<t)q(s/u,ß) /g(a/<i,ß), р»

где

g(s/<*,ß) =/р(и/<<) g(s/u,ß) du, также будет зависеть от неизвестных параметров, что не позволит осуществить МСКО и MAB оценивание исходного изображения.

' Поэтому в практике обработки изображений нашли применение различные небайесовы процедуры оценивания, которые менее требовательны к полноте описания свойств исходных изображений и механизма формирования сигнала, например, устойчивое (робастное) и минимаксное оценивание. Но чем меньше используется априорная информация, тем менее эффективным будет метод обработки сигналов.

Если недостаток априорной информации сводится к незнанию значений влияющих на апостериорную плотность вероятности ненаблюдаемых параметров, то с байесовым оцениванием яркостей или меток элементов исходного изображения можно сочетать оценивание этих параметров. Такие методы обработки сигналов называют адаптивными байесовьти. Если число параметров мало по сравнению с числом элементов исходного изображения, то адаптивные байесовы методы приводят к выходным изображениям, которые мало отличаются от байесо-вых оценок исходного изображения при наличии полной априорной информации. В то же время, адаптивные байесовы методы, как правило, эффективнее небайесовых методов.

3.2. Восстановление испорченных элементов изображения [15, 17, 19, 21, 34, 36, 41]

Алгоритм восстановления на основе МСКО оценивания исходного изображения. Во многих ИС возникают специфические искажения, при которых в значительной степени или полностью теряются сведения о яркости некоторых элементов исходного изображения. Эти искажения вызываются повреждениями носителя записанного сигнала - царапинами на фотослое или дефектами магнитной ленты, сбоями в цифровых системах передачи и записи информации, аномальными ошибками в канале связи. К таким же потерям приводит неисправность отдельных

((■/»)■{0

сенсоров, измеряющих входное поле ИС и СКЗ.

Предположим, что отсутствуют другие причины искажений выходного изображения. Тогда его можно представить массивом

v- { у(я!,л)- (1 -х(д1,п) ) и(т, л)+г(л1, л)г(т, л) },

где и-{и(л!,л)) - исходное изображение; г-{ае(я,л)} - совокупность меток, принимающих значения

О если сохраняется исходная яркость элемента (т,п). в противоположном случае г(т,п) - значение сторонней величины, независящей или слабо зависящей от исходной яркости.

Чтобы исправить искажения, надо найти и-{и(т,п)> - МСКО оценку исходного изображения по выходному изображению. Для вывода алгоритма исправления нужно знать апостериорную плотность вероятности исходного изображения (1.27).

Если испорченные элементы обнаруживаются безошибочно, а сторонние величины независят от исходных яркостей, то условная плотность вероятности, описывающая связь наблюдаемого изображения с исходным при известных метках, есть

д(у/и,®) = П В( т, п)-и(т, л)) <р(у(0 )). (1)

(п.п) е^

где ол-{(т,л): 2(т,п)-к) - множество неповрежденных (к-0) или испорченных (А-1) элементов; <р(.) - плотность вероятности сторонних величин. Апостериорная плотность вероятности

р (и/у, г) =р(и) д(у/и, г) /д(у/г) (2)

рв

где

д(у/г)=/р(и)д(у/и,г)аи-р(у(00))(р(у(01)). (3)

В силу тождества р(и)-р(и(до))р(и(01)/и(оо)), определения (1.28) и формул (1)-(з) МСКО оценка есть

и(г)-;и р(и(00))р(и(01)/и(00)) П б(ур(я!,л)- и(т,л))<Зи/р(у(Оо) или <■»."> еао

л А ___

и (г) - { и(ш, п) - (1 -г (л, л)) у(ш, л)(а, л) и (я, л) ), (4)

где

и (от, л) -/и (га, л) Р ( и (га, л) /у (Оо ) ) <3а (га, л) - предсказанная яркость элемента (т,л)ео по известным яркостям и(00)-у(00).

Следовательно, при известных значениях меток наблюдаемые значения яркости испорченных элементов не используются и заменяются предсказанными значениями.

Если по наблюдаемому выходному изображению нельзя достоверно определить, какие элементы испорчены, то совокупность значений

нетки считают ненаблюдаемой реализацией двоичного случайного поля. Пусть Р(х) - априорная вероятность значений метки е-{я(т,п)). Тогда условная и безусловная плотности вероятности выходного изображения суть

g(v/u)- I P(S)g(v/u,a>); g(v)- I P(s)q(y/s). ®е{г) ге{г)

Поделив и умножив на величину (3) апостериорную плотность вероятности при неизвестных значениях метки

р (u/v)-р(и)£ Р(г) g(v/u,a>)/g(v) рв г€{®>

ее можно представить как

PD„(«/v)- 1 р (®/v)p (u/v,s), (5)

р $€{£} р" ра

где

Р (i/v)-P(s)g(v/®)/g(v) (6)

Р®

- апостериорная вероятность значений метки при заданном выходном изображении.

В силу (5) МСКО оценка при неизвестных значениях метки и- 1 г (*/»)"(»).

S6{S> р*

Подставив в эту формулу выражение (4), получим МСКО оптимальный алгоритм

0-{и(л,л)-(1-Р (1/v))v(m,n)+P (1/v)<u(m,n)> },

Р® рв 1

где р (1/v) - апостериорная вероятность события ®(я,л)-1. Пред-

ре

сказанное значение яркости элемента (га,л) усредняется по всевозможным наборам значений метки (т,п) при условии а?(я,л) -1:

<и(т,п)> - X и(л?,л)р (г'/г(л)„л) = 1,у). 1 ®'б{®'} ря

Упроченный алгоритм восстановления. Апостериорную вероятность "Ppa(k/v) и усредненное значение <й(га,л>1 в общем случае вычислить трудно. Поэтому был разработан субоптимальный алгоритм, состоящий из двух операций - обнаружения испорченных элементов (оценивания меток) и замены наблюдаемых значений яркости предполагаемых испорченных элементов предсказанными значениями.

Применялся итеративный поиск оценок меток, максимизирующих вероятность (6). Пусть найдено t-oe приближение sc-(st(т,л)). Оценка следующего приближения

■fM (■/«)■ { 1 ЭСЛИ Рр.(1'''/у)/РР.(0/1'/у)>1, (л.,л)е<2. (7) I 0 в противоположном случае

где (т,л).

Отноиение апостериорных вероятностей есть

v(m, л)/v(q; )) /р(v(m, л)/v(<£)). (8)

где г£ (i,j)=k)\{m,n), Л-0,1; я-р(1/а*)/р(0/а^). '

Для большинства ансамблей типичны исходные изображения с сильной корреляцией значений яркости соседних элементов. Условная

Л.

плотность вероятности p(v(m,n)/v(Qo)) сосредоточена вокруг условного среднего значения - предсказанной яркости

Ъг (m,n)=fu(m,n)p(u(ni,n)/v(Q^))du(m,n) и имеет малую условную дисперсию. В тех системах, где испорченные элементы обнаружить наиболее трудно, сторонние величины являются независимыми с равномерным распределением <р (z) = 1/(u -и , ). В

1 пах nil)

таких случаях отношение (8) определяется, в основном, разностью v(m,n)-u*(т,п) и правило (7) заменяется:

г£*1 (л>,л)« | 1 если I у(т,п)-й'(m,n) |>h' ^ (я#я)е„, (9)

^ 0 в противоположном случае где Ьг -порог, зависящий от условной дисперсии, отношения jt и других факторов.

В результате итерации вероятность (б) не может уменьшиться, поэтому итеративная процедура сходится на г-ом шаге, хотя не обязательно достигается глобальный максимум апостериорной вероятности. За оценки нулевого приближения следует взять ж0» {в0 (т,п) »0}. Выходное изображение

u={ u(m, л)-(1 -аТ (л>,л) ) v(m, n)+hT (m,n)uT (m,n) }. (10)

Обнаружение испорченных элементов обусловлено вызванными ими изменениями пространственной структуры изображения. Эффективность обнаружения зависит от полноты моделей ансамбля исходных изображений и механизма искажений.

Реализация алгоритма. Несколько вариантов алгоритма были осуществлены посредством СЦОИ. Предполагалось, что повреждения элементов происходят независимо с известной априорной вероятностью р . Предсказание прозводилось по яркостям элементов (i,j) из множества Q - небольшой фиксированной окрестности элемента (т,п), рг

независящей от значений меток.

Сравнивались различные процедуры предсказания. При справедливости гаусс-марковской модели ансамбля исходных изображений бетеле

ственно выбрать q ~d Л q . Условное среднее значение

р г т, п О

u' (m,n) = (<iu+I(i-a')s )

- линейная комбинация яркостей соседних неиспорченных элементов. Оно же доставляет максимум условной плотности вероятности.

В случае предсказания, основанного на марковских моделях с не-

квадратическими потенциалами вместо среднего вычисляли предсказанное значение, минимизирующее потенциальную функцию условной плотности вероятности:

uc(m,n)-arg min U(u(m, n)/v(Q ))

где «<».»>

П(и(я.я)/у(0 ))-Г (1-в*)Э„(1*(и(|».я)-»' )2)/**),/а

р г 3»= 1

или

8

и(и(т,п)/у(0 ))- I (1-г*)3„1и(л,п)-»' I. Р Г к= 1

Для второй потенциальной функции в случае "Э2=Э3"Р4 предсказанная яркость есть медиана набора яркостей v(Qpr)•={v(i,;;); Ь

При Р(1)<0.2 предсказание, основанное на марковской модели с неквадратическими потенциалами обоих видов, обеспечивало восстановление изображений, которые почти не отличались от оригиналов. Линейное предсказание дало менее удовлетворительный результат, поскольку гаусс-марковская модель недостаточно полно описывает структуру использованных исходных изображений.

Вариант алгоритма с медианным предсказанием был осуществлен с помощью вычислительной системы параллельного действия сыр-4 в Университетском колледже г. Лондона.

Был реализован также не требующий итераций рекуррентный вари-риант, когда во множество о входили только элементы, предиест-

рг

вующие (т,л) по ходу развертки. Такое предсказание менее эффективно, чем в итеративном варианте, зато рекуррентный метод может быть применен в телевизионных устройствах в реальном времени. Эксперименты показали значительное улучшение качества восстановленного телевизионного изображения.

3.3. Сегментация сложного изображения [35, 38, 47, 48, 52-54]

Выделение контуров. При справедливости вероятностной модели ансамбля изображений, состоящих из фрагментов почти одинаковой яркости, которая описана в п. 2.3, выделение контуров есть обнаружение границ, разделяющих невзаимодействующие элементы. Истинный, но неизвестный рисунок границ описывает совокупность состояний всех узлов - массивом (N-1 )2 четырехразрядных двоичных чисел Ь-{Ь[в ; [л1,л]еО,

где Ь, ,-(Ь (л!,л),Ь (т-1,л-1),Ъ (т-1,л-1),Ь (т,п)) - набор дво-

I а, Л ) 2 4 -6 8

ичных меток - признаков границы. Выделение контуров сводится к баесовому оцениванию ненаблюдаемых меток по сигналу сенсоров на основе апостериорной вероятности р (Ь/в) (см. (1.24) и (1.25)).

р®

Поскольку оператор формирования выходного изображения не вырожден, оценки меток можно искать и по выходному изображению ч~вз. Пойдем на некоторое упрощение задачи. Считая, что изображение V практически не отличается от исходного, будем искать массив МАВ оценок

Ь-агд шах р (Ь/и)-агд шах Р(Ь)р(и/Ь) (11)

Ь рв Ь

где р(Ь) - вероятность рисунка и р(и/ь) - условная плотность вероятности для яркостного поля при заданном рисунке границ определены формулами (2.18) и (2.23).

Иногда проще искать массив локальных МАВ оценок

А А

Ь-{£> (л),п)-агд тах Р (Ь (т,п)/и)}, (12)

* о,1 рв *

которые, вообще говоря, отличаются от глобальных МАВ оценок (11).

Простейший способ поиска оценок (11) - поэлементная релаксация стоит в том, что последовательно независимо друг от друга находятся оценки каждого ребра, считая остальные известными, затем эта процедура повторяется для уточнения оценок и т.д. Пусть найдены ь' - оценки ¿-го приближения и ь' - ь\ ь' (т,п). Оценка ребра Ьъ(т,п) следующего приближения

^(^Л)-/ 1 если л " 0 ; (13)

I о в противоположном случае

где х- 1п(р (1,ь'/и)/р (о,ь'/и)) -

ра * ре •

1п(Р( 1, Ь* ) /Р( О, Ь^ ) ) +1п(р(и/1, Ь^ ) /р(и/0, Ь.' ) ) . В силу (2.16) И (2.23)

(11(^/1)-и^)2/2 +1п(л(0,ь^)/2(1,ь')),

где [л!',л'] и [т",л"] - узлы рисунка, соединяемые ребром Ь^(т,п); ь1.1~ )ЧЙ*<я,'л) (шесть ребер (Ь|в, _п, ],Ь'[т„_ д,.)) - ЬА(т,л));

z(íi,ъl)-S■ ■ ■ S ехр[-и(и/*, Ь*)]А1, 2-0,1. Логарифм отношения нормирующих постоянных слабо зависит от Ь^ и его можно заменить некоторой постоянной с. Тогда величина л будет зависеть от шести ребер Ь^ (л>,л):

X (Ъм (я, л) ) - с+з^ ( и(т, л) - ий)2 / 2+

»(о.ь; , „ „,)-»(1,ь; , ,.)-й,(1,ь' и „,). (14)

1м», п'] I и " , п " ] 4 I»* , п р 1 [ш", п " 1 '

К сожалению, просто реализуемая поэлементная релаксация часто останавливается вдали от абсолютного максимума апостериорной вероятности, застревая в локальном экстремуме. Можно повысить ее эффективность, если вместо "жесткого" решения (13) ввести рандомизированное правило, допуская с вероятностью ехр{ -а/г) оценки, приводящие к убыванию максимизируемой функции. Параметр т - "температура" уменьшается с каждой итерацией. Эта процедура, названная "отжигом", предложена KJ.rkpatri.ck еЪ а1.(1983). При достаточно долгой работе алгоритма можно достигнуть глобального максимума

апостериорной вероятности р (Ь/и).

рв

В.М.Новиков предложил метод поика оценок (12), основанный на итеративной процедуре приближенного вычисления апостериорной вероятности

Р (Ь (л,л)-1 /и)- (1/Ь (ш,л),и)^ (Ь(ш,л)/и), (15)

ре Я ^ /_ ре л ре Л

где ЬА(л,л)

Р (1 /Ь (л>, л), и)-1 / (1 +ехр[ -А(Ь (я1,л))]), (16)

рв Я А

где величина а(.) определена формулой (14). В правой части равенства (15) стоит результат усреднения функции (16) по ансамблю {Ь^(т,п)Заменив среднее значение этой функции функцией средних значений шести ее аргументов Ь (т', л') еЬ (т,п),

4 з*

получим приближенное равенство

Ррв(Ьй(л1,л)»1/и)«1/(1+ехр[ -А(<Ьй(л1,л)>)]), (17)

где

<Ь{ (т , л' ) >=рра 0>( (т' ,п' )-1/и). Величину а(<Ь (ш,л)>) получают заменой в формуле (14) нулевых или

А

единичных значений ребер - аргументов потенциалов ) значениями (Л!', л' ) >е[0,1 ] .

Применив равенство (17) ко всем ребрам, будем иметь систему уравнений, которую можно решить методом итераций. Оценка ребра

л

Ь. (л!,л)"

1 если р (Ь (л,л)-1/и) > 1/2

,Р° * , (18) О в противоположном случае

где Ррв(Л>(л1,л)-1/и) - оценка апостериорной вероятности, полученная в результате решения ситемы уравнений вида (17).

Эти алгоритмы были реализованы посредством СЦОИ. Метод В. М. Новикова оказался более быстродействующим, чем метод отжига. Хотя

оценки апостериорных вероятностей могут сильно отличаться от их истинных значений вследствие приближенного характера соотношения (17), оценки ребра (18), как правило, близки к глобальным MAB оценкам, полученным отжигом.

Выделение фрагментов олинаковой текстуры. Большинство естественных текстурных узоров можно считать реализациями случайных полей. Разные образцы текстур одного типа суть различные реализации одного случайного поля. Текстурам разного типа соответствуют случайные поля с различными вероятностными характеристиками, которые проявляются в свойствах текстур. Для описания многих текстур можно применить гауссовые 1. 5-марковские случайные поля с парными взаимодйствиями , которые отличаются средней яркостью и1г1 и набором пяти коэффициентов i-o,i.... ,l-i, где l - число типов текстуры.

Пусть наблюдается дискретизованное изображение сцены, которое практически не отличается от исходного изображения - массива яр-яркостей и. Макроструктура сцены, проявляющеяся в форме фрагментов и типе заполняющей их текстуры, представляется массивом символов (совокупностью меток)

а- 1а(л1,п) }, a(m,n)e(0.....L-1).

Согласно иерархической двухуровневой вероятностной модели ансамбля сложных изображений массив а есть реализация управляющего £-значного 1.5-марковского случайного поля а, которая разбивает поле зрения на J областей связных элементов с одинанаковыми метками. Массив яркостей, представляющий исходное изображение,

u-{u(m,n)}-(u(Qi (1¡ )).....u(QI(1J)), \.....lJ e{0.....£-1},

где uCq^ U))- (u(m,n): (m,n)eQj (i)}, j'i.....j, - фрагмент реализации случайного поля и; и область Qj(lj)'{(m,n): a(m,n)=lj}, есть реализация гауссового 1. 5-марковского случайного поля и/а с плотностью вероятности р(и/а), определяемой формулой (2.28).

Выделение фрагментов одинаковой текстуры сводится к баесовому оцениванию ненаблюдаемых меток а по сигналу сенсоров. Пойдя на те же упрощения, как в случае выделения контуров, придем к задаче поиска MAB оценок меток на основе апостериорной вероятности

Р (a/u)-P(a)p(u/a)/p(u) ps

где р(а) - априорная вероятность исходного изображения (2.15), а плотность вероятности р(и) определяется формулой (2.29).

Будем искать локальные HAB оценки

Л А

a-{a(m,n)»arg max Р (1/u)). (19)

г рэ

Был разработан алгоритм сегментации на основе итеративной процедуры приближенного вычисления апостериорных вероятностей, аналогичный тому, который применялся для выделения контуров. Реализация алгоритма посредством СЦОИ показала его эффективность.

3.4. Фильтрация зашумленных изображений [15, 18, 23, 24, 29, 31, 32, 34, 40, 53]

Формулировка задачи. Сигнал сенсоров ИС и СКЗ часто искажается под действием аддитивной помехи (шума), обусловленной флуктуация-ми измеряемых физических величин и собственными шумами сенсоров. Такие же искажения телевизионного изображения вызываются действием шума в канале связи, а фотографического - зернистостью фотоматериала.

Если шум - единственный источник искажений, то выходное изображение неоптимальной ИС

v=u+z (20)

можно считать смесью оригинала и аддитивной помехи.

При наличии шума надо взять оператор обработки сигнала, обеспечивающий МСКО или MAB оценку исходного изображения. Мы будем рассматривать обработку "зашумленного" изображения (20) посредством СОИ, имеющую цель получить одну из этих оценок:

~u'Rov~Ro (u+z)" (21>

Процедуру ослабления шума на выходном изображении принято называть фильтрацией, или сглаживанием. Последнее название объясняется тем, что обычно шумовой узор является мелкоструктурным, состоящим из чередующихся в случайном порядке мелких темных и светлых пятен. Зашумленное избражение выглядит "шероховатым" по сравнению с более гладким оригиналом.

МСКО или MAB ценку (21) ищут на основе апостериорной плотности вероятности (1.27). Любой метод фильтрации использует различия в структуре типичных исходных и зашумленных изображений. Чем полнее априорное описание структуры, тем эффективнее соответствующий метод фильтрации. Различные вероятностные модели ансамбля исходных изображений приводят к разным представлениям априорной и, следовательно, апостериорной плотности вероятности, то есть, к разным алгоритмам фильтрации.

Линейная МСКО фильтрация. МСКО оценку (21) можно найти, минимизируя средний квадрат отклонения (СКО) от оригинала оценки

u=Lv=b(u+z),

где ь - оператор линейной фильтрации. В силу (1.9) СКО <Бр( (-Ь(и+г) - и) (ь(и+г) -и)Т ) > -Бр( (1-Е) Сц (Ь-Е)т ).

Линейный оператор, минимизирующий СКО

1=С (С <С)'1-(МС1)'1. (22)

Следовательно, МСКО линейная оценка исходного изображения есть

СГ1)"1 (у-й), (23)

где в - единичная матрица.

Ниже будет показано, что для гауссовых ансамбля и шума линейный оператор (22) будет МСКО оптимальным среди всех операторов, в том числе нелинейных.

Алгоритм (23) был осуществлен посредством СЦОИ. При белом шуме качество отфильтрованного изображения (по визуальной оценке экспертов) в большинстве случаев не улучшалось, а иногда - ухудшалось. Это можно объяснить тем, что линейная фильтрация не только ослабляет шум, но и приводит к сглаживанию резких на оригинале перепадов яркости и ослаблению контраста мелких деталей. С другой стороны, мелкоструктурный узор реализации белого шума преобразуется в более заметный "низкочастотный" узор из крупных пятен с размытыми границами.

Причину недостаточной эффективности линейной фильтрации надо искать в неполноте описания структуры типичных изображений посредством только первого и вторых моментов случайного поля. Для лучшей фильтрации следует использовать более надежные признаки, по которым различается структура изображений и шума.

В зрительной системе человека выполняется фильтрация на основе таких признаков. Линейная фильтрация, изменяя естественную пространственную структуру изображения, затрудняет зрительную фильтрацию и поэтому не всегда приводит к визуальному улучшению обработанных изображений.

Когда изображение и шум сильно отличаются своими корреляционными свойствами, линейная фильтрация дает существенное улучшение изображения, например, при почти периодических помехах. Другой пример - ослабление низкочастотных аддитивных помех, которое применялось при синтезе цветного изображения поверхности Марса.

Фильтрация на основе гиббсовской модели. Будем искать МАВ оценку (1.29) исходного изображения. В случае независимого от оригинала гауссового шума с ковариационной матрицей с^ и нулевым средним условная плотность вероятности д(у/и)-ехр{-Чи-у)1£7-1 (и-у) )/г .

2 X х

При справедливости гиббсовской модели ансамбля исходных изоб-

ражений, когда априорная плотность вероятности есть

р(и)- ехр[-и(и)]/Лц, апостериорная плотность вероятности (1.27) является гиббсовской". р (u/v)-exp{-U (u/v)}/2(v), (24)

ра ре

где апостериорная потенциальная функция

U (u/v)-U(u) + <u-v)TC_1 Cu-v>/2. (25)

Р0 Z

Нормирующая постоянная z(v) не зависит от и. Поэтому MAB оценка исходного изображения

u - arg min И (u/v). (26)

u ра 4

Если апостериорная потенциальная функция имеет единственный экстремум - минимум, то MAB оценка исходного изображения будет единственным решением системы уравнений

grad(Ups (u/v))- grad(1l(u))+С~1 (u-v)-0, _ (27)

где grad(. )-{д. /ди(т,п)). Алгоритм решения этой системы есть алгоритм фильтрации.

При справедливости гауссовой модели ансамбля исходных изображений

И(u)" (U-Ü)Г С"1 (и-й)/2, где ¡¡-ме (0-вектор е-(1,..., 1)), система уравнений (27) будет линейной:

с"1 ( u-ü) +с-1 ( u-v) =0. (28)

U Z

Решение этой системы дает MAB оценку исходного изображения - массив, совпадающий с (22). Этот массив является также апостериорным средним (1.28) - МСКО оценкой исходного изображения. Следовательно, при справедливости гауссовой модели ансамбля исходных изображений и гауссовом шуме MAB и МСКО оценки совпадают, а алгоритм оптимальной фильтрации оказывается линейным.

' Если ограничиться наиболее важным для практики случаем белого шума, когда матрица -а* е, то можно значительно упростить осуществление линейной фильтрации, воспользовавшись итеративной процедурой поиска решений системы уравнений (28), при которой t-e приближение к оценке яркости элемента (т,п)

и' (т, л) - (1 (л!,л) ) V (л,л) +Х (т, л) v(m, л) , (29)

где х(т,л)-1/(1+в^с~1 (т,п;а,п));

и'"1 (л1,л)-Ц - £ с 1 (т,п\т-к,п-1) (m-k,n-l)-\i)/c 1 (т,п',т,п)

t>.i>eQo" "

- результат предсказания яркости элемента (т,л) по оценкам предшествующего приближения яркостей соседних элементов и Q - окрест-

ность элемента (0,0). Число 1-А(л,л)<1, поэтому процедура (29) сходится. Чем меньше интенсивность шума, тем больший вклад в оценку (29) вносит наблюдаемая яркость и тем меньший - предсказанное значение.

Для гаусс-двухмарковской модели с потенциалами парного взаимодействия (2. 9)

grad(U(u))-{ £ dw^ (u(jn,n), uj/du(m,a) ) 8

-{B {u(ffl,n)-w)+ I 0 (u(m,n)-u )}.

При гауссовом шуме система уравнений (27) будет линейной. Итеративный алгоритм ее решения для белого шума совпадает с алгоритмом (29), если положить

As 1 М = 1 Its 1

Для двухмарковской модели с неквадратическими потенциалами парного взаимодействия уравнения системы (37) не являются линейными. Так, для потенциалов (2.12)

grad(U(u))- { £ (u(m,n)-и ♦ (u(m/л)-^)2/у2)1 /г ).

г>-1

Итеративный алгоритм решения системы (27) для этих потенциалов и белого шума дает оценку

й'*1 (m,n) = ( 1 - А£ ) а' (т, л)+а' v(m,л), (30)

где а * "1/(1+с2 £ s'J; 5' (т,л)- £ «/О* Ё х >= г 1 *=i

Алгоритмы поиска МАВ оценок исходного изображения на основе марковских моделей реализовались посредством СЦОИ. Отфильтрованные изображения, найденные с помощью алгоритма (30) были более резкими и, как правило, имели лучшее визуальное качество, чем при линейной фильтрации. Марковская вероятностная модель ансамбля исходных изображений с неквадратическими потенциалами парного взаимодействия, допуская наличие резких перепадов яркости, более полно описывает структурные свойства типичных реальных изображений, чем гауссова модель, для которой оптимальна линейная фильтрация.

Фильтрация на основе иерархической модели. При справедливости вероятностной модели ансамбля изображений, состоящих из фрагментов почти одинаковой яркости, априорная плотность вероятности ансамбля исходных изображений выражается формулой (2. 24): p(u)-£ P(b)p(u/b),

ь

где Р(Ь) - вероятность рисунка и p(u/b) - условная плотность ве-

роятности для яркостного поля при заданном рисунке границ определены формулами (2.18) и (2.23). Подставив выражение (2.24) в формулу Байеса (1.25)

Р (u/v)-p(u)g(v/u)/qr(v), ра

получим апостериорную плотность вероятности

P„„(u/v)-E * (b/v)p (u/v.b), (31)

Р* L. ре ре

где

Р (b/v)- P(b)g(v/b)/g(v) (32)

Pe

- апостериорная вероятность рисунка ь;

р (u/v, b) -р(и/Ъ) g(v/u) /g(v/b) (33)

ре

- апостериорная плотность вероятности исходного изображения при заданных выходном изображении и рисунке. В выражения (32) и (33) входит плотность вероятности выходного изображения при заданном рисунке

g(v/b)-Jp(u/b)g(v/u)<iu (34)

В силу (31) МСКО оценка исходного изображения

й-l Р (b/v)u(b), (35)

Ь ра

где

u(b)-Jup (u/v, b) <Ju ре

- МСКО оценка при известном рисунке границ. Поскольку нижний уровень модели - гаусс-марковское случайное поле и/Ъ, то оценка i(b) есть результат линейной фильтрации. Ее можно получить посредством алгоритма (29):

и4*1 (я,л) = (1-Х )й* (т,л)+Л v(m,n), (36)

n« п ш•п

где 8 8 8

V.-V<1+ei<VEeA>>: <00<37>

1 А=1 /

- результат предсказания яркости элемента (т,л) по оценкам яркостей взаимодействующих с ним соседних элементов. Коэффициенты г

tt

определяются рисунком ь (см. п. 2.3), поэтому линейный оператор фильтрации не является однородным.

Не удалось найти простого способа вычисления апостериорных вероятностей р (b/v). Поэтому вместо точного алгоритма (35) был ре

реализован алгоритм поиска оценки

u -ü(b), (38)

который состоит из двух операций: итеративного оценивания рисунка Ь, описанного в п. 3. 3, и итеративной линейной фильтрации (36) с заменой в формулах (37) истинных значений коэффициентов е на ко-

Ä J*

эффициенты определяемые оценками ребер. Если рисунок оценивается по наблюдаемому изображению достаточно надежно (а только такой случай представляет практический интерес), то оценка (38) бу-

дет близка к МСКО оценке (35).

Фильтрация на основе иерархической вероятностной модели ансамбля изображений, состоящих из фрагментов почти одинаковой яркости, по визуальному качеству отфильтрованных изображений превосходит другие виды фильтрации. Следовательно, эта модель более полно описывает структурные свойства типичных реальных изображений, чем другие модели.

Адаптивная фильтрация. Пусть нужно осуществить линейную фильтрацию (23) при неизвестных ковариационной матрице и средней яркости ансамбля изображений, но известной ковариационной матрице шума. В этом случае по зашумленному изображению методом максимума правдоподобия (МП) находят оценки среднего и ковариаций - элементов ковариационной матрицы с - с + с .

V и I л

Оценки ковариаций образуют матрицу Полагают

С - С - С (39)

и V г 4

и находят эмпирический оператор линейной фильтрации

А А _ . _ -

ь = (Е+С С ) .

о 4 I и '

Вследствие выборочных флуктуаций оценок ковариаций этот оператор может отличаться от (22), что приведет, в принципе, к отклонению отфильтрованного изображения

- „ А .

и-Це+Ь0 (у-Це> ,

от изображения (23). Но если ковариации оцениваются по достаточно большому фрагменту наблюдаемого изображения, то выборочные флуктуации оценок малы и это отклонение не заметно, что подтвердилось при реализации алгоритма адаптивной линейной фильтрации зашумлен-ных изображений посредством СЦОЙ.

Если неизвестны не только ковариации ансамбля исходных изображений, но и ковариации шума, то описанный метод непосредственно применить нельзя, так как по наблюдаемому изображению невозможно оценить одновременно и те и другие ковариации. В этом случае следует использовать какую-либо эвристическую процедуру для оценивания ковариаций шума, например, обследовать зашумленное изображение некоторым окном и найти его наиболее гладкий участок, который скорее всего будет соответствовать участку исходного изображения почти постоянной яркости. По нему можно оценить ковариации шума и подставить эти оценки вместо теоретических в формулу (39).

Адаптивную байесову фильтрацию на основе марковской модели ансамбля исходных изображений с неквадратическими потенциалами пар-

ного взаимодействия, которая зависит от восьми параметров

«'■("i.....V*......О

нужно организовать как итеративную процедуру.

В качестве нулевого приближения к отфильтрованному изображению

естественно взять наблюдаемое изображение v. По нему находят

dt<0> - arg max p(v/<<) a

- нулевое приближение ' к МП оценкам параметров. Затем ищут первое

приближение к MAB оценке исходного изображения

и11' - arg max р (u/v,^0'). u ps

Первое приближение к МП оценкам параметров есть

arg max р(ü'1'/<<), л

а второе приближение к MAB оценке исходного изображения

u(2)- arg max р (u/v,rf(1>) u ps

и т. д. В этой итеративной процедуре вместо МП можно использовать другие способы оценивания параметров, например, процедуру оценивания потенциалов парного взаимодействия, упомянутый в п. 2. 2.

Алгоритм адаптивной байесовской фильтрации зашумленных изображений на основе марковской модели ансамбля-исходных изображений с неквадратическими потенциалами парного взаимодействия был реализован посредством СДОИ. Для MAB оценивания исходного изображения после очередного уточнения оценки параметров осуществлялся итеративный алгоритм (30). Результаты фильтрации показали,что при умеренном белом шуме оценка исходного изображения стабилизируе^я после двух-четырех итераций и оказывается близкой к оценке, найденной при известных значениях параметров ß..... ßt, ?l(...,y4.

По такой же схеме осуществляют адаптивную байесовскую фильтрацию на основе двухуровневой иерархической модели ансамбля исходных изображений. В этом случае число неизвестных параметров может достигать двенадцати - семь значений потенциала узла рисунка и пять коэффициентов при потенциалах гаусс-марковского поля.

Сначала, взяв произвольные значения параметров <*(0), ищут MAB оценку ребер рисунка, применяя итеративный алгоритм для решения системы уравнений вида (17) и правило оценивания (18). Найденные оценки рисунка используют в процедуре неоднЬродной линейной МСКО фильтрации (36). В результате получают первое приближение к отфильтрованному изображению - uM ® (<*""). Это приближение служит для оценивания значений потенциала узла рисунка и коэффициентов ßg.

.....гаусс- марковского поля. С найденными оценками У 11 находят уточненную МАВ оценку исходного изображения - й'21 (а111).

Как показал эксперимент, оценки параметров перестают меняться после двух-четырех циклов МАВ оценивания рисунка и исходного изображения. Каждый такой цикл состоит из многих итераций. Поэтому в целом процедура адаптивной байесовской фильтрации на основе двухуровневой иерархической модели ансамбля исходных изображений требует больших затрат машинного времени.

Реализация алгоритмов фильтрации посредством сетевых процессоров. Методы фильтрации зашумленных изображений с использованием байесового оценивания, основанного на вероятностных моделях ансамбля исходных изображений, оказались высокоэффективными. Однако их реализация посредством ЭВМ традиционной архитектуры приводит обычно к большим объемам вычислений, которые невозможно осуществить за разумное время, если не прибегать к специальным аппаратным срествам усиления основного компьютера.

Для широкого практического применения указанных методов в реальном времени в ИС и СКЗ, необходима вычислительная система параллельного действия с числом активных элементов, по порядку близким к числу элементов изображения. Такие системы - процессоры клеточной логики, систолические процессоры, сети нейроноподобных элементов - усиленно разрабатываются в последнее время. С их появлением развитие статистической теории обработки видеоиформации на основе вероятностных моделей ансамблей изображений приобретает большое практическое значение.

Любая из упомянутых вычислительных систем представляет собой массив элементарных процессоров, объединенных в сеть. Поэтому его можно назвать сетевым процессором. Архитектуры сети зависит от решаемой задачи и в значительной степени определяется вероятностной моделью ансамбля исходных изображений, то есть, в конечном счете, пространственно-структурными свойствами предметов окружающего мира.

Для гаусс-марковской модели систему линейных уравнений (27) можно записать как

{и(т,л)-(0ои+ £ и(т,л)/б2)/(0о* I р^* 1 /б2)}. (40)

Л=1 Л*1

Возьмем решетку

0-{(я,л), ш,л=0,... ,N-1)}, образованную центрами элементов изображения. Каждый узел соединим с соседними узлами рези.горами я^, к-1.....4, и подадим на него

напряжения v(m,n) и и через резисторы г и до, соответственно. Тогда после затухания переходных процессов в силу закона Кирхгофа в узлах установятся напряжения, удовлетворяющие системе уравнений

(и(т,п)-(ц/я + I и/Я + п) /г) /(1 /Я + £ 1/Я + 1/г)}.

Й=1 Л=1

Она совпадает с (40), если выбрать к -1/з , к-0,1.....4, и г-вг.

> а г

Таким образом, достаточно сетки резисторов, чтобы реализовать линейную фильтрацию, основанную на гаусс-марковской модели.

Для нелинейной фильтрации на основе двухмарковской модели с потенциалами парного взаимодействия (2.12) нужно использовать сетку с потенциалозависимыми резисторами, сопротивление которых

V + (т'»)-иь)2/ф1/г/ръ> *-1.....8"

Алгоритм фильтрации (38) на основе иерархической модели реализуется с помощью двухэтажного сетевого процессора. Верхний этаж занимает сеть активных элементов для решения ситемы уравнений вида (17). На выходе каждого элемента получают приближенное значение апостериорной вероятности единичного значения данного ребра. На вход активного элемента для вычисления величины (14) подают разность яркостей разделенных ребром элементов изображения и выходные сигналы шести соседних активных элементов, соответствующих ребрам Ь^(т,п).

На нижнем этаже находится сетка резисторов для линейной фильтрации, имеющая выключатели, соединенные последовательно с резисторами Состояние выключателей определяется правилом (18).

3.5. Исправление искаженных изображений (26-28, 30, 31, 33, 39, 51]

Формулировка задачи. Часто в процессе формирования сигнал сенсоров ИС или СКЗ подвергается искажениям, которые приводят к искажениям выходного изобрагения ИС или нарушениям в работе СКЗ.

Искаженное выходное изображение представим как

где г - шум (в том числе - ошибки измерения наблюдаемых величин); л - детерминированный оператор, описывающий искажения. Требуется по возможности исправить искажения. Алгоритм исправления трудно реализовать обработкой сигнала сенсоров. Поэтому рассмотрим проблему исправления применительно к обработке выходного изображения ИС посредством СОИ. Будем искать оценку оригинала

и-Ку-7?(Ли+г), (41)

Ограничимся случаем линейных искажений выходных изображений, проявляющихся в уменьшении их резкости. Такие искажения встречаются очень часто. Они вызываются, в частности, аберрациями оптических систем, рассеянием и дифракцией света, конечным размером светочувствительных элементов, недостаточной шириной полосы частот в канале передачи видеосигналов.

Уменьшение резкости выходных изображений происходит также при смазе - движении оптического изображения по светочувствительному слою в течение экспозиции, например, в процессе аэрокосмической фотосъемки. Нерезкость астрономических фотоснимков может быть вызвана турбулентностью атмосферы.

Выходное изображение неоптимальной ИС с линейными искажениями до дискретизации представляется функцией

XX

+ г{х,у); (х,у)еБ', (42)

00

где а(х,у;£,г}) - ядро линейного преобразования, называемое аппаратной функцией или функцией рассеяния точки (ФРГ); и(*,у) - функция, представляющая исходное изображение; х(х,у) - функция, описывающая шумовой узор на выходном изображении; б'-поле зрения выходного изображения, которое может отличаться от исходного поля зрения з-{ (х,у): о<х,у<х).

Для исправления линейных искажений посредством цифровой обработки выходное изображение должно быть дискретизовано. Если исходное изображение также представляется в дискретной форме,то выражение (42) переходит в систему линейных алгебраических уравнений

Я-1 Я-1

V-{у(л1,л)-£ ^а(т,П11,])иЦ,^)+г(тгп)-, (т,п)ео' }-Аи+г, (43) « = о .7=0

где А-(а(т,п;1/у); (т,п)ео' ; - 0'х О-матрица. Параметры

дискретизации исходного и искаженного изображений могут быть разными: первые определяются свойствами получателя, а вторые должны быть выбраны так, чтобы массив »>{Ит,л) ;с'} ¡при минимальном объеме содержал как можно больше информации об исходном дискретизо-ванном изображении. При оптимальном способе дискретизации набор величин у-{у-(л1,л) ;о'} будет достаточной статистикой для отыскания оценок и- (и(Ш/л)}.

Преобразования (42) или (43) могут связывать не только исходное и выходное изображения, но также поле ненаблюдаемой физической величины, характеризующее пространственную струкуру предмета, и поле величины, доступной непосредственному измерению, например, распределение интенсивности источников тепла внутри тела и расп-

ределение температуры на его поверхности.

При справедливости гиббсовской модели ансамбля исходных изображений в качестве исправленного изображения возьмем МАВ оценку оригинала (26). В случае независимого от оригинала гауссового шума с ковариационной матрицей сусловная плотность вероятности

д(у/и)-ехр{-(Ли-у)тсГ1 (Ли-у)/2) (44) и апостериорная потенциальная функция

и (и/у)-и(и) + (Ли-у)ТС_1 (Ли-у)/2-. (45)

ре х

Применив градиентный метод, найдем МАВ оценку ¿-го приближения:

и'-¿'Г1* С? (дга<3(и(й* 1 ) ) +АТС^1 (Ли' -у)) , (46)

где G - матрица, выбор которой зависит от варианта градиентного метода.

Для гауссовой модели ансамбля исходных изображений, когда априорная потенциальная функция U(u)-(u-í¡)T с"1 (u-¡J)/2

и u

gradOKu'"1 ))-Си1 (Ú* '-й),

имеем явное выражение для исправленного изображения

U"Ü + Cu ЛГ (ЛС^ ЛГ+С^ ) (v—A¡j), (47)

связанного с наблюдаемым изображением линейным оператором

r -с ат(ас ат+ с )"' , (48)

О U U Z

частным случаем которого при а=е является оператор линейной фильтрации (22).

Также, как в случае фильтрации, оператор (48) есть наилучший линейный оператор, минимизирующий СКО исправленного изображения от оригинала, которое равно

<Sp((£(Au+z)-u) (£(Au+z)-u)T) >-Бр((ЬЛ-£')Са (1Л-К)Т Lt ). (49) Для марковской модели ансамбля исходных изображений с неквад-ратическими потенциалами парного взаимодействия (2.12) исправленное изображение также можно найти с помощью итеративного алгоритма (46). Но в этом случае оператор исправления будет нелинейным и его нельзя представить в явном виде подобно линейному оператору.

Алгоритм (46) обычно приводит к значительно большему объему вычислений, чем метод простых итераций (29) или (30), реализующий фильтрацию. Алгоритм исправления линейных искажений на основе ие-рархичесской модели оказался еще более громоздким и не был реализован.

Байесов подход к исправлению искажений и метод регуляризации.

При наличии шума исправленное изображение есть одно из решений системы линейных уравнений

Ди-V- г.

Реализация шума неизвестна. Если шум слабый, то мохно сделать попытку найти исправленное изобрахение, решая систему уравнений Ли-V. (50)

Эта система линейных уравнений в общем случае будет несовместной, если г(А)>е'- (г(.) - ранг матрицы). При г(л)-о' она часто оказывается плохо обусловленной (норма матрицы л мала). Поэтому малые изменения наблюдаемых значений яркости из-за действия шума или даже их округление при цифровой обработке на ЭВМ может привести к сильным отклонениям исправленного изображения от оригинала.

Для отыскания приближенного решения несовместной, плохо обусловленной или недоопределенной системы линейных уравнений А. Н. Тихоновым и его учениками (А. Н. Тихонов и В. Я. Арсенин, Методы решения некорректных задач) разработан метод регуляризации. Вводятся две функции о аргументов и: д(Ли-у) -мера невязки (неточности решения) и 0(и)- мера качества решения. Приближенное решение и должно доставлять минимум функции

йЧи)-0(и)+Х9(Ди-у), (51)

где а - множитель Лагранжа, определяемый условием

д(Ли-у)<е.

Если взять квадрат нормы Махаланобиса (ли-у)1^1 (ли-у) как меру невязки и априорную потенциальную функцию и(и) как меру качества решения, то функция (51) при а-1/2 совпадет с апостериорной потенциальной функцией (45). Значит, приближенное решение системы линейных уравнений (50) методом регуляризации дает в этом случае МАВ оценку исходного изображения.

Теория регуляризации не указывает, как выбирать меры, определяющие функцию (51). При практическом применении метода к решению задачи исправления искаженных, изображений, их обычно берут, исходя из интуитивных представлений о свойствах исходных изображений и ошибок измерения наблюдаемых величин. Байесов подход обогащает теорию регуляризации, устанавливая "прямую связь мер Й(. ) и д(.) с вероятностными моделями ансамбля исходных изображений и механизма формирования сигнала.

Исправление искажений в отсутствии аума. Если шума нет, то искаженное изображение

*-Ли (52)

детерминированным преобразованием связано с исходным. Исправление искажений сводится к решению системы линейных уравнений (52) относительно переменных и-{и(л,л)}. Если матрица л обратима, то си-

стена имеет единственное решение -i

u-A w.

Свойства ФРТ и способы дискретизации наблюдаемого изображения часто таковы, что система уравнений (52) недоопределена: число уравнений равно q' (числу элементов искаженного изображения), а число переменных q>q' . Имеется множество решений (и)и - {и: Au-w)

- исходных изображений, которые могли превратиться в наблюдаемое искаженное изображение w.

В качестве исправленного изображения возьмем решение, имеющее

наибольшую априорную вероятность:

ú- arg min(lt(u) ). (53)

u6{u}

и

Для гауссовой модели эта оценка, которую легко найти методом неопределенных множителей, есть

Ú-Ü+A(w-AÜ), (54)

где

А- С/(АСЛТ)"' (55)

- матрица, удовлетворяющая условию аа-е, которую называют псевдообратной относительно а. Она - предельный случай матрицы (48) при уменьшении интенсивности шума. Используя матрицу (55), представим матрицу (48) как

r -ас (С *с )"' ,

О w и z

где

С -ас а .

и u

Таким образом, линейная процедура исправления искажений (47) состоит как бы из двух последовательных операций - линейной фильтрации изображения

vw+z-Au+z,

которая дает оценку

ír-АЦ + С^ (Сщ*С1 ) (v-Au) , и псевдообращения этого изображения посредством матрицы (55).

Для марковской модели с неквадратическими потенциалами взаимодействия можно найти оценку (53) численными методами. Представим

общее решение системы (52) как е-«'

ü-u'+ £ at*V (5б)

t = i

где и'- частное решение этой системы, например результат линейного исправления (54); üt - решения системы однородных уравнений ли-0; а4 - произвольные постоянные. Тогда оценка (53) есть

и-агд т1п(11(и' + £ а(й4)).

(57)

Так как 0-0'< о, то, благодаря представлению (56), лоиск минимума потенциальной функции упрощается. Преобразование искаженного изображения в исправленное, которое нельзя найти в явном виде, будет нелинейным, хотя решалась задача исправления линейных искажений.

Исправление однородных линейных искажений с использованием дискретного преобразования Фурье. Пусть ФРТ однородна, то есть

а(х,у,е., г>)-а(х-е,у-г)); а(х,у)-о, еслихе[-с,о] илиуе[-я,о]. Тогда поле зрения искаженного изображения

ОЧх<Х-в, 0<у<х-н) будет уже исходного поля зрения

8-{(х,у): 0<х,у<Х).

Дискретизация с одинаковым шагом й обоих изображений, связанных преобразованием (42), дает массив

у-{у(л!,п)-£ £ а(т-1,п-^)и(1,з)+г(т,л); (т,п)ео' }-а«и+г, (58)

где множество 0'-{(т,л): т-0, ... л-0, ... ,лг-я/й-1}; мас-

сив а-{а(-£,.з)}, 0, если И{-в/Ь,...,0} ИЛИ .... 0}

-результат дискретизации ФРТ. Знак » обозначает операцию свертки. Преобразование (58) - частный случай (43) с матрицей

все строки которой образуются из массива а посредством сдвига по индексам тип.

Известно, что Фурье спектр свертки сигналов равен произведению Фурье спектров свертываемых сигналов. Непосредственно применить эту теорему к равенству (58) нельзя, так как массивы V и и имеют разные размеры. Дополним матрицу (59) о-о' строками до циклической по обоим индексам £?х0-матрицы

А-{а(л1,л; 1,7)-а( (га-1)шоЗ Ы, (п-у)той И); (ш,л), (¿,7)е0), (60) а массив (58) - <?-о' произвольными элементами

v'-{v(m,л); т-Ы-в/Ь, . . . п-Я-Н/Ь, . ..,»}-Д'и, (61)

где а'- (¡3-е')х0-матрица, дополняющая матрицу (59) до (60). Тогда

ч-Аи+г, (62)

где V'), г-(г,г') - массивы из с элементов.

Рассмотрим сначала задачу исправления изображения в отсутствии шума, когда

У-Аи. . (63)

Дискретное преобразование Фурье (ДПФ) массива (63) дает спектр

(I ../> 60

(59)

V-?v-W(k,l)-l l £(k,l;m,n)v(m,n)-, U,l)eß}, (64)

где m=1 n=1

y- {f (k, l;m,n) -exp [ 2JTi ( (km*In) /n) ] } - ßxß-натрица двумерного ДПФ; fl-{(A,l)) - множество пространственных частот. Применив ДПФ к обеим частям равенства (63), получим v-jv,

где диагональная матрица , ненулевые элементы которой об-

разуют массив {<J(A,i);Q}, - частотная характеристика искажающей системы; к-Уи-(U(k, 1);ß) - Фурье спектр исходного изображения. Допустим, что матрица <4 невырожденная. Тогда массив ü(v')-?"1 (d~1v)-'ä~1 v есть решение системы уравнений v-ли при любом дополнении v' наблюдаемого массива v. Оптимальное дополнение v'- arg max p(u(v')).

При наличии шума Фурье спектр массива (62) есть V-dV*Z-lV(k,l)-a(k,l)V(k,l)*Z(k,l);Q), где J);й} - Фурье спектр шума. Пусть диагональная мат-

рица я~{я(к,1);П) представляет частотную характеристику однородного линейного исправляющего оператора, который описывается дважды циклической матрицей я. Тогда Фурье спектр исправленного изображения (41) есть

il-KV-{Jl(k,l)J(k,l)V(k,l)+X(k,l)Z(k,l));Q). СКО (49) можно выразить на частотным языке как

1 £< | if(k, 1) ~V(k, 1) |2 > -(Л, i> efl

I 1\(Я(к,1)4(к,1)-1)1гФ (А, 1)4 *(*,!)! 2 Ф (k,iy, (л. ней

где Фц(А,1), Ф1(к,1) - энергетические спектры ансамбля изображений и шума. Частотная характеристика, минимизирующая СКО,

*„-{*„ (к,1)'Лл(к,1)/{ U(A, J) 12+Фг (к,1)/ФЦ (А,1));й>, (65)

где А* (к,1) -величина, комплексно сопряженная с а(к,1). Алгоритм для получения исправленного изображения i-s"1 (R0v)-5_1 (Rq3v) (66)

состоит из трех операций: вычисления посредством ДПФ спектра искаженного изображения; покомпонентного умножения его на заранее расчитанную маску (65); обратного ДПФ.

Прежде, чем реализовать алгоритм, надо найти массив (61), дополняющий наблюдаемый массив. На практике нередко игнорируют разницу в размерах исходного и наблюдаемого массивов, что приводит к специфическим краевым искажением, которые тем сильнее, чем больше

эта .разница. Иногда используют эмпирические рецепты дополнения.

Строгое решение этой задачи сводится к минимизации по составляющим массива (61) квадрата разности (aú-v)t(2u-v). Оптимальное дополнение

v¿ - (е-a' w у1 a' W"v (67)

где (/ ,W- матрицы размера Qx(Q-Q') и QxQ' - фрагменты 0х£)-матрицы

«о которая находится с помощью ДПФ.

Алгоритм (66) применим только для однородной ФРТ. В некоторых случаях с* помощью предварительного геометрического преобразования искаженного изображения или посредством дискретизации с неравномерным шагом удается свести неоднородные искажения к однородным, а затем применить описанный алгоритм для их исправления.

Реализация алгоритмов исправления искажений. Посредством СЦОИ были реализованы алгоритмы исправления однородных линейных искажений в отсутствии шума на основе двух моделей ансамбля изображений - гауссовой и марковской с потенциалами парного взаимодействия <2.10) и (2.12). Процесс искажения исходного изображения равномерным смазом вдоль строк моделировался с помощью этой же системы. Искаженное изображение

т

v-{v{m,n)- 1 u(m,n+i)/(T+1); m-1.....N; л=1.....N-T) (68)

f 3 о

Величина г достигала 31 при w-256. Преобразование (68) выполнялось арифметическим устройством с плавающей запятой, поэтому искаженное изображение можно считать свободным от шума, а качество исправленного изображения определяется только принятой моделью ансамбля исходных изображений.

При линейном оценивании с использованием ДПФ на исправленном изображении появляются периодические искажения. Нелинейное оценивание (57) - минимизация априорной потенциальной функции с потенциалами парного взаимодействия (2.10) и (2.12) дает исправленные изображения, на которых эти искажения почти не видны. Они практически не отличаются от оригиналов. -Этот результат подтверждет вывод о том, что марковская вероятностная модель ансамбля исходных изображений, допуская наличие резких перепадов яркости, более полно описывает структурные свойства типичных реальных изображений, чем гауссово случайное поле.

Линейное исправление с использованием ДПФ было применено для обработки реальных астрономических и аэрокосмических изображений с однородными линейными искажениями, вызванными смазом и влиянием турбулентной атмосферы. При решении таких задач обычно неизвестна

ФРТ и ее нужно оценивать по искаженному изображению. Применение метода МП связано с трудностями, поскольку число независимых уравнений для определения максимума условной плотности вероятности д(у/и) по параметрам ФРТ, оказывается меньшим числа этих параметров. Их оценивание требует привлечения дополнительной априорной информации о возможной структуре исходных изображений.

4. КОДИРОВАНИЕ ИЗОБРАЖЕНИИ С УЧЕТОМ СВОЙСТВ ЗРЕНИЯ

4.1. Пороговые свойства зрения и ячейки квантования в пространстве изображений [57]

Мера различия изображений. Для разработки методов кодирования изображений надо знать, какие изображения различаются получателем видеоинформации, а какие нет. Функции потерь д(и,V) естественно придать смысл меры различия изображений и и v. Положим, что эта величина равна вероятности того, что получатель обнаруживает разницу между изображениями при заданных условиях их сравнения. Чем заметнее получателю различия между изображениями и и v, тем больше значение д(и, V) и 0<д(и, у)<1.

Идентификация меры различия производится в ходе психофизического эксперимента. Наблюдателю многократно предъявляют пару изображений (и,у) из гиперкуба и (1.23) и подсчитывают 1>(и, у) - относительную частоту предъявлений, в которых наблюдатель обнаружил разницу между изображениями. Если они существенно отличаются друг от друга, то частота >>(и,у)«1. При у-и частота может отличаться от нуля, так как наблюдатель иногда сообщает о кажущемся различии одинаковых изображений. Обработав экспериментальные данные, получают на основе измеренных частот оценку меры различия д(и, V).

Подпороговое множество. При разработке метода кодирования изображений часто интересуются скорее фактом, чем степенью различия исходного и декодированного изображений. Как уже говорилось, иногда наблюдателю кажется, что два одинаковых изображения отличаются друг от друга. Следовательно, надо считать, что изображения и и V различаются только в том случае, если д(и, у)>е, где е - пороговое значение вероятности различения. При д(и, у)<е эти изображения считаются почти неразличимыми. Множество

{у)е/и-{у: д(и,у)<е>, (1)

можно назвать подпороговым множеством (ППМ) данного изображения и

(А. Д. Логвиненко, 1985).

Границу Ш1М образуют изображения v' такие, что

{V )E/u-{v: g(u,v')=8). Эту границу можно описать функцией Нц(») - длиной отрезка, соединяющего точку u-{u(m,n)}ee с точкой v'(w)e(v')e/u, которая лежит на прямой, направление которой задается массивом w={w(m,л)}. Этот массив

w- (v' (w)-u)/»^ (w)

имеет единичную длину, а его элементы могут принимать как положительные, так и отрицательные значения.

Для идентификации функции ц^(w) выбирают исходное изображение, массив w и коэффициент ц>о. Затем формируют изображение

и(ц, w) -u+|iw*= {u(m, n)+Uw(m,n) }. (Коэффициент u должен быть таким, чтобы u(u, w)ее).

Предъявляя наблюдателям пару изображений (u,u(n,w)), оценивают значение функции 9(и, и(ц, w)) для разных значений коэффициента и находят пороговое значение Uu(w), когда g (u, и(у (w))-e. Очевидно, что u(uu (w)) -v' (w).

Взяв l различных направлений, ценой увеличения в l раз объема психофизического эксперимента можно получить набор коэффициентов

{цц(Wi);i-1.....L) - значений функции Uu(w). В общем случае форма

множества (1) зависит от положения в пространстве я его "центра" - исходного изображения. Следовательно, психофизический эксперимент надо многократно повторить с различным изображениями и(к), чтобы иметь набор коэффициентов

(Ч,*,^); 1-1.....£(*)}; k-i,...fк). (2)

Объем реального психофизического эксперимента ограничен. Поэтому обычно берут небольшое число разных возмущений: решеток различных пространственных частот, полос, пятен правильной формы. Иногда в качестве массива w используют реализации случайного поля с простыми свойствами. Часто ограничиваются единственным изображением u-{u(jn,n)-const) - равномерным фоном или применяют другие простые "фоновые" изображения - решетки, ступеньки или реализации случайного поля.

Из-за огромной размерности пространства я при достижимом объеме эксперимента набор коэффициентов (2) оказывается слишком бедным описанием функции Мц(w). Чтобы аппроксимировать ее путем интерполяции по немногим значениям (2), надо разработать модель механизма различения изображений человеком и на ее основе получить такую функцию g(u,v), что

д(и,у)«е при и-ий и у-и(мцй(»г)); 1-1,... ,ь(к); к-1,...,к. Очевидно, что эта функция должна правильно предсказывать результаты психофизического эксперимента для любой пары изображений и и v, которые не участвовали в измерении коэффициентов (2).

Пока такую функцию найти не удалось. Тем не менее, имеющиеся психофизические данные, а также результаты физиологических экспериментов на животных выявляют некоторые преобразования сигналов в зрительной системе человека, которые могут быть использованы для разработки методов кодирования изображений.

Минимальная е-сеть. В процессе кодирования исходное изображение и представляется комбинацией цифр - кодовым словом ке{0.....

х-1), которое можно передать по цифровому каналу связи или записать. При декодировании воспроизводится изображение V из множества {уг;1-0.....х-1). Мерой эффективности метода кодирования служит величина

к-(1од2к)/о (3)

- число двоичных цифр на элемент исходного изображения, необходимых для представления кодового слова.

Декодированные изображения будут почти неотличимы от исходных,

если для любого изображения иеБ найдется изображение V е{у } так I

кое, что д(и, или

д(^,и)<е. (4)

(Неравенство (4) означает, что исходное изображение почти неотличимо от декодированного. Меру различия изображений можно определить», так, что неравенства (4) и (1.22) будут равносильны).

Из неравенства (4) и определения (1) следует, что любое исходное изображение должно принадлежать к <и) /V - ППМ какого-либо

2 А

декодированного изображения. Соседние множества будут неизбежно пересекаться, поэтому

А= О

где 1{и)вЛу I - объем ППМ; [£|-(и - и )в- объем гиперкуба е.

ь А шах т 1 п

Чтобы получить отимальный код, обеспечивающий выполнение условия (4) при максимальной эффективности (минимальном числе к), нужно как можно дальше раздвинуть центры ППМ и добится минимума суммарного объема их пересечений. В этом случае эти центры (декодированные изображения) образуют минимальную е-сеть во множестве е.

Ячейки квантования. Как правило, оптимальный метод кодирования невозможно осуществить. Во-первых, обычно отсутствует достаточно полное описание системы ППМ, необходимое для построения минималь-

ной e-сети. Во-вторых, процедура поиска номера декодированного изображения, которое удовлетворяет условию (4), в общем случае окажется нереализуемой. Поэтому будем искать квазиоптимальный легко реализуемый метод цифрового кодирования изображений.

Методы кодирования из этого класса определяются оператором f, преобразующим исходное изображение иеБ в q'-вектор

f-Fu-(f (и), ,..,fe.(u)), q'>q; (5)

и с шкалами независимого квантования его составляющих, заданными набором чисел

{г„(<5,' к(*)=0.....*<«>-1Ь 9-1.....0-.

где Т , , и L , ,- порог И уровень квантования; К(q)- число уров-

А { <71 2» ( «J }

ней квантования.

Если г <f (u)<T , . , то составляющей f (и) присваивается

А < q> <7 Ь ( g ) ♦ 1 q

номер k(g) интервала квантования (т , г ]. Правило кван-

hlq) А ( <7) + 1

тования составляющих приводит к разбиению множества Б на ячееки квантования { (u). , к'0.....К-1), ЧИСЛО которых К-К( 1 )•...• О' ).

J*

Совокупность номеров интервалов квантования образует номер ячейки

квантования - кодовое слово к-(к(1).....*((?'))•

При декодировании составляющая f (и) приобретает значение уро-

<7

вня квантования хл( (, то есть вектор (5) заменяется вектором

V^m' — W,)' <б>

а затем вектор (7) преобразуется в представителя ячейки квантования - декодированное изображение

v о

где f 1 - оператор, обратный относительно f.

В q'-мерном векторном пространстве ячейки квантования имеют простую форму гиперпараллелепипеда:

{и} -{и: Т <f (и)<Г ,..., Т <£ (и)<Г }.

* feil) 1 J« С 1 I ♦ 1 ' *(вм A(Q')»l'

В пространстве я их форма определяется оператором f'1.Условие (4) означает, что ячейки квантования лежат внутри ППМ (1), центрами которых являются представители ячеек:

{U)* S {U)E/V*' k'°.....<8)

Если эффективность некоторого метода кодирования изображений выше других известных методов, то он может считаться квазиоптимальным. Форма ячеек квантования такого метода есть приближение к форме подпороговых множеств. Обычно оператор F, определяющий квазиоптимальный метод кодирования, производит преобразование исходных изображений, похожие на те, которые осуществляются в зрительной системе человека.

Наиболее широко применяется на практике простейший и наименее эффективный из методов кодирования рассматриваемого класса - им -пульсно-кововая модуляция (ИКМ). В случае ИКМ используют единую шкалу для независимого квантования значения яркостей исходного изображения на ка уровней. Поскольку преобразование г тождественное, то ячейки квантования ИКМ имеют форму гиперпараллелепипеда в 0-мерном пространстве изображений Я. Число ячеек

Известно, что при ИКМ неотличимость декодированных изображений от исходных имеет место в том случае, когда число ко достигает 100 - 200, что приводит к величине

д-1одгхо- 7-8 бит/эл. (9)

Статистическое кодирование. Согласно принятому подходу ячейки квантования строятся исходя из свойств получателя видеоинформации без учета специфической пространственной структуры исходных изображений, принадлежащих ансамблю с априорной плотностью вероятности р(и). Эта плотность определяет распределение вероятностей попадания исходного изображений в к-ую ячейку квантования

{рй - рг{ие{и}й> « к-0,----х-1), (10)

где V - представитель ячейки квантования; 6 - I(и) I - ее объем.

А > А

энтропия ансамбля исходных изображений после квантования равна

к

Я -( "I рА1о9грй)/0 бит/эл. (11)

й= О

Эта величина есть нижняя граница среднего числа двоичных цифр,необходимых для представления кодового слова при условии (4). Сокращение среднего расхода передавемых цифр до значения, близкого к (11), достигается посредством статистического кодирования, сущность которого состоит в том, что номерам ячеек присваиваются кодовые слова разной длины в соответствии с распределением' (10), более короткие - более вероятным.

Близкое к оптимальному цифровое кодирование изображений с учетом свойств зрения и свойств ансамбля исходных изображений осуществляется в два этапа. На первом этапе изображение представляется в цифровой форме с учетом только свойств зрения, на втором - производится статистическое кодирование, то есть обратимое преобразование цифровых последовательностей, определяемое априорной плотностью вероятности р(и). Методы статистического кодирования изображений рассмотрены в работах автора [5, б, 11].

4.2. Кодирование изображений с «пользованием лапласиана [8-11, 44-46, 49, 55-57]

Двухкомпонентный метод. Большое число ко, необходимое при ИКМ, не означает, что зрение человека предявляет столь высокие требования к точности передачи абсолютных значений яркости элементов исходного изображения. Напротив, известно, что оно терпимо к значительным изменениям яркости, если хотя бы приближенно сохраняются контрасты соседних участков изображения: если на исходном изображении существует деталь, заметно сличающаяся по яркости от окружающего фона, то это отличие'должно сохранится и на декодированном изображении. И наоборот, на нем в результате кодирования не должны возникать ложные перепады яркости, отсутствующие на оригинале. Именно эти требования приводят к явно завышенному числу ко.

Было предложено много более эффективных, чем ИКМ, методов кодирования изображений, основанных на таких преобразованиях, при которых выделяются перепады яркости. Мы рассмотрим метод с преоб-, разованием изображения в лапласиан. Если функция и(х,у) описывает распределение по полю зрения яркости исходного изображения (до дискретизации), то лапласианом изображения называется функция

1(х,у)-дги/дхг+дги/ дуг (12)

В пользу лапласиана говорят два. факта: во-первых, надежно устано-вленое наличие в зрительной системе человека механизмов, осуществляющих такое преобразование и, во-вторых, существование преобразования, обратного относительно (12).

В случае дискретизованного исходного изображения, представляемого массивом и-{и(л!,л)}, конечно-разностным аналогом лапласиана служит массив

1»и-у=и-Аи, (13)

где

(14)

- сглаженная (как бы расфокусированная) копия оригинала. Будем массив (13) также называть лапласианом.

Пусть яркость элемента сглаженного изображения есть

л!,л=1, . . . ,N-2. (15)

и коэффициенты а(а,^)>0 обладают такими свойствами:

Чтобы найти значения у(ш,л) на границе поля зрения, когда те{0, N-1} или л€{0, N-1}, доопределим преобразуемое изображение

"отражением" от границ, положив

u(-1,n)-u(0,n), u(N,n)-u(W-1,n) при л=о,... ; u(m,-1)»u(m,0), u(m,N)~u(m,N-l) при m=-1 , . . ., N. (16)

Набор коэффициентов a(i,j) в формуле (15) и условия (16) определяют линейный оператор д в формуле (14).

Применим оператор д к массиву 1, затем к массиву Д1, что даст в результате массив дг1-д(д1) и т.д., и образуем массив

и' -1+Д1+ . . . +д' 1 1. (17)

В силу (13)

и' =и-Дги.

Поэтому знание лапласиана (13) и r-кратно сглаженного изображения

Vr-A'" и (18)

дает возможность восстановить исходное изображение и. Сглаженное изображение можно подвергнуть прорежеванию - вторичной дискретизации с увеличенным в к раз шагом, получив в результате изображение w, состоящее из Q/k2 элементов.

Таким образом, кодирующее преобразование f - в данном случае, совокупность преобразований е-а, аг и прорежевания переводит исходное изображение в новое представление - массив q значений лапласиана и массив Q/к2 яркостей изображения w. Обратное преобразование состоит из интерполяции прореженного изображения, восстановления массива (17) из лапласиана и сложении его с интерполированным изображением.

Если квантовать лапласиан на к , а изображение w - на Кд уровней, то общий расход бит составит

R= logz К^ + (logz К^) /кг бит/эл. (19)

При цифровом моделировании метода кодирования были выбраны коэффициенты a(i,j)=aiaj, где

a_l-ai-1/4, aQ= 1/2. (20)

Элемент лапласиана при т,л=1.....N-2 имеет значение

1 (т, л) = и(л, л) -v(m, л) = ( 12и(т, л) -2u(m-1, л) -2u(m, л-1) -2и(т, л+1) -2и(/п+1, л)-и(т-1, л-1 )-u(m-1, л+1) -u(m+1, л-1 )-и(/п+1 ,л+1))/1б. (21) С помощью условий (16) можно найти значения граничных элементов. Например,

l(0/0) = (7u(0,0)-3u(0,l)-3u(1/0)-u(1,1))/16, 1(0,п)*(Юи(0,п) -3и(0, л-1 )-Зи(0,л+1)

-и(1,л-1)-2и(1,л)-и(1,л+1) )/16, л-1,____n-2.

Устанавливалась степень сглаживания г=8, что позволило проредить сглаженное изображение с учетверенным шагом.

Процесс декодирования начинался с формирования лапласиана 1 и

прореженного сглаженного изображения ы, которые отличаются от 1 и и заменой истинных значений элементов представителями интервалов квантования. Восстановленный лапласиан подвергался преобразованию (17) с образованием массива

А Т-- 1 Л

и'-1+. . . +А 1.

Посредством интерполяции изображение ы превращалось в изображение лгг полного размера и восстанавливалось декодированное изображение и-и'+у .

г

В ходе экспериментов находились числа уровней квантования, при которых в заданных условиях сравнения декодированное изображение почти не отличалось бы от исходного изображения. Минимальные значения этих чисел равны, соответственно, 9 и 64. Подставив их, а также к'4 в формулу (19), найдем минимальный расход бит

Я- 1од2 9+ (1од264) /16- 3.54 бит/эл. (21)

Из выражений (9) и (21) следует, что рассмотренный метод имеет эффективность в 2 - 2. 25 раза большую, чем "ИКМ. Это объясняется тем, что представление исходного изображения в виде лапласиана и сглаженного изображения ближе к внутреннему представлению информации в зрении нижнего уровня.

Необходимость кодировать сглаженное изображение увеличивает расход бит на то'/-. Повысив степень сглаживания, например до г=32, можно довести к до 8. Тогда расход бит сократится до 3. 26 бит/эл. (Эта величина лишь на 3% превышает 1од29=3. 17). Однако, при таком изменении параметров гик надо увеличить число Кг, чтобы сохранить прежнее качество декодированных изображений. Сам по себе лапласиан можно квантовать грубо без заметных искажений декодированного изображения. Но в рассматриваемом методе кодирования квантованный лапласиан используется для восстановления изображения посредством преобразования (17). Именно это обстоятельство заставляет увеличивать число к . При к -11 расход бит вернется к почти прежней величине:

Я=1одг 11 + (1од2б4) /64= 3.55 бит/эл. Двухкомпонентный метод кодирования изображений удалось улучшить другим путем, перейдя к пирамиде лапласианов. Пирамида лапласианов. Пусть массив

ио = {"„(я1/"); т,п=0, . . . (22)

где 2" и я - целое число, представляет оригинал - изображение нулевого уровня. Посредством линейного оператора л2, где оператор А определен коэффициентами (20). изображение (22) преобразуется в сглаженное изображение того же уровня:

*о-Лгио= {^(га^)}, (23)

где V (га, п)= II а<г) а'г> ио(т-1,п^); т,п=2, . .. -2 и коэффициенты а'21 имеют следующие значения:

=,(2> Э/Р ,<2> 1 /Л =,(г> 1 /1С =<2) _<2>

а0 =3/8, а1 =1/4, аг =1/16, а{ = а_4-Яркость граничных элементов изображения (23) находят, применяя правила отражения (16).

Изображение (23) прореживают с двойным шагом, получая в результате изображение первого уровня

и=СУ0= {и (га,л)= У0(2т, 2л); га,л=0, ... ), (24)

где с обозначает оператор прореживания и # = ио/2. Преобразования (23) и (24) повторяют для получения изображений V =л2и , иг=с*1( уг=л2иг и из =02. Размер изображения 1-го уровня определяется числом яг=яо/2г, 1= 0,1,2,3. При переходе на следующий уровень число элементов сокращается в )2/(1+№ )2 » 4 раза.

Для того, чтобы из прореженного изображения 2-го уровня получить изображение уровня 1-1, используют линейный оператор интерполяции о:

»1.1=°иг- (25)

весовые коэффициенты которого подобраны так, что сглаженное и интерполированное изображения одного уровня оказываются почти одинаковыми :

(26)

Определим лапласиан 1-го уровня как разность

1г- и1-Лиг = {21 (га, л) ; т, л-0.....А^}. (27)

Лапласианы и изображение из образуют пирамиду - пред-

ставление исходного изображения ио-

"Обратное" преобразование пирамиды дает в результате приближение к исходному изображению:

й - 1 +А1 +£>( 1 +Л1 +Д(Х +Л1 *йа )). (28)

О О 01 12 2 3 Ч

Эксперименты показывают, что изображение ио визуально неотличимо от исходного изображения.

Квантование лапласиана в пирамиде. Пороговые свойства зрения человека позволяют применить разные шкалы квантования к лапласианам разных уровней. Эксперименты показывают, что применив переменные пороги квантования лапласианов и пойдя на дополнительный расход двоичных цифр для передачи информации об их изменениях,

можно взять число уровней квантования лг-З, к -5 и к -7.

0 12

Большинство элементов изображения либо относятся к областям плавного изменения яркости, когда лапласиан имеет близкое к нулю

значение, либо находятся вблизи резкого перепада (ступеньки) яркости с большим значением лапласиана. В таком случае квантование лапласиана 1о на три уровня сводится к обнаружению перепада яркости и определению его знака.

Известно, что порог обнаружения перепада Яркости человеческим зрением зависит от его длины в перпендикулярном направлении: чем длинней перепад, тем тоньше порог. Хотелось бы, чтобы аналогичное свойство обеспечивалось правилом квантования лапласиана. Представим лапласиан (21) в виде суммы восьми слагаемых: 1о (га, п) - (12и(т, л)-2и(ш-1, л)-2и(л1, л-1 )-2и(т, л+1) -2и(т+1, л)

J=S

-и(т-1, л-1)-и(л!-1, л+1)-и(т+1, л-1 )-и(лн-1, л+1) )/16= £ й (л1,л)/32, где

' 3(Д (т,п-1)+Д (т,л+1)) +4й (т,п) к-2, 6

д л }г

<Зь(т,п)

3 (А^ (л>-1, л) + й^ (л!+1, л) ) +4Ль(л,л) к-4, 8

- усредненные разности яркости соседних элементов изображения. (Напомним, что Д (га,л)-и(л1,л)-и ). Разности по диагональным нап-

й ; А

равлениям определим как

<3 (т,п) ' 2и(/я,л)+2и(я-1,л+1)+2и(л7+1,л-1)-Зи(л1-1,л)-Зи(т,л-1), <Зз (т,п) - 2и(т,л) +2и(га-1,л-1)+2и(т+1 ,л+1)-Зи(га,л-1 )-Зи(го+1,л), £35(т,л) - 2и(т,л)+ 2и(т-1 ,л+1) + 2и(т+1 ,л-1 )-Зи(л1,л+1 )-Зи(т+1, л), <37 (га,л) - 2и(т,л) + 2и(т-1,л-1)+2и(т+1 ,п+1)-Зи(т-1, л)-3и(т, л+1).

Преобразуем лапласиан, "обнулив" те его элементы, в которых ни одна из разностей не превысила установленный порог, положив

J=a

10(т,л)- I СГ(Л1,Л)/32,

где

а-Лт,л)) = Л >

(о в

л) если \й (т,л)|> г

, ;7>1.....8. (29)

в противоположном случае Пороги г = . . . = т =г и г «... - г = 0. 75 т .

2 8 0 1 7 О

Будем считать условие 1о(т,п)*о необходимым для решения о наличии перепада яркости. Если выбрать порог Т слишком тонким, то будут частыми ложные обнаружения перепадов яркости, не замечаемых наблюдателем, например,вызванные флуктуациями. Слишком грубый порог приведет к потере деталей на декодированном изображении. В ходе психофизического эксперимента устанавливается максимальный порог, при котором потеря деталей не наблюдается. Возможность обнаружения перепада зависит от его длины в перпендикулярном направлении: одиночная деталь обнаруживается при минимальном контрасте го/4, а перепад длиной не менее трех элементов - при контрасте,

не менее, чем т /10.

0

Аналогичным преобразованиям, но с другими порогами тг, подвергаются также лапласианы 1 и 1г-

При разработке правила квантования лапласиана моделировалось другое важное пороговое свойство зрения человека, называемое в психофизике маскированием, которое состоит в том, что малые перепады яркости не обнаруживаются вблизи больших перепадов. Для реализации этого свойтва формируют массив абсолютных значений элементов лапласиана

|1г 1-iUj (m,n) I; т,п=0.....1-0,1,

подвергают его восьмикратному сглаживанию и получают массив

tj-л8 Иг l = {tz (л, л); т,л=0.....//}; 1-0,1,2 (30)

который характеризует среднюю по окрестности элемента (т, л) "интенсивность" лапласиана 1-го уровня. Устанавливают пороги квантования лапласиана, определяемые соответствующим значениям Ьг(т,п).

Для квантования на три уровня лапласиана 1 нужно задать только один порог - tj(m,n) - max{ro/32, XQ tQ (т, л)), где AQ - коэффициент пропорциональности, подбираемый в ходе психофизического эксперимента. В результате квантования получают знак лапласиана

1 если 1о(т,л) > t' (т,п)

О если |1о(л1,л)|< t^ (га, л), т, л=0.....Nq. (31)

-1 если 1о(лг,л) < -¿о'(л?,л) Согласно выражению (30) порог квантования повышается, если в окрестности элемента (я,л) находятся элементы лапласиана с большими абсолютными значениями, то есть происходит маскирование.

Как показывают правила (29) и (31) отбор значимых (ненулевых) элементов лапласиана происходит в два этапа: сначала "обнуляются" элементы, значения которых порождены незамечаемыми наблюдателем изменениями яркости, а затем - те, которые маскируются своими соседями. Массив знаков лапласиана

SQ = {so (т,л); т, л= 0.....N } (32)

позволяет локализовать позиции положительных и отрицательных перепадов яркости и, в частности, найти линии изменения знака лапласиана - так называемые zero-crossings, для обнаружения которых имеются специальные механизмы в зрительной системе (Марр, 1978).

Чтобы при декодировании приблизительно восстановить величину перепада яркости надо воспользоваться информацией об абсолютных значениях лапласиана, которая содержится в массиве t . Этот восьмикратно сглаженный массив прореживают с учетверенным шагом, получая массив

s [т,п)=

Ii l-(w2(m,n); т,п-0.....N).

Как показывают эксперименты, величины w (т,п) достаточно квантовать на 5 или 6 уровней.

Лапласиан lt квантуют на 5 уровней с двумя порогами, управляемыми массивом t - И1(т,п); т, л-0,..., аг }:

t' (л,л)-тах(Г /32, XJt (|и,л)} И t"(»/n)-max{ri/32/ \"ti(m,n)), а лапласиан 1 - на 7 уровней с тремя постоянными порогами. В результате квантования получают массивы

st-{s (Ш,л); л,л-0.....Wj), 1- 1, 2. (33)

В отличие от (32), массивы (33) несут качественную информацию о величине перепада яркости. Процесс кодирования завершается формированием массива

«з-с**8 |it |-{w (т,л); л,л*о.....w3).

Величины w3(m,n) квантуются на 5 - 6 уровней.

Необходимость грубого квантования лапласианов приводит к усложнению представления исходного изображения - дополнения пирамиды {lQ , , 12, из} массивами w2 и w3. Полный расход бит не превышает

R= log2 3 + (log2 5) /А* (logz 7 + log2 6) /А2 * (1одг Кз * 1од2 б ) /43 бит /эл.

где *з -число уровней квантования изображения из- Взяв *3=64, получим

r * 2. 64 бит/эл. (34)

Рассматренный метод кодирования изображений с использование пирамиды лапласианов эффективнее ИКМ не менее, чем в 2. 7 - 3 раза.

Процедура декодирования начинается с формирования массивов «о, w , 1 и и , которые отличаются от w , w , 1 и и заменой истин-

12 3 * 0 12 3

ных значений элементов известныим представителями интервалов квантования. Затем посредством интерполяции восстановливают массивы

t 'du -{t (л,л); m, л=0.....n ); 1-0,1.

112 i А

Теперь можно восстановить массив 1 , присвоив его элементам зна-

А А А * А

чения Jj (ш,л)б{0, tir tt (л,л), iu"^ (m,n)), где, например, ui'ti(m,n)

- представитель интервала квантования (t'(m,n), t"(m,n)}. Более сложная задача -приблизительное восстановление лапласиана 1 сводится к поиску массива

1о-{Зо(т,л); л,л-О----

- наиболее гладкого решения систем уравнений (32) и

С?А8 Ii I-W •

оо

Далее процедура декодирования идет описанным ранее путем. Производят интерполяцию для получения изображения w2=du3- Затем фор-

мируют массив иг-1г+А1г+»»г и т.д. Эксперименты показывают, что декодированное изображение

AAA АА AAA

U0- l^Al^na^Al *D(12-A12->DU3)) визуально неотличимо от исходного изображения.

4.3. Помехоустойчивое кодирование изображений с использованием предсказания [11, 14, 16]

Оптимальное помехоустойчивое кодирование. В п. 1.2 был определен оптимальный оператор кодирования, при котором минимизируется отношение (1.21)

B-(s -s , )/а (35)

ПАХ hID £

при том, что условный риск

r(u, c)-/g(u, u+8u))<j (s /и) ds , (36)

где

5и-Ф z (37)

и

- преобразованная реализация шума, удовлетворяет условию (1.20): r(u, с)<е, (38)

Величина g(u,u+5u)) есть вероятность различения изображений и и v-u+би. Если провести психофизический эксперимент, состоящий из многих серий, в каждой из которых наблюдателю многократно предъявляют пару изображений (u.v), а от серии к серии меняют реализации шума в соответствии с распределением их вероятностей, то относительная частота предъявлений, в которых наблюдатель обнаружил разницу между изображениями, будет оценкой величины (36).

Возмущение (37) проявляется как вызванный шумом узор, наложенный на оригинал. Его заметность убывает с ростом отношения (35) и зависит от матрицы преобразования (37), определяемой оператором кодирования. Оптимальному оператору должна соответствовать матрица, которая согласовывает форму множества (би) с формой ППМ (1), ослабляя шум на тех участках изображения, где он более заметен, за счет усиления шума там, где его заметить труднее.

Как уже говорилось, мы не можем найти оптимальный алгоритм помехоустойчивого кодирования изображений. Будем искать субоптимальные методы, используя экспериментальные психофизические данные о заметности шумовых узоров на различных фонах и другие пороговые свойства зрения.

Кодирование с предсказанием. Рассмотрим метод кодирования изображений с использованием предсказания, который хотя и является заведомо субоптимальным, представляет практический интерес, так как легко реализуется в телевизионных системах. В основу метода

положено известное свойство зрения человека: чем больше перепад яркости, тем грубее требования к точности передачи его величины. Оно уже использовалось при квантовании лапласиана (п. 4.2), но здесь будет применен более простой, чем лапласиан, способ выделения перепадов яркости.

Определим яркость элемента (ш,п) исходного изображения, предсказанную по трем соседним элементам, как

v(m, n)=aj ( u(m-1 ,n) + u(m,n-1) )+az u(m-1 ,n-1) ; m,л=1, . . ., W-1, (39a) где коэффициенты а1,аг>0 и az + 2ai»1. Значения v(m,n) при га-0 или л=0 доопределяют отражением исходного изображения от границ поля зрения, как в п. 4. 2. :

v(0,0) = u(0,0) ; (396)

v(0,n) = (ai+а2 ) u(0, n-1)+at u(0,n) ; n=1,...,W-1; (39в)

v(m, 0) = (at+a2)u(m-1,0) + aju(m,0); m=1,..., N-1 . (39r)

Равенства (39) определяют А -линейный оператор предсказания, формирующий массив V-Au. Разность

а= u-v= (e-a)u (40)

подобно лапласиану имеет небольшие значения на тех участках изображения, где яркости соседних элементов почти одинаковы, и большие значения, когда элемент (т,п) попадает на перепад яркости. Сущность кодирования с предсказанием состоит в передаче "контурного изображения", полученного в результате преобразования (40).

Чтобы восстановить исходное изображение - массив u={u(m,n)) по массиву a={d(m,n)} надо обратить оператор е-а. Но при выбранных коэффициентах и а2 этот оператор вырожденный. Поэтому следует слегка видоизменить преобразование (40) и сформировать разность

d= u-gv-se= (E-qA) u-aee, (41)

где q<^ - положительное число. Число а?- (1 -q) (и *и )/2 симмет-

у max min

ризует интервал изменения величины d: - (1+9>(и -U )/2; d = -d

шах пах min min max

Оператор e-qa может быть обращен:

и-(Я-дЯ)"1 (d+Se)-(£'+gA+(gA)Z + . . . ) (d+ге). (42)

Практическое применение кодирования с предсказанием существенно упрощается тем, что обратное преобразование (42) легко реализуется в рекурентной форме:

u-d+gv+äe. (43а)

Для ш,п=1,...,w-i это равенство развертывается:

u(m,n)"d(m,n) + q(a¡ ( u(ra-1 ,n) + u(m, л-1) ) +az u(ra-1 ,л-1)) (436)

С учетом (39) будем иметь значения краевых элементов:

и(0,0)-(й(0,0) + г)/(1-д); (43в)

и(0,п)-(<3(0,п)-д(а1+аг)и(0,п-1)+Е)/(1-да1) ; я=1,...,Я-1; (43г) и(л1,0)-(й(га,0)+д(а1+а2 )и(т-1, 0)+е)/(1-да1 ) ; т=1,...,ЛГ-1; (43д) Будем передавать в канал сигнал

зо=Га-{зо(т,п) = у(с?(т,п))), (44)

где у(. ) ~ монотонная нечетная функция, производная которой максимальна при <3(т,п) -0 и уменьшается с увеличением абсолютного значения этой разности. Таким образом, кодирующее преобразование г состоит в вычислении разности (41) и нелинейного преобразования ?(. ). Передаваемый сигнал ограничен значениями х)-

Принятый сигнал

где < - реализация шума, сначала подвергают поэлементному преобразованию у"1 (.), получая величину

= (у(<3(Л1,п))ч(т,Л))). (45)

Поскольку шум мал, то

А

<3(я>, л) «<3(т, л) +< (т,л), (46)

где с (л1,л)=ч(т,п)/у (<3(т,л)). При больших значениях разности <3(т, л), то есть вблизи больших перепадов яркости, шум усиливается, но при надлежащем выборе функции ?(.) его заметность не повышается, так как снижается контрастная чувствительность зрения.

Следующий этап декодирования - восстановление выходного изображения по разности (45) в соответствии с алгоритмом (43):

А УЧ А

и-сй+дАи+ге.

В силу (42) и (46) выходное изображение

и-и+(£+дА+(дА)2 + . . . )С1 • (47)

При непосредственной передаче исходного изображения, когда передаваемый сигнал

30 = {я0 (Л1, л)-и(л!,п) }, выходное изображение

и=и+<. (48)

Пусть б2- максимальная дисперсия белого шума в канале, при которой незаметен шумовой узор на выходном изображении (47). Помехоустойчивость метода кодирования с предсказанием характеризуется отношением (35) я =2?(с? )/« .

1 11 ч«' 1

где 2?(<?1]11>х) -размах передаваемого кодированного сигнал?.. При непосредственной передаче это отношение

Я «(и -и )/б„.

О шах ■I в О

где б* - максимальная дисперсии белого шума в канале, при которой незаметен шумовой узор на выходном изображении (48). Выигрыш в помехоустойчивости рассмотренного метода кодирования по сравнению с непосредственной передачей равен

я /я "X(и -и )/2?(с? ).

о » шах • 1 в " шах'

где х-б /б .

1 о

Реализация алгоритма. В результате психофизических экспериментов, выполненных Л. П. Ярославским (1968) и Р. М. Атахановым (1969), было установлено, что отношение х-0.8 - 0.85. Это значение объясняется усилением шума оператором декодирования Е*дА*(дл)г.. .

Метод помехоустойчивого кодирования с предсказанием был реализован посредством СЦОИ, а такхе в реальном времени на лабораторном макете телевизионной ситемы. Эксперименты показали, что выигрыш в помехоустойчивости равен 30 - 50, или 1000 - 2500 по мощности (30 - 34 дб). Этот метод в далнейшем был развит Р. М. Атахановым (1991) и внедрен в реальные телевизионные системы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ

1. На основе методов теории информации и теории статистических решений создана теория первичной обработки видеоинформации, применение которой обеспечило существенное повышение эффективности систем передачи, хранения, обработки и отображения видеоинформа-мации.

2. Введено понятие составного ансамбля изображений, позволяющее интерпретировать оценки вероятностных характеристик ансамбля по его отдельным представителям и обосновать необходимость применения адаптивных методов обработки сигналов.

3. Измерены статистические характеристики реальных изображений различных типов.

4. Показана непригодность гауссовых случайных полей для моделирования большинства ансамблей реальных изображений. Предложены две марковские вероятностные модели ансамбля исходных изображений с неквадратическими потенциалами парного взаимодействия, реализации которых близки по структуре к реальным изображениям.

5. Развит физический подход к моделированию гиббсовского ансамбля изображений, позволяющий на основе аналогии между потенциальной энергией и мерой гладкости функции, описывающей изображение.

использовать понятия дифференциальной геометрии и теории упругости для разработки новых моделей.

6. Разработана концепция многоуровневых (иерархических) моделей ансамблей изображений в виде гаусс-марковского случайного поля со случайным изменением потенциалов взаимодействия. Предложена двухуровневая вероятностная модель ансамбля изображений с фрагментами почти одинаковой яркости и марковская модель рисунка границ между фрагментами.

7. На основе различных вероятностных моделей ансамбля исходных изображений разработаны близкие к оптимальным алгоритмы фильтрации сигналов, искаженных аддитивными и импульсными помехами.

8. Разработаны байесовы алгоритмы выделения контуров и сегментации текстурного поля на основе иерархических моделей ансамбля исходных изображений.

9. Разработан байесов метод исправления линейных искажений на на основе марковской модели и показана связь байесового подхода с методом регуляризации решения некорректных обратных задач.

10. Решена задача об обращении неполной циклической матрицы,что дает возможность предотвратить краевые искажения при использовании ДПФ для исправления однородных линейных искажений изображения

11. Подтверждена сеязь эффективности алгоритмов ПОВ с полнотой описания моделью ансамбля пространственно-структурных свойств типичных изображений.

12. Разработаны адаптивные варианты байесовых алгоритмом ПОВ, сохраняющих работоспособность при неполной априорной информации.

13. Найдена связь архитектуры специализированного вычислительного устройства параллельного действия, осуществляющего байесовы алгоритмы фильтрации сигналов, выделения контуров и сегментации, с моделью ансамбля исходных изображений.

14. Показана эффективность разработанных алгоритмов улучшения и анализа изображений посредством систем цифровой обработки для решения ряда важных практических задач таких, как обработка снимков поверхности Луны и планет, переданных советскими AMC; улучшение изображений космических летательных аппаратов, искаженных турбулентной атмосферой; восстановления архивных фотографий.

15.. Показана плодотворность применения психофизической концепции подпорогового множества стимулов к разработке методов кодирования изображений.

16. Разработан метод цифрового кодирования изображений с учетом свойств зрения, использующий парамиду лапласианов, который, обес-

печивая неотличимость декодированного изображения от оригинала, обладает максимальной эффективностью.

17. Разработан метод повышения помехоустойчивости передачи видеоинформации по каналам связи с учетом свойств зрения, использующий предсказание, который обеспечивает выигрыш в мощности в 1000 - 2500 раз (30 - 34 дб).

СПИСОК ОСНОВНЫХ ПУБЛИКАЦИ- ПО ТЕМЕ ДИССЕРТАЦИИ

1. Галицкая Е. и., Гармаш В. А., Лебедев Д. С. Применение счетно-аналитических машин для статистического анализа телевизионных сообщений // Радиотехника. 1957. №з. С. 53-56.

2. Лебедев Д.с. Статистические свойства множеств сообщений // Радиотехника. 1958. №1. С. 3-10.

3. Лебедев д.с. Статистика в телевидении. М: МДНТП, 1958. 17 с

4. Лебедев д.с. , пийль Е.и. Экспериментальные исследования статистики телевизионных сообщений // Техника кино и телевидения. 1959. №3. С. 37-39.

5. Лебедев д.с. Статистическое согласование при наличии сильных межэлементных вероятностных связей // Проблемы передачи информации, Н. : АН СССР, 1960. Вып. 5. С. 32-34.

6. Лебедев Д.С. Статистическое согласование посредством передачи позиции (координат) редких символов // Проблемы передачи информации, М. : АН СССР, 1960. Вып. 5. С. 47-54.

7. гармаш в. А. , Кириллов Н.Е., Лебедев Д. С. Экспериментальное исследование статистических свойств источников сообщений // Проблемы передачи информации, М. : АН СССР, 1960. Вып. 5. С. 112-125.

8. Лебедев Д.Г., Лебедев Д. с. Способ анализа и синтеза телевизионных изображений II Бюллетень изобретений. 1964. ff 12.

9. Лебедев Д.Г., Лебедев Д.с. Новый способ квантования изображений // Вестник АН СССР. 1964. №11. С. 44-46.

10. Лебедев Д.Г., Лебедев Д.с. Дискретизация изображений посредством выделения и квантования контуров // Известия АН СССР. Техническая кибернетика. 1965. №l. С. 88-92.

11. Лебедев Д.с., Цуккермаи U.U. Телевидение и теория информации. Л. : Энергия, 1965. 219 с.

12. Лебедев д. с. 0 применении теории информации к фотографическим системам // Журнал научной и прикладной фотографии и кинематографии. 1965. Т. 10, №1. С. 62-71.

13. Лебедев д.с. Введение // Иконика. М. : Наука,1968. С. 3-7.

14. Лебедев Д. с. Линейные двумерные преобразования изображений, увеличивающие помехоустойчивость передачи // Иконика. М. : Наука, 1968. С. 15-27.

15. Вайнштейн Г.Г., Лебедев Д.е.. Ярославский Л.П. Улучшение качества изображения с помощью вычислительных устройств// Вестник АН СССР. 1969. №з. С. 46-50.

16. Атаханов Р. М. , Лебедев Д. С. , Ярославский Л. П. Применение линейного предсказания для повышения помехоустойчивости телевизионных систем // IV Всесоюзн. конф. по теории передачи и кодирования информации: Секция V. М. -Ташкент: 1969. С. 20-24.

17. Атаханов Р. М. , Лебедев Д. С., Ярославский Л. П. Подавление помех на телевизионном изображении // Вопросы кибернетики и вы-числ. математики. Ташкент: Фан, 1969. Вып. 33. С. 106-109.

18. Лебедев Д.с. Об одном алгоритме нелинейной фильтрации флук-туационных помех на изображении // Иконика: Пространственная фильтрация изображений: фотографические системы. М. : Наука, 1970. С. 21-25.

19. Лебедев Д.С, , Ярославский л. П. Нелинейная фильтрация импульсных помех на изображении // Иконика: Пространственная фильтрация изображений: фотографические системы. М: Наука,1970. С. 26-34

20. Лебедев Д.с. Статистическая модель изображения // Иконика: Пространственная фильтрация изображений: Фотографические системы. М. : Наука, 1970. С. 53-65.

21. Атаханов P.M., Лебедев Д. е.. Ярославский Л. П. Подавление импульсных помех в телевизионном приемном устройстве // Техника кино и телевидения. 1971. №7. С. 55-57.

22. Лебедев Д.с. Авторегрессионная модель случайного поля и ее применение к задачам фильтрации // Второй Междунар. симпозиум по теории информации: Тезисы докладов. М. - Ереван, 1971. С. 126-130.

23. Лебедев Д. е., Миркин л.и. Двумерное сглаживание изображений с использованием "составной" модели фрагмента// Иконика: Цифровая голография: Обработка изображений. М. : Наука, 1975. С. 57-62.

24. Синтез цветных изображений Марса по фотоматериалам, полученным с космического аппарата "Марс-5" / Лебедев Д.е.. Ярославский Л. П., Нараева М.К., Селиванов A.c., ¡айнберг U.C. // Доклады АН СССР. 1975. Т. 225, № 6. С. 1288-1291.

25. Лебедев Д.с. Иконика - теория воспроизведения изображений// Вестник АН СССР. 1976. N6. С. 91-99.

26. Лебедев Д. С., Милюкова о. п., Трушкин А. В. Восстановление изображений, искаженных смазом, методом псевдообращения // Голо-

графия и обработка изобрахений. JI. : Наука, 1976. С. 75-80.

27. Лебедев Д. с., Милюкова О. П. Линейное восстановление изобрахений, искаженных линейным преобразованием // Иконика: Цифровая обработка и фильтрация изображений. М. : ВИНИТИ, 1978. Вып. 38. С. 18-31.

28. Лебедев д. с., Ниркин л. и., стерпии ю. г. Повышение информативности термограмм посредством компенсации тепловодности тканей // Медицинская техника. 1978. til. С. 7-13.

29. Lebedev D.S., Mirkin L.I. Smoothing of two-dimensional images using the "composite" model of a fragment // Two-dimensional digital signal proc. / Eds Mitra S.K., Ekstrom M.P. Stroudsdurg: DHR Inc., 1978. P. 197-202.

30. Лебедев д.с., Трушкин а.в. Решение системы линейных уравне-нений с неполной циклической матрицей с помощью дискретного преобразования Фурье // Журнал вычислительной математики и математической физики. 1979. (i5. С. 1333-1336.

31. Lebedev D.S. Probabilistic characterization of images in filtration and restoration problems// Signal Processing: theories and applications / Eds M.Kunt and F.de Coulon. Amsterdam: North-Holland Publishing Co., 1980. P. 55-64.

32. Lebedev D.S., Vendrovsky E.K. A parallel method for noise suppression based on contour detection // Proceedings of Intern. Conf. on Digital Signal Processing. Florence: 1981. P. 23-29.

33. Лебедев Д.С. , Милюкова о. п. Сравнение линеных методов восстановления искаженных изображений // Цифровая обработка сигналов и ее применения. М. : Наука, 1981. С. 78-86.

34. Лебедев д.с. Цифровые методы коррекции изображений // Цифровое кодирование телевизионных изображений / Цуккерман И. И. , Б. М. Кац, Д.С.Лебедев и др. М. : Радио и связь, 1981. С. 160-187.

35. Lebedev D.S., Vendrovsky E.K. On the detection of jumps in a markovian piece-wise constant videosignal // Signal Processing. 1982. V. 4. P. 387-395.

36. Ip H.H-S., Potter D.J., Lebedev D.S. Impulse Noise Cleaning by Iterative Threshold Median Filtering // Pattern Recognition Letters. 1983. V.2. P. 89-93.

37. Цифровой синтез изображения при радиографии объектов сложной конфигурации / Гусев Е. А. , Кронрод М. А. , Лебедев Д. С. , Петушков А. А. , соснин i.P. , Чочиа п. а. II Дефектоскопия. 1982. № 7. С. 86-91.

38. Лебедев д. с., Вендровский е. к. Об обнаружении скачков мар-

ковского кусочно-постоянного видеосигнала // Иконика: Теория и методы обработки изображений. М. : Наука, 1983. С. 3-12.

39. Лебедев Д. с., Милюкова о. П. Восстановление изображения на основе марковской вероятностной модели// Иконика: Теория и методы обработки изображений. М. : Наука, 1983. С. 21-31.

40. Лебедев A.C., Безрук A.A. Нелинейная фильтрация зашумленных изображений, основанная на марковской вероятностной модели // Исследования Земли из космоса. 1983. №1, С. 99-106.

41. Лебедев A.c., Безрук A.A. Устранение импульсных помех с использованием марковской модели изображения// Труды vin Всесоюзн. симпозиума по проблеме избыточности. JI.: 1983. С. 84-92.

42. Лебедев А-С. Марковская вероятностная модель изображения // Лебедев A.C., Безрук A.A., Новиков в.М. Марковская вероятностная модель изображения и рисунка. Препринт. М. : ИППИ АН СССР, 1983. С. 3-14.

43. Лебедев д.с., Новиков в. н. Марковская вероятностная модель рисунка // Лебедев А.С., Безрук А. А. , Новиков В.Н. Марковская вероятностная модель изображения и рисунка. Препринт. М. : ИППИ АН СССР, 1983. С. 31-40.

44. Лебедев A.c., Тхор в. Б. Квантование лапласиана при кодировании изображений // Всесоюзный симпозиум "Сокращение избыточности в цифровых телевизионных системах": Тезисы докладов. Тбилиси: 1983. С. 65-66.

45. Лебедев А■ С. , Тхор в. Б. О точности представления лапласиана в моделях зрительных систем // Зрение организмов и роботов: Тезисы докладов Всесоюзного симпозиума. Вильнюс: 1985. Т. 2. С. 67.

46. Аавыдкина В. Ю., Лебедев Д. С. Обнаружение контраста, основанное на операторе Лапласа // Зрение организмов и роботов: Тезисы докладов Всесоюзного симпозиума. Вильнюс: 1985. Т. 2. С. 45-46.

47. Лебедев A.C., Новиков В.м. Двухуровневая вероятностная мо-' дель текстурного поля // Всесоюзн. симпоз. "Методы и программное обеспечение обработки информации и прикладного статистич. анализа данных на ЭВМ": Тезисы докладов. Минск: 1985. С. 154.

48. Лебедев А■ с. Иерархические вероятностные модели ансамбля сложных изображений // Тез. докл. и Всесоюзн. конф. "АСОИз-86". М. : Наука, 1986. С. 29-30.

49. Лебедев A.c., тхор в. Б. Интерполяционный подход к кодированию изображений методом блочной ИКМ // Кодирование и обработка изображений. М. : Наука, 1988. С. 5-21.

50. Лебедев A.C. Упругая модель изображения // Кодирование и

обработка изображений. М. : Наука, 1988. С. 61-69.

51. Лебедев Д.с., Безрук A.A. Двумерное восстановление изображения на основе марковской модели // Кодирование и обработка изображений. М. : Наука, 1988. С. 137-143.

52. Лебедев Д.с. Статистическая теория обработки видеоинформации. М. : МФТИ, 1988. 80 с.

53. Лебедев Д.с. Вероятностные модели изображений и нейронные сети для статистической обработки видеоинформации // Тезисы докл. Всесоюзн. конф. по искусственному интеллекту. Переяславль- Залес. 1988. Т. 2. С. 182-187.

54. Лебедев Д. е.. Безрук A.A. Выделение контуров на основе иерархической вероятностной модели ансамбля изображений // Иконика: Цифровая обработка видеоинформации. М. : Наука, 1989. С. 5-18.

55. Lebedev D.S. Goutner G.B. Image Encoding Using a Difference Picture Pyramid// Abs. of XXIII General Assembly of URSI. Prague, 1990. V. 2. P. 457.

56. Лебедев Д.е., Гутнер Г. Б. Кодирование видеоинформации с использованием пирамиды разностных изображений // Труды xxv конф. молодых ученых ИППИ АН СССР. М: 1990. С. 14-16.

57. Lebedev D.S. Laplacian Pyramid Code as a Representation for Low-Level Visual Information. Bericht des Instituts für Informatik der Universität Zürich. Zürich: 1992, Nr. 92.01. 15 p.

Тир. 100

МГП "Агомдолиграфсервис

Зак. 859