автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Математическая модель наблюдателя в процессе зрительной обработки изображений

доктора технических наук
Трифонов, Михаил Иванович
город
Санкт-Петербург
год
1998
специальность ВАК РФ
05.13.16
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Математическая модель наблюдателя в процессе зрительной обработки изображений»

Текст работы Трифонов, Михаил Иванович, диссертация по теме Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)

/

у ^ ; с? а ^ /г / ат Г/

Российская Академия Наук Институт физиологии им. И.П.Павлова Институт эволюционной физиологии и биохимии им. И.М.Сеченова

■'доъ 93 ^ ДВ На правах рукописи

ТРИФОНОВ

Михаил Иванович

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ НАБЛЮДАТЕЛЯ В ПРОЦЕССЕ ЗРИТЕЛЬНОЙ ОБРАБОТКИ ИЗОБРАЖЕНИЙ

Специальность 05.13.16 - применение вычислительной техники

математического моделирования и математических методов в научных исследованиях

Диссертация на соискание ученой степени доктора технических наук

Научный консультант д.м.н.Ю.Е.Шелепин

Санкт-Петербург - 1998

СОДЕРЖАНИЕ

Стр.

Введение. Общая характеристика работы............................................... 6

Глава 1. Проблема математического моделирования зрительной

обработки изображений.......................................................... 15

1.1. Введение.................................................................................. 15

1.2. Неопределенность в квантовой механике, теории передачи сигналов, нейрофизиологии и психофизике....................................17

1.2.1. Принцип неопределенности в квантовой механике........................... 17

1.2.2. Аналог принципа неопределенности в волновой оптике................... 21

1.2.3. Аналог принципа неопределенности в теории передачи сигналов.......22

1.2.4. Аналог принципа неопределенности в физиологии...........................23

1.2.5. Аналог принципа неопределенности в психофизике...........................27

1.3. Информационный аспект принципа неопределенности.....................28

1.4. Измерительные аспекты неопределенности....................................30

1.5. Измерение и восприятие как устранение неопределенности...............33

1.6. Информационная метрика в модели идеального наблюдателя............38

1.7. Собственный шум зрительной системы: проблемы оценки и моделирования.......................................................................... 41

1.8. Собственные шумы структурных элементов зрительного анализатора..............................................................................42

1.9. Эквивалентный шум зрительной системы.......................................45

1.10. "Индуцированный" собственный шум наблюдателя.......................... 47

1.11. Метод "черного ящика" и эквивалентный шум наблюдателя............ 48

1.12. Пространственная обработка зрительной информации как случайный процесс.....................................................................57

Глава 2. Аналог принципа неопределенности для пороговых условий

пространственного зрения........................................................... 61

2.1. Определение "светового кванта" для пороговых условий зрительного восприятия.............................................................. 61

2.2. Определение пространственно-яркостной компоненты А1 светового кванта зрительного восприятия на основе результатов измерения частотно-контрастной характеристики зрительной системы человека.. 63

2.3. Оценка количества информации /в пороговых условиях зрительного восприятия...............................................................69

2.4. Обобщение аналога принципа неопределенности пространственного зрения............................................................70

I

2.5. Оценка числа пространственных фильтров в зрительной

системе человека........................................................................73

2.5.1. Линейная и нелинейная шкалы размеров рецептивных полей............ 73

2.5.2. Алгоритм автоматического переключения фильтров........................74

2.6. Понятие физиологического контраста...........................................76

2.7. Описание поведения частотно-контрастной характеристики зрительной системы человека в области низких и высоких пространственных частот............................................................ 81

Глава 3. Применение математической модели наблюдателя для ■

задачи зрительного обнаружения приращения яркости сигнала на фоне случайных помех................................................................ 84

3.1. Общие положения......................................................................84

3.2. Зрительное обнаружение приращения яркости известного

сигнала на фоне случайных помех..................................................88

3.3. Модель зрительной системы.........................................................90

3.4. Мера различимости с1'т распределений яркости...............................95

3.5. Оценка величины с1'т на основании результатов психофизических экспериментов по зрительному обнаружению объектов на

фоне случайных помех..................................................................102

v 4

3.6. Исследование применимости модели идеального наблюдателя для описания результатов зрительного обнаружения квадрата на

фоне случайных помех...................................................'...............102

3.7. Мера неопределенности пространственного зрения наблюдателя, порождаемая его неспособностью адекватно использовать априорную информацию о местоположении обнаруживаемого объекта..........112

3.7.1. Оптимальное решение задачи о зрительном обнаружении объекта с вероятностной априорной информацией о его местоположении........................................................................ 112

3.8. Выбор оптимального способа обработки изображений в задаче обнаружения приращения яркости при наличии собственного шума наблюдателя.............................................................................. 121

3.8.1. Случай аддитивного собственного шума наблюдателя......'............... 121

3.8.2. Случай смешанного (аддитивного и мультипликативного) собственного шума наблюдателя................................................. 133

/

3.8.3. Анализ особенностей пространственной обработки изображений

в случае одноканальной модели наблюдателя................................. 143

3.8.4. Анализ особенностей пространственной обработки изображений

в случае двухканальной модели наблюдателя................................. 147

3.9. Результаты численных оценок величины d'm и анализ психофизических характеристик двухканальной модели наблюдателя............. 150

3.10. Случайная составляющая весовой функции в модели наблюдателя......157

3.10.1 . Модель наблюдателя для задачи различения шумовых изображений.................................................................................... 157

3.10.2. Сопоставление теоретических и экспериментальных оценок

эффективности решения задачи зрительного различения шумовых изображений наблюдателем................................................ 161

Глава 4. Модель нейронной сети, описывающей локальное радиально-

угловое преобразование в зрительной системе........................... 166

4.1. Блок-схема нейронной сети........................................................... 166

4.2. Общие принципы пространственной организации нейронной сети...... 167

4.3. Кластер дискретизации................................................................. 169

4.4. Принципы соответствия пространственных размеров кластера различных иерархических уровней...................................................171

4.5. Принцип нумерации кластеров в пределах заданного иерархического уровня.................................................................;...............174

4.6. Принцип радиально-углового преобразования................................. 174

4.7. Описание пространственных характеристик некоторых бинарных объектов простейшей формы......................................................... 176

4.8. Основные свойства локального радиально-углового преобразования изображений и его инварианты...................................................... 179

4.9. Локальное радиально-угловое преобразование на матрице из 169 детекторов................................................................................. 188

4.10. Параллельное локальное радиально-угловое преобразование............ 191

4.11. Физиологические корреляты локального радиально-углового преобразования........................................................................ 195

Выводы.......................................................................................... 202

Заключение.................................................................................... 204

Список основных обозначений............................................................ 207

Список литературы............................................................................210

ВВЕДЕНИЕ. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Успехи в области автоматизации различных технических (технологических) процессов, достигнутые за последнее время, позволили освободить человека от выполнения множества рутинных операций. Наряду с этим, технический прогресс ярко высветил определенные аспекты взаимодействия человека и машины, практически не поддающиеся строгой формализации и алгоритмизации. В результате переосмысления роли и места человека-оператора в сложных эрготехнических комплексах перед проектировщиками и разработчиками встала проблема согласования объема, скорости и характера представления оперативной информации со способностью оператора воспринимать и обрабатывать эту информацию. Поскольку в большинстве современных эрготехнических комплексов оператор имеет дело с многочисленными экранами и датчиками, то основная нагрузка при этом ложится на зрительную систему последнего. В связи с этим техническое оснащение рабочего места оператора новыми приборами формирования и отображения визуальной информации должно осуществляться с учетом особенностей обработки этой информации в зрительной системе. Данная проблема является актуальной прежде всего с медицинской точки зрения, поскольку зрительные стрессы (\УШ<тз, 1995) и некоторые психические заболевания (Филин, 1995, 1997) в значительной степени обуславливаются неадекватной формой представления визуальной информации не только на производстве, но также и в бытовых условиях.

Усилиями многих ученых был собран уникальный экспериментальный материал, позволивший понять некоторые принципы пространственной обработки визуальной информации в зрительной системе человека. Однако экспериментальные данные зачастую лишь констатировали наличие обработки как таковой, не позволяя однозначным образом вскрыть ее причину, а, следовательно, и предсказать ее проявление в конкретных условиях

наблюдения. Спектр же этих условий настолько широк, что никоим образом не может быть охвачен за счет одних лишь экспериментальных исследований. В связи с этим, важное значение придается методам математического моделирования характеристик пространственного зрения.

Один из наиболее популярных и разработанных подходов к математическому моделированию пространственной обработки зрительной информации нашел отражение в концепции идеального наблюдателя, первоначально сформулированной в рамках статистической радиотехники. Применительно к зрительному восприятию данная концепция получила развитие в работах Таннера, Светса (Tanner, Swets 1954), Бердзалла (Birdsall, 1960), Грина, Светса (Green, Swets, 1966), Игана (1983), Красильникова (1958, 1976, 1986), Бургесса и др. (Burgess et.al., 1981, 1988), Красильникова, Шелепина (1997) и др. Несмотря на различное отношение этих и других авторов к возможности применения понятия идеальности (оптимальности) к реальному наблюдателю, все они сходились в том, что предобработка визуальной информации в математических моделях зрительной системы должна производиться методом согласованной фильтрации, характеристики которого определяются исключительно параметрами анализируемого объекта. Такая точка зрения основывалась на том, что в физиологической оптике и психофизике, как и в радиотехнике, можно использовать понятие эквивалентного шума независимо от места генерации реального шума в оптико-электронной цепи. Отчасти она является оправданной, поскольку обзор поля излучения в известных оптико-электронных системах осуществляется путем последовательной регистрации потоков излучения за счет пространственной развертки (сканирования или последовательного восприятия). Такая развертка в данной ситуации оказывается эквивалентной линейной инвариантной в пространстве фильтрации. Реакция на выходе линейной системы в этом случае, как известно, записывается в виде интеграла,

подобного интегралу Дюамеля (Шестов, 1967). Именно по причине того, что наблюдатель рассматривается как линейная сканирующая система становится возможным пересчет собственных шумов на его вход (Красильников, 1976, 1986; Мартынов, Шкурский, 1980, 1982; Ahumada et. al., 1985; Ahumada, 1987; Pelli, 1990; Красильников, Шелепин, 1997). В рамках такой модели шум представляет собой весьма формальную характеристику, поскольку не оказывает никакого влияния на импульсную реакцию наблюдателя. Последняя оказывается зависящей исключительно от характеристик входного изображения. Так, в простейшем случае обнаружения сигнала L(x,y) на фоне аддитивной "белой" помехи N(x,y) общепринятая точка зрения заключается в том, что импульсная характеристика оптимального фильтра должна совпадать с точностью до постоянного множителя с функцией L(x0-x,y0-y), где [0,xo]x[0, у0] область задания изображения. Устройства, обладающие такой характеристикой фильтра, называются корреляционными приемниками, или коррелометрами. Известно, что операция вычисления корреляционного интеграла требует времени, а сам коррелометр должен иметь память достаточную для хранения всей реализации численных значений интеграла, вычисленных для дискретных значений координат, которые должны лежать достаточно близко друг к другу, чтобы не был пропущен максимум корреляционного интеграла. По сути дела коррелометрами являются практически все известные модели зрительного обнаружения, поскольку они в той или иной степени базируются на том, что пространственная фильтрация в зрительной системе является согласованной, либо близка к ней.

Следует отметить, что преобразование оптического поля яркости на входе зрительной системы в отклики нейронов может осуществляться и другими способами, а не только за счет пространственного сканирования изображения, указанного выше. Подвигиным (1979), в 4ácTHocra, было установлено, что в процессе пространственно-временной перестройки

рецептивных полей сетчатки и наружного коленчатого тела (НКТ) кошки, занимающей интервал времени около 150 мс, наблюдается последовательное сжатие и расширение зоны суммации этих полей. Пространственная обработка изображения при этом оказывается эквивалентной скорее частному случаю вейвлетного преобразования (Field, 1994), чем линейной инвариантной в пространстве фильтрации. Отметим, что преобразование световой энергии на входе оптико-электронной системы в соответствующий отклик может достигаться за счет использования ослабляющих световой поток оптических масок (Козлов, 1979), устанавливаемых в плоскости выходного зрачка оптической системы (Шестов, 1967).

Во всех случаях, когда анализ поля излучения осуществляется несканирующей системой, или когда сканирование осуществляется за счет конечного числа изменений состояния весовой функции A(x,t) (х е X с R2), описывающей распределение эффективной чувствительности системы по плоскости изображения в момент времени t, понятие эквивалентного шума системы требует некоторого уточнения. Это обусловлено тем, что закон композиции сигнала, внешней помехи и собственного шума приемника имеет несколько иной вид, а именно, собственный шум приемника излучения смешивается с испытавшей пространственно-временное преобразование внешней помехой. При этом на заключительном этапе данное преобразование имеет вид скалярного произведения пространственной весовой функции A(x,t) наблюдателя (формального нейрона, канала, фильтра, и т.п.) и входного распределения яркости, "размытого" оптикой глаза и нейронной сетью. В рамках современной теории планирования фотометрических экспериментов (Козлов, 1987) было показано, что вид оптимальной пространственной обработки оптического сигнала должен определяться при этом не только видом содержащегося в нем объекта, но и соотношением уровней собственного шума приемника и внешней помехи. Данный результат послужил основанием

для пересмотра роли собственного шума наблюдателя в процессе оптимальной пространственной обработки изображений. Поскольку характеристики этого шума не могут быть измерены непосредственно на человеке, то основная сложность математического моделирования связана с корректным учетом влияния этого шума в модели идеального наблюдателя. Решение данной проблемы невозможно без комплексного подхода, объединяющего усилия специалистов в области физиологии зрительной системы, психофизики, статистической оптики и радиотехники, системного анализа. Особую актуальность в этой связи приобретают математические методы решения задач квадратичной оптимизации, возникающие при определении оптимального способа пространственной обработки визуальной информации в зрительной системе (ЗС).

Цель работы заключается в разработке принципиально новой математической модели наблюдателя в процессе зрительной обработки изображений для описания способности реального наблюдателя к обнаружению и различению объектов на фоне случайных помех.

Основные зада, чи исследования:

1. Провести анализ современных представлений об основных принципах пространственной обработки изображений в зрительной системе человека и оценить уровень существующих математических моделей идеального наблюдателя для задач обнаружения объектов на фоне случайных помех.

2. Оценить возможность описания экспериментальных данных по измерению частотно-контрастной характеристики зрительной системы человека в терминах закона полной пространственной суммации и определить параметры этого описания.

3. Разработать математическую модель наблюдателя путем учета ограничений, свойственных реальному наблюдателю, и исследовать роль

собственных шумов наблюдателя как управля�