автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Математические модели для систем технического зрения
Оглавление автор диссертации — кандидата физико-математических наук Гладилин, Сергей Александрович
Введение.
Глава 1. Непрерывная модель системы «неоднородная сетчатка - однородная зрительная кора».
1.1. Постановка задачи.
1.2. Сетчатка, система координат.
1.3. Преобразование «неоднородная сетчатка - однородная зрительная кора»
1.4. Форма зрительной коры.
Глава 2. Компьютерная модель неоднородной сетчатки.
2.1. Постановка задачи.
2.2. Требования к модели и принятые допущения.
2.3. Общее описание алгоритма моделирования расположения рецепторов сетчатки.
2.4 Описание алгоритма наращивания «точечной сетчатки».
2.5. Хранение данных и организация вычислений в алгоритме наращивания «точечной сетчатки».
2.6. Моделирование светочувствительных площадок рецепторов - алгоритм «биологического роста».
2.7. Результаты применения алгоритма наращивания «точечной сетчатки»
2.8. Моделирование конвергенции рецепторов.
Глава 3. Компьютерная модель системы «неоднородная сетчатка - однородная зрительная кора».
3.1. Постановка задачи.
3.2. Математическое описание формы зрительной коры.
3.3. Дискретная модель зрительная коры.
3.4. Моделирование формирования сигнала фоторецепторов.
3.5. Компьютерная реализация разработанной модели.
3.6. Примеры компьютерного моделирования.
3.7. Выводы.
Глава 4. Динамическая модель нейронной сети, выделяющей контрасты на изображении.
4.1. Постановка задачи.
4.2. Функциональная схема.
4.3. Математическое описание модели.
4.4. Компьютерная реализация построенной модели.
4.5. Выводы.
Глава 5. Перспектива применения преобразования «неоднородная сетчатка -однородная кора» в системах технического зрения.
5.1. Постановка задачи.
5.2. Реализация кортикального усиления в СТЗ, построенной по принципу
НС-ОК.
5.3. Компьютерный эксперимент получения зональных изображений.
5.4. Характеристики системы технического зрения.
5.5. Блок-схема СТЗ, реализующей принцип НС-ОК.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Гладилин, Сергей Александрович
Актуальность темы. В настоящее время в мире наблюдается возрастающий интерес к интеллектуальной робототехнике. Это, в первую очередь, связано с разработкой антропоморфных роботов, предназначенных для существования в среде обитания человека и выполняющих, в основном, ту же работу, которую до этого вынужден был выполнять человек. Иногда эти роботы называются гуманоидными или андроидными.
В России в настоящее время проводится разработка двуногого шагающего антропоморфного робота в рамках проекта АРНЕ. Зарубежные фирмы, такие как Honda, Sony и другие, вкладывают большие средства в разработку антропоморфных роботов. В Японии существует многолетняя правительственная программа поддержки и координации работы фирм в этом направлении. Основное применение интеллектуальных роботов носит социальный характер: это помощь престарелым, больным или одиноким людям. Учитывая большую востребованность подобной продукции рынком, в целях обеспечения коммерческого успеха, информация о разработках антропоморфных роботов, как правило, закрыта. Демонстрируется только результат (образец робота) на различных выставках.
Всё же, положение можно охарактеризовать следующим образом: основные усилия направлены на разработку управления походкой и манипулированием. В этом вопросе наблюдаются впечатляющие успехи. Что же касается зрительной системы роботов, то она пока тяготеет к стандартным решениям, пришедшим из телевидения.
В то же время, антропоморфными роботы названы не только за свое внешнее сходство с человеком (хотя это также имеет значение при работе робота среди людей, например, роботы-помощники, роботы-слуги и т.п.) но, главным образом, это должны быть роботы, использующие специфические методы обработки информационных потоков, заимствованные у человека. Это относится и к зрительной системе роботов.
Зрительная система человека весьма совершенна. Она в состоянии выделять яркостные контрасты, соизмеримые с уровнем шума, и успешно решать основную задачу - распознавание объектов на изображении. Зрительная система человека обладает уникальным свойством - обеспечивает высокую остроту зрения при широком угле обзора. Считается, что прогрессивная эволюция приматов в значительной степени связана с формированием единого морфо-функционального комплекса, в который входит существенно неоднородная сетчатка, а также соответствующий аппарат глазодвигательных центров мозга, обеспечивающий возможность использования сетчатки в распознавании образов и афферентном синтезе.
Математической модели системы «неоднородная сетчатка -однородная кора» в настоящий момент неизвестно. Поэтому разработка такой модели с целью использования ее принципов обработки информации в зрительной системе роботов для резкого повышения эффективности работы является актуальной задачей. Настоящее исследование проводилось именно в этом направлении.
Обзор литературы. Настоящее исследование опирается на морфологические, электрофизиологические и психофизические исследования строения зрительной системы человека.
В работах [1], [2], [3], [4] показана существенная неоднородность сетчатки колбочек. В [1] также обращено внимание на различие между кривой увеличения межрецепторных расстояний по мере удаления от центральной части сетчатки и кривой ухудшения остроты зрения человека. В работах [5], [6] показано, что кривая ухудшения остроты зрения соответствует кривой увеличения расстояния между карликовыми ганглиозными клетками сетчатки.
Изучение мозаики расположения рецепторов сетчатки и реальные фотографии небольших частей сетчатки представлены в работах [7], [8], [9], [10], [11].
Вопросы остроты зрения и ее зависимости от различных факторов, в особенности - от эксцентриситета (удаления от центра сетчатки) можно найти во многих работах, в частности в [12], [13], [6], [14], [15]. В данном исследовании использовались результаты, представленные в работе [13].
Исследованиям вопросов кортикального усиления и отображения сетчатки на зрительную кору посвящены работы [16], [17], [18], [19], [20]. В работе [16] сделано, а в [21] экспериментально подтверждено предположение о соответствии зависимостей относительной остроты зрения и относительного кортикального усиления от эксцентриситета.
Роль движения глаз в процессе зрения подробно исследовалась в работах [12], [22], [23].
Модели, реализующие процесс выделения контуров в зрительной системе, описаны в работах [24], [25], [26], [27], [28], [29], [30], [31], [32]. В целом их молено разделить на две группы:
- использующие для выделения контуров метод латерального взаимодействия (т.е. обмена информацией между близко расположенными между собой каналами сетчатки);
- использующие метод с динамическим формированием рецептивного поля посредством микродвижений глаз (в первую очередь - дрейфа).
Наиболее известными моделями зрительной системы с латеральным взаимодействием являются модели Марра-Хилдрет [24], [25] и Вильсона-Бергена [26]. В работах [29], [30], [31], [33], [34] предложены модели, выделяющие контуры пространственно-временным методом с использованием микродвижений глаз и компенсатором микродвижений.
В то время как в реализации походки и манипулирования роботов достигнуты впечатляющие успехи, вопросам создания систем технического зрения уделяется значительно меньшее внимание. Например, в монографии [35] данной теме посвящено всего несколько страниц. Как уже упоминалось, в настоящее время системы технического зрения роботов тяготеют к стандартным решениям, пришедшим из телевидения [25], [36], [37].
Как показано, к настоящему моменту проведено большое количество разнообразных исследований различных аспектов функционирования зрительной системы человека, имеющей существенно неоднородную сетчатку и однородную первичную зрительную кору головного мозга.
Однако, несмотря на большое количество моделей биологической направленности, в настоящий момент не известны математические модели системы «неоднородная сетчатка- однородная зрительная кора», ориентированные на внедрение в системы технического зрения, что потребовало провести настоящее исследование.
Цель работы. На основе изучения морфологических, физиологических и психофизических данных о зрительной системе приматов разработать:
- компьютерную модель сетчатки, реализующую свойства неоднородности и конвергенции;
- компьютерную модель системы неоднородная сетчатка - однородная зрительная кора (НС-ОК);
- методику компьютерного эксперимента с проекцией реальных изображений на зрительную кору и на основе результатов этого эксперимента дать оценку целесообразности применения системы НС-ОК в зрительной системе антропоморфного робота;
- эффективные алгоритмы для реализации системы неоднородная сетчатки - зрительная кора, использующие в качестве приемника стандартную многоэлементную фотоматрицу.
Методы исследования. В работе использовались методы аналитической геометрии, вычислительной математики, аппроксимации функций, машинной графики и проверки разработанных математических моделей путем проведения компьютерного эксперимента.
Научная новизна:
- математически описаны модели зрительной коры как геометрической поверхности и отображения элементов сетчатки на зрительную кору;
- разработана компьютерная модель неоднородной сферической сетчатки, реализующая свойства неоднородности, конвергенции, совпадения в центральной части с реальной сетчаткой человеческого глаза и описывающая расположение всех «колбочек», обеспечивающих поле зрения углом 80°;
- поставлен компьютерный эксперимент проектирования сетчаточных изображений на зрительную кору;
- разработаны алгоритмы, позволяющие реализовать преобразование НС-ОК в системах технического зрения.
Практическая значимость работы. Предложен новый подход к конструированию зрительной системы робота, основанный на применении бионических принципов обработки информации в соответствии с предложенной моделью «неоднородная сетчатка - однородная зрительная кора».
Разработанный метод реализации подобных систем технического зрения (СТЗ) имеет значительную практическую ценность, так как способствует решению следующих актуальных задач:
- работа СТЗ с большим углом обзора и высоким локальным разрешением;
- сокращение массива обрабатываемых цифр путем проведения анализа сцены на нескольких малоформатных изображениях;
- использование одного и того же оператора выделения признака (ориентированные линии, углы, контрасты и т.п.) на объектах различной величины;
- расширение диапазона скоростей регистрируемого движения объекта;
- расширение зоны компенсации возмущающего воздействия при стабилизации изображения на фотоматрице с пиксельной точностью.
Положения, выносимые на защиту:
1. Основные свойства математической модели зрительного анализатора с системой «неоднородная сетчатка - однородная кора»: - корковые проекции имеют одинаково резкие контрасты при любом эксцентриситете;
- локальный оператор, выделяющий какой-либо признак изображения на коре, эффективен для всего поля коры;
- трансформация скоростей корковой проекции подвижного объекта создает благоприятные условия для определения его скорости;
- трансформация скорости корковой проекции расширяет зону контроля за возмущающим действием для стабилизации сетчаточной проекции.
2. Предложенная методика применения системы «неоднородная сетчатка - однородная кора» (НС-ОК) в приборах технического зрения, использующих однородную фотоматрицу достаточного формата, позволяет реализовать вышеперечисленные свойства математической модели в системе с высоким локальным разрешением.
Гпава 1. Непрерывная модель системы «неоднородная сетчатка - однородная зрительная кора»
1.1. Постановка задачи
Сетчатка человеческого глаза является средством восприятия света. Как следует из [38], поверхность сетчатки близка к внутренней поверхности сферического сегмента угловым радиусом около 70°. Центр этой поверхности называют центром сетчатки. При этом сетчатка значительно неоднородна - в ее центральной части фоторецепторы в несколько раз тоньше и более плотно упакованы, чем на периферии [1]. Кроме того, на периферии имеет место конвергенция рецепторов, т.е. интеграция сигналов нескольких рецепторов сетчатки в общий сигнал, поступающий на дальнейшие уровни обработки информации в зрительной системе.
В настоящей работе предлагается бионическая модель зрительной системы с неоднородной сетчаткой монохромного колбочкового зрения в пределах 80°. При построении модели со столь большим углом зрения следует использовать центральную модель зрительной системы [39] -считаться с тем, что поверхность сетчатки не плоская, а близка к внутренней поверхности сферического сегмента.
Теперь обратим внимание на зрительную кору. Здесь производится первичный анализ зрительной информации — обнаружение линий, углов, направлений и т.п., т.е. выделяются признаки изображения, используемые при решении основной зрительной задачи - распознавания образов.
Зрительная кора, если разогнуть все ее борозды, примет веретенообразную форму. В отличие от сетчатки, зрительная кора анатомически однородна. Однородность наблюдается по всей поверхности -от точек, соответствующих центральной (фовеальной) части сетчатки, до самой дальней периферии.
Сравнивая сетчаточные проекции с их образами на зрительной коре, исследователи обнаружили соблюдение принципа топографического соответствия. Это означает, что сетчатка проектируется на кору упорядоченным образом: если идти вдоль какой-нибудь линии на сетчатке, то проекции последовательных точек этой линии в коре также образуют одну непрерывную линию [17, стр. 65].
Соблюдение принципа топографического соответствия при передаче информации от неоднородной сетчатки к однородной зрительной коре приводит к феномену, называемому «кортикальным усилением». Он заключается в том, что расстояние между двумя близкими точками на сетчатке преобразуется в пропорциональное расстояние между проекциями этих точек на коре. При этом коэффициент пропорциональности (называемый кортикальным усилением) зависит только от местоположения этих точек на сетчатке (точнее - от их эксцентриситета) и не зависит от ориентации отрезка, соединяющего точки. График зависимости кортикального усиления от эксцентриситета приведен на рисунке 1.1.
Принцип топографического соответствия был обнаружен в экспериментах, относящихся к преобразованию «сетчатка - зрительная кора». При этом автоматически учитывалась обработка сигнала на всех промежуточных этапах, например, в коленчатом теле (НКТ). На этом основании в бионической модели зрительной системы сигнал с сетчатки поступает непосредственно на зрительную кору.
Необходимо отметить, что если передача информации от сетчатки к зрительной коре осуществляется в соответствии с принципами топографического соответствия, то для заданной формы сетчатки (считающейся в нашей модели сферическим сегментом угловым радиусом 40°) существует единственная возможная форма поверхности первичной зрительной коры, для которой такое отображение возможно. г >. v-га х а. g 1
2 —
2 s а: 1 ш fc;
I Z <2 fe ■ i ° и >< U о x л ^ s ta. £
Л* * V
-*—♦ -«Н*-
20 30 40 50
Удаление от центра сетчатки (угл. градусы)
Рисунок 1.1. График зависимости кортикального усиления от эксцентриситета [16].
Метод передачи зрительной информации от сетчатки глаза в зрительную кору в соответствии с указанными принципами играет важную роль в функционировании всей зрительной системы человека. Исследование этой роли можно проводить с помощью компьютерной модели, позволяющей увидеть на экране монитора преобразование информации в процессе такого отображения, а также производить визуальную оценку изображений и их сравнение.
Математическая непрерывная модель отображения «неоднородная сетчатка - однородна кора» описываются в настоящей главе.
Модель иллюстрирует логические этапы переработки информации в зрительной системе, поэтому сетчатка и зрительная кора рассматриваются в целом без конкретизации конкретных биологических структур, реализующих ту или иную функцию.
Заключение диссертация на тему "Математические модели для систем технического зрения"
4.5. Выводы
Предложенная функциональная модель нейронной сети, описывающая работу сетчатки с ON- и OFF-центрами рецептивных полей, дает достаточно хорошее совпадение с результатами электрофизиологических экспериментов, проведенных для двух уровней освещенности (темнота, свет). Дальнейшее уточнение модели может быть произведено при наличии опытных данных о выходном сигнале ганглиозной клетки с аналогичными стимулами, но для нескольких промежуточных уровней освещенности рецептивного поля.
Существование в зрительной системе рецептивных полей с антагонистическим центром и периферией приводит к необходимости обработки сигналов как положительной, так и отрицательной полярности. Это видно на осциллограммах рисунка 4.2 (строка "с" для стимула D и строка "d" для стимулов В и D). Однако частотно-импульсная модуляция, используемая в ганглиозной клетке, дает возможность отображать изменение только одного параметра сигнала. Поэтому представляется целесообразным существование в зрительном анализаторе двухканальной системы обработки информации. В этом случае методом частотно-импульсной модуляции передается амплитуда сигнала (грубо), а полярность (второй параметр сигнала) определяется принадлежностью ганглиозной клетки к системе с ON-или OFF-центрами рецептивных полей (т.е. практически без ошибки). Таким образом, зрительная система работает по принципу сохранения контуров изображения [52]. Хьюбелл [17, стр. 61] указывает на энергетическую выгоду двухканальной системы по сравнению с одноканальной, у которой в ответ на оппонентные стимулы частота импульсов снижается или повышается относительно некоторой опорной («нулевой») частоты. Добавим к этому, что обнаружение контрастов в одноканальной системе свелось бы к сравнению импульсных последовательностей с нестабильной частотой, что вряд ли может составить конкуренцию двухканальной системе.
Предложенная модель указывает на принципиальную возможность построения системы каналов с ON- и Ш^-центрами рецептивных полей, в которых ганглиозные клетки работают с выходными сигналами одной полярности (например, положительной). Другими словами, ганглиозные клетки ON-каналов и ганглиозные клетки <9^~каналов, выполняющие одну и ту же функцию, могут быть устроены совершенно одинаково.
Хотелось бы обратить внимание на реакцию сетчатки при воздействии стимулов D и С. И в том и в другом случае имеет место тормозящее действие освещенной периферии рецептивного поля. Однако выходные сигналы существенно различаются. При действии стимула D в выходном сигнале отсутствует импульсация (участок 5 рисунка 4.2), причем отсутствуют не только импульсы «полезного» сигнала, но и импульсы темновой активности. При действии стимула С тормозящее действие освещенной периферии не подавляет фоновой активности (участок 1 рисунка 4.2). В предложенной модели это свойство сетчатки четко реализуется (соответственно в осциллограммах строки "f" для стимулов D и С рисунка 4.5), хотя при проектировании схемы рисунка 4.3 ориентировки на выполнение этого свойства сетчатки сделано не было.
Разработка модели, дающей формальное описание сетчатки с ON- и OFF-центрами рецептивных полей, позволяет производить компьютерные эксперименты с целью, например, выделения контрастов на изображениях, спроектированных на эту сетчатку. Из осциллограмм рисунка 4.2 (участки 2 и 3) видно, что при постоянном действии стимула импульсация ганглиозной клетки постепенно затухает. В модели это свойство реализуется (строка "f" для стимулов В и D на рис. 4.5). Поэтому при компьютерном эксперименте следует использовать реальные записи микродвижений глаз (дрейф, скачки) с соответствующей компенсацией, как это делалось, например, в [49], для устойчивого восприятия сцены.
Глава 5.
Перспектива применения преобразования «неоднородная сетчатка - однородная кора» в системах технического зрения
5.1. Постановка задачи
В главах 1-4 были построены бионические модели, отражающие различные аспекты функционирования зрительной системы человека с неоднородной сетчаткой.
Известно, что зрительная система человека сочетает в себе такие факторы, как высокую локальную разрешающую способность (0,5 угл. минуты), большой угол зрения (100°) и небольшое число (около 1 млн.) выходных каналов сетчатки. В главах 1-4 показано, что столь впечатляющие характеристики реализуются с помощью преобразования «неоднородная сетчатка - однородная кора» (НС-ОК). Обратим особое внимание на последний параметр - число выходных каналов сетчатки. Если бы вся сетчатка была однородной и имела разрешающую способность 0,5 угл. минуты, то число выходных каналов сетчатки выросло бы примерно в 100 раз (как показывает моделирование сетчатки в пределах угла зрения 40°). Во столько же раз выросла бы и площадь зрительной коры.
Правда, высокое разрешение сохраняется только для центрального участка поля зрения, но, как показывает практика человеческой деятельности, последовательный анализ сцены путем смены точки фиксации взора, характерный для зрительной системы с преобразованием НС-ОК, дает отличные результаты.
Современные фотоматрицы разрешающей способностью 9-10 мегапикселей и более позволяют получить остроту зрения в 1 угл. минуту при угле зрения 50°. Дальнейшая обработка такого изображения (размером ~10 и более мегабайт) в реальном времени, сравнение указанных изображений, анализ, поиск заданного объекта на изображении и т.д. требуют значительных вычислительных ресурсов. Поэтому исследование возможностей по уменьшению обрабатываемого цифрового массива (в случае систем технического зрения идет речь об уменьшении размера обрабатываемого растрового изображения) при сохранении локальной остроты зрения и большого угла обзора является актуальной научной задачей.
Первым препятствием на пути применения системы НС-ОК в системах технического зрения (СТЗ) является отсутствие неоднородных фотоматриц как таковых. Однако это препятствие можно обойти. Обрабатывая программным путем сигнал от фотоматрицы 9 мегапикселей, можно сохранить высокое разрешение в центральной зоне и постепенно «затрубить» его в направлении периферии. Таким образом можно имитировать работу неоднородной фотоматрицы с разрешающей способностью в центре в 1 угл. мин. и углом обзора 50°.
На другое препятствие указывает разработанная в главах 1-3 бионическая модель. Это принципиальная невозможность преобразования НС-ОК, реализующего плавное снижение остроты зрения, не на поверхность объемного тела зрительной коры, как это сделано у человека, а на плоский растр, с которым принято работать (проводить анализ) в системах технического зрения. Это обстоятельство заставляет отказаться от использования плавной кривой падения разрешающей способности при смещении к периферии поля зрения, заменив ее аппроксимирующей ступенчатой функцией. Подробно этот вопрос будет рассмотрен ниже.
Системы технического зрения на данный момент еще не могут конкурировать со зрительной системой человека. Используемые ими методы обработки информации тяготеют к телевизионным.
Целью данной главы является разработка методики использования принципа НС-ОК в СТЗ.
5.2. Реализация кортикального усиления в СТЗ, построенной по принципу НС-ОК
Монохромное цифровое изображение, полученное от фотокамеры, будем называть исходным. Исходное изображение есть массив значений яркостей Rlm, где I, т - целые числа 0 <1,т <п, где п - целое число (пхп называется форматом изображения).
Опишем преобразования, осуществляемые над исходным изображением в СТЗ, построенной по принципу «неоднородная сетчатка - однородная кора» [53].
На исходном (квадратном) изображении выделяется ряд квадратных областей. Выбор осуществляется таким образом, что геометрический центр каждой области совпадает с геометрическим центром исходного изображения. Формат z'-ой области (длину стороны квадрата) обозначим через nj. Перенумеруем эти области так, чтобы ni увеличивался с ростом /. Обозначим координаты левого нижнего угла /-ой области на исходном изображении через (rt, г,) - это возможно из-за квадратности исходного изображения и выделенных областей и совпадения их геометрических центров.
Для каждой выделенной области выбирается натуральный коэффициент к,, возрастающий с ростом /, причем для /= 1 выбирается к, = 1. Выделим в г'-ой области из всех точек каждую к, по горизонтали и вертикали и назовем их базовыми. Говоря математическим языком, базовыми точками z'-ой области будем называть множество точек исходного изображения с координатами г, + xki + к 2 г,+ук,+ 2 попадающих в г-ую область, где х, у- некоторые целые неотрицательные числа. Условие попадания базовой точки в /-ую область можно записать как к 2 2 xkt + ук; + Обозначим Р\ =tk,.+ п,\ п,.
Определим понятие конвергентной яркости базовой точки с координатами (Рх>Р'у) как среднее арифметическое по квадрату размером kjxkj пикселей с геометрическим центром в базовой точке.
Для нечетных к, базовая точка является геометрическим центром квадрата к, х к,, границы которого проходят по границам пикселей. Отсюда ,i к> ,i к>
P:\-5 \ РУ +
Sxy = S '
Для четных к, рассмотрим перекрывающиеся квадраты размером (к, +1) х (ki +1), но пиксели, относящиеся к нескольким квадратам, будем учитывать с пропорционально меньшим весом: . к, +1 ,Гм± 2
Ру +
S'xy
У! У! Clnfilm' где
Clm ~ px~ k,+l l<p'x +
Pxk,+l и p k,+l
1<P'X +
Ыр'х±
1" [к: +ll и т = р'± 1
2 г У 2
Введем понятие зонального изображения, соответствующего i-ой области, как изображения, составленного только из базовых точек области со значениями в них, равными конвергентным яркостям. Из определения базовых точек и конвергентной яркости следует, что зональное изображение есть, по сути, уменьшенная в раз копия соответствующей ему области.
Если разрешающая способность разрабатываемой зрительной системы равна 1 угл. минута, а разрешающая способность фотокамеры - 9 мегапикселей (будем считать формат равным 3000x3000 пикселей), то угол зрения такой зрительной системы составит 50°, т.е. максимальный эксцентриситет - 25°.
Размеры областей на исходном изображении («,.), а также соответствующие им коэффициенты уменьшения (&,.) выбираются, исходя из ступенчатого приближения функции относительной остроты зрения человека. Значение этой функции равно кортикальному усилению, т.е. обратно пропорционально коэффициенту уменьшения, введенному для СТЗ.
Для разрешающей способности в 1 угл. мин. и формата фотоматрицы 3000x3000 пикселей, обеспечивающей угол зрения 50°, была сформирована ступенчатая функция, аппроксимирующая функцию относительной остроты зрения человека, со ступеньками высотой, обратной натуральным числам - 1,
Рисунок 5.1. Ступенчатая функция, аппроксимирующая кривую остроты зрения человека
На основе полученного приближения рассчитаем форматы зональных изображений и степень охвата ими поля зрения. Разрешение каждого изображения фиксировано и равно v-kn где v- разрешающая способность СТЗ в центре поля зрения (принятая за 1 угл. минуту). Формат зонального изображения вычисляется как Охват поля зрения есть произведение формата на разрешающую способность. Полученные данные о зональных изображениях приведены в таблице 1.
Получаемые таким образом зональные изображения в сумме имеют площадь примерно в 16 раза меньшую, чем исходное изображение.
Заключение
В диссертации получены следующие основные результаты.
1. Разработана бионическая модель системы «неоднородная сетчатка — однородная кора» (НС-ОК), включающая:
- компьютерную модель сферической сетчатки, реализующую свойства неоднородности и конвергенции;
- математическое описание модели зрительной коры как геометрической поверхности;
- математическое описание отображения элементов сетчатки на зрительную кору.
2. Проведен компьютерный эксперимент проектирования сетчаточных изображений на зрительную кору, позволяющий сделать вывод о том, что кортикальное усиление придает зрительной системе следующие свойства:
- корковые проекции имеют одинаково резкие контрасты при любом эксцентриситете;
- корковые проекции маленьких объектов в центре поля зрения и более крупных по мере смещения к периферии эффективно анализируются одними и теми же операторами;
- трансформация скорости корковой проекции подвижного объекта создает благоприятные условия для регистрации движения, а также расширяет зону контроля за возмущающим действием при стабилизации сетчаточной проекции.
3. Предложен новый подход к проектированию систем технического зрения (СТЗ), заключающийся в в реализации преобразования НС-ОК. Рассмотрены пути практической реализации:
- показана возможность использования однородной фотоматрицы достаточно большого формата для имитации работы неоднородной сетчатки;
- разработана методика получения плоских зональных изображений малых (по сравнению с исходным) форматов при ступенчатой аппроксимации графика разрешающей способности имитированной неоднородной фотоматрицы;
- проведено компьютерное моделирование для СТЗ с фотомарицей 9 мегапикселей, разрешающей способностью 1 угл. мин. в центре поля зрения и зрительным углом 50 угл. градусов. Получено шестнадцатикратное сокращение массива обрабатываемых цифр;
- приведена блок-схема СТЗ, использующей метод НС-ОК, предназначенной для исследования алгоритмов анализа зональных изображений реальных сцен.
Полученные результаты выявили возможность и целесообразность применения преобразования НС-ОК в системах технического зрения для повышения эффективности их работы. Повышение эффективности заключается в значительном сокращении объема обрабатываемых данных и возможности применения однородных операторов для их обработки по всему полю зрения.
Библиография Гладилин, Сергей Александрович, диссертация по теме Теоретические основы информатики
1. Krebs W., Krebs I. "Quantitative morphology of the central fovea in the primate retina" // Amer. Journal Anatomy, V. 184. 1989, P.225-236.
2. Goodchild A. K., Ghosh K.K., Martin P.R. "Comparsion of Photoreceptor Spatial Density and ganglion Cell Morphology in the Retina of Human, Macaque Monkey, Cat, and the Marmoset Callithrix jacchus" // J. of Comparative Neurology, № 366, 1996, P. 55-75.
3. Wassle H., Boycott B. "Functional Architecture of the Mammalian Retina" // Psyological Reviews, V. 71, 2, 1991, p. 447-480.
4. Hurdal M.K., McElwain D. L. S. "Combining modalities to investigate cortical retinotopy" // Biomag 96: Proceedings of the Tenth International Conference on Biomagnetism, Vol. II, Springer-Verlag, New York., 2000, pp. 1138-1141.
5. Ahnelt P.K., Pum D. A low-frequency component in the foveal cone Mosaic. Invest. Ophthalm. Vis.Sci. 29,(Suppl.): 262.
6. Pum D., Ahnelt P.K., Grasl M. Iso-orientation areas in the human foveal cone mosaic., J.Visual Neurosc.5:511-523.
7. Ahnelt P.K. The photoreceptor mosaic. Eye 12, 531-540.
8. Ярбус A. JI. Роль движений глаз в процессе зрения. М.: Наука, 1965.
9. Loyd A. Jones, George С. Huggins "Photographic Granularity and Graininess" // Journal of the Optical Society of America, Vol 37, Number 4, April 1947.
10. Hilch J., Hylton R. The spatial resolution capacity of human fovea. // Vision Res. 24: 347-356, 1984.
11. Crook J.M., Lange-Malecki В., Lee B.B., Valberg A. Visual resolution of macaque retinal ganglion cells // J. Physiol. Lond. 396: 205-224, 1988.
12. Daniel P.M., Whitteridge D. The representation of the visual field on the cerebral cortex in monkey // J. Physiol., 1961, 159: 203-221.
13. Хьбелл Д. Глаз, мозг, зрение. М: Мир, 1990.
14. Wassle H.U., Grunert U., Ronrenbeck J., Boycott B.B. Cortical magnification factor and the ganglion cell density of the primate retina // Nature Lond., 341: 643-646, 1989.
15. Wassle H.U., Grunert U., Ronrenbeck J., Boycott B.B. Retinal ganglion cell density and cortical magnification factor in the primate // Vision Res. 30:1897-1911, 1990.
16. Cseland B.G., Harding Т.Н., Tulunay-Keesey U. Visual resolution and receptive field size: examination of two kinds of cat retinal ganglion cells. // Science Wash., DC 205: 1015-1017, 1979.
17. Duncan, R. O., Boynton, G. M. (2002) Cortical magnification factor in human primary visual cortex correlates with Vernier acuity thresholds // Journal of Vision, vol. 2, n. 7, p. 129a.
18. Ярбус A. JI. // Биофизика, 1975, т. 20, вып. 6, стр. 1099.
19. Steinman R.M., Haddad G.M., Skavenski A.A., Wyman D. "Miniature eye movment"// Science, vol. 181, pp. 810-819.
20. Horn B.K.P. VISMEM: A Bag of "Robotic" Formulae. // MIT AI Laboratory. Working Paper, 1972, Vol. 34, Dec.
21. Mapp Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов. Москва. Радио и связь, 1987.
22. Wilson H.R., Bergen J.R. A Four Mechanism Model for Threshold Spatial Vision//Vision Research, 1979, Vol. 19, pp. 19-32.
23. Harris M.G. The Perception of Moving Stimuli. A Model of Statiotemporal Coding in Human Vision. // Vision Research, 1986, Vol. 26, Iss. 8, pp. 1281-1287.
24. Лебедев Д.Г., Ракчеева T.A., Толстихина И.Ю. // Обработка и представление данных в человеко-машинных системах. М.: Наука, 1988. С.104.
25. Доронина Г.В., Лебедев Д.Г. «Компьютерное моделирование работы нейронной сети, выделяющей контуры на изображении» // Биофизика, 1996, т. 41, вып. 6, стр. 1317.
26. Лебедев Д.Г., Сафонов К. В. «Выделение контрастов на изображении зрительной системой с моносинаптической ON-, OFF-сетчаткой» // Сенсорные системы №3, 1998.
27. Ловецкий А.К. «Моделирование работы нейронной сети, выделяющей контрасты на изображении, в условиях слежения за движущимся объектом». // Дипломная работа. Механико-математический факультет МГУ, Москва, 1998.
28. Лебедев Д.Г., Баринова Н.Е. Моделирование работы дискретной сетчатки, выделяющей контуры изображения в центральной части и на периферии // Биофизика, 1989.
29. Лебедев Д.Г. Моделирование некоторых функция зрения человека // Биофизика, 1980, Т. 25, вып. 1, стр. 153-158.
30. Лебедев Д.Г. Анализ работы сетчатки, выделяющей контурный сигнал //Биофизика , 1981. Т. 26, вып. 5, стр. 860-863.
31. Юревич Е. И. Основы робототехники, СПб: БХВ-Петербург, 2005.
32. Хорн Б. Зрение роботов. Москва, «Мир», 1989.
33. Кий К.И., Климонтович А.В., Распоиин А.Н. Алгоритмы обработки телевизионного изображения и управления движением автономного транспортного робота по дороге // Многопроцессорные вычислительные структуры: Сб. науч. тр. Вып. XX Таганрог.: 1989. С. 56-59.
34. Кравков С. В. Глаз и его работа. M-JI: Издательство АН СССР, 1950.
35. Кугушев Е.И., Зуева Е.Ю. Поле видимых скоростей в зрительном анализе движения. Препринт ИМП АН СССР. 1987. № 68.
36. Кнут Д. Э. Искусство программирования. Том 3. Сортировка и поиск. «Вильяме», Москва Санкт-Петербург - Киев, 2000.
37. Математический энциклопедический словарь, М. «Большая Российская Энциклопедия», 1995.
38. Лебедев Д.С. Компьютерная модель сети карликовых нейронов в центральной сетчатке приматов // Сенсорные системы, 2003, том 17, №2, с. 91-106.
39. Schneeweis D.M., Schapf J.L. Photovoltages of rods and cones in the macaque retina // Science. 1995. V 268. P. 1053-1056.
40. Гладилин C.A. «Компьютерная модель зрительной системы с кортикальным усилением» // Информационные процессы, , Т. 5, № 5, 2005. С.414-425.
41. Kuffler S.W. 1953, Disharge patterns and functional organization of mammalian retina. J. Neurophysiol. 16, 37-68.
42. Hartline H.K. "Receptor mechanisms and integrations of sensory information in the eye" // Rev. mod. physics, 1959, 31, p. 515.
43. Ditchburn R.W. Eye-movements and visual perception. Clarendon Press. Oxford, 1973.
44. Лебедев Д.Г., Ловецкий А.К., Модель нейронной сети, использующей микродвижения глаз для выделения контрастов на изображении // Биофизика, 2004, том 49, вып. 4, стр.760-765.
45. Гладилин С.А., Лебедев Д.Г. «Нейронная сеть, воспроизводящая выходной сигнал ганглиозной клетки» // Информационные процессы, Т. 5, № 3, 2005, стр. 258-264.
46. Позин Н.В. Моделирование нейронных структур, Москва, «Наука», 1970.
47. Д. Г. Лебедев, Д.С. Лебедев «Дискретизация изображений посредством выделения и квантования контуров». Известия Академии Наук СССР. Техническая кибернетика. Москва, 1965.
48. Гладилин С.А., Лебедев Д.Г. «Бионические модели и системы технического зрения» // Информационные процессы, Т. 5, № 5, 2005. С. 426-431.
49. Пигарев И. Н. Интеллектуальные процессы и их моделирование. // Информационные сети. М: ИППИ, 1994. С. 97.
-
Похожие работы
- Математические модели линейных процессов рецепции и их технические приложения
- Повышение эффективности управления сложными техническими системами на основе анализа и синтеза нелинейных моделей
- Математические модели и комплексы программ оценки геодинамической устойчивости среды распределенных природно-технических систем
- Разработка метода идентификации математических моделей газотурбинных двигателей
- Математическое и алгоритмическое обеспечение систем управления видеокамерой беспилотных летательных аппаратов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность