автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Информационные модели многоуровневой обработки изображений
Автореферат диссертации по теме "Информационные модели многоуровневой обработки изображений"
Нижегородский государственный технический университет
На правах рукописи
АВЕРБУХ Михаил Леонидович
Информационные модели многоуровневой обработки изображений
Специальность 05.13.17- «Теоретические основы информатики»
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Нижний Новгород 2004
Работа выполнена на кафедре «Вычислительная техника» Нижегородского государственного технического университета (НГТУ)
Научный руководитель:
доктор технических наук, профессор УТРОБИН ВА.
Официальные оппоненты:
- доктор технических наук, профессор, чл.-корр. РАИН, зав. кафедрой теории цепей и телекоммуникаций Нижегородского государственного технического университета КРЫЛОВ В.В.
- кандидат технических наук, доцент ХРАНИЛОВ В.П.
Ведущая организация:
ФГУП «Буревестник»
Защита состоится «_»_2004 г. в_часов
на заседании диссертационного совета № Д 212.165.05
при Нижегородском государственном техническом университете
по адресу 603600, г. Нижний Новгород, ГСП-41, ул. Минина, 24, НГТУ.
С диссертацией можно ознакомиться в библиотеке Нижегородского государственного технического университета.
Автореферат разослан «_»_2004 г.
Ученый секретарь диссертационного совета
кандидат технических наук
А.П. Иванов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Одной из фундаментальных проблем современности является проблема зрительного восприятия. Возникнув очень давно, она является актуальной и в настоящее время, ибо изображение является естественным средством взаимодействия человека и окружающего его мира; изображение является естественным средством общения человека и машины в любых системах обработки, анализа и контроля.
Вопросы обработки, анализа и распознавания изображений получили фундаментальное развитие в работах научных коллективах Вычислительного центра РАН, Института проблем передачи информации РАН, Института систем обработки изображений РАН, Института прикладной математики и кибернетики при Нижегородском госуниверситете и др. Значительный вклад в решение проблемы распознавания изображений внесли М.А. Айзерман, Э.М. Браверман, В.Н. Вапник, Ю.Г. Васин, А.И. Галушкин, А.Л. Горелик, И.Б. Гуревич, Р. Дуда, Ю.И. Журавлев, Н.Г. Загоруйко, В.В. Кондратьев, Д. Марр, М. Минский, Ю.И. Неймарк, С. Пейперт, К.В. Рудаков, Ф. Розенблатт, А. Розенфельд, В.А. Сойфер, В.А. Утробин, Р. Фишер, К. Фу, П. Харт, М.И. Шлезингер и другие российские и зарубежные ученые.
Развитие современных средств компьютерной техники и информационных технологий способствует широкому внедрению в практику систем автомагической обработки изображений.
Одной из актуальных проблем, стоящей перед разработчиками таких систем является узнавание предъявляемом изображении априори известных эталонных образов, особенно при высоком уровне шума в анализируемом изображении и в реальном масштабе времени. Именно невозможность успешно функционировать при наличии высокого уровня шума в изображениях ограничивает возможности использования существующих в настоящее время систем автоматической обработки изображений.
Другой не менее актуальной проблемой является координатное описание анализируемой информации, под которым понимается соответствие систем координат различных уровней представления данных. В широком смысле координатное соответствие есть взаимно-однозначная связь объекта изображения на множестве уровней разложения на пирамиде описания и принятия решений. В узком смысле - соответствие объекта и его эталона на /-ом уровне разложения. Возникновение этой проблемы связано с необходимостью обработки изображений в условиях априорной неопределенности их системы координат. Несоответствие системы координат исходного изображения с системами координат эталонных образов, хранящихся в памяти, приводит к невозможности обработки таких изображений. Поэтому, в настоящее время, актуальна задача совмещения систем координат исходного изображения и эталонных образов. Данная задача особо проблематична в системах обработки изображений, функционирующих в реальном масштабе времени, так как большинство существующих методов совмещения координатных систем при обработке изображений требуют значительных вычислительных затрат.
Цель работы
Целью работы является разработка информационной модели многоуровневой обработки изображений.
На защиту выносятся:
1. Информационная модель пирамидальной координатной системы в представлении на плоскость.
2. Информационная модель определения взаимного расположения объектов на разных у р разложения использованием ^ пирамидальной т н о й
ЬМБЛНОТеКА I
3. Информационная модель определения взаимного расположения объектов на одном уровне разложения с использованием пирамидальной координатной системы.
4. Процедуры установления координатного соответствия между различными изображениями через рассмотрение всех случаев изоморфных преобразований исходного изображения.
5. Информационная модель уровня страницы текста при многоуровневой обработке изображений.
6. Информационная модель уровня строк и букв при многоуровневой обработке изображений.
Методы исследования
Работа базируется на методах распознавания образов, теории активного восприятия, системного анализа, математического моделирования, анализа и синтеза изображений, теории групп и теории вычислительных систем.
Научная новизна
Научная новизна работы состоит в следующем:
1. Решена задача построения пирамидальной координатной системы в представлении на плоскость.
2. Разработана информационная модель определения взаимного расположения объектов на разных уровнях разложения с использованием пирамидальной координатной системы.
3. Разработана информационная модель определения взаимного расположения объектов на одном уровне разложения с использованием пирамидальной координатной системы.
4. Решена задача установления координатного соответствия между различными изображениями на множестве изоморфных преобразований исходного изображения и выработаны меры по их устранению с целью совмещения систем координат исходного и эталонного изображений.
5. Разработана информационная модель уровня страницы текста и уровня строк и букв при многоуровневой обработке изображений.
6. Разработана информационная модель обработки изображений объектов при их частичном стирании.
Практическая ценность
На базе разработанных информационных моделей и методик решены следующие прикладные задачи:
1. Разработаны процедуры определения взаимного расположения объектов изображения как на одном, так и на разных уровнях разложения с использованием пирамидальной координатной системы.
2. Разработаны алгоритмы подавления искажений, возникающих ввиду воздействия на анализируемое изображение всех видов изоморфных преобразований.
3. Разработана процедура формирования гипотез в процессе узнавания частично стертых изображений объектов.
4. Разработаны алгоритмы анализа изображений, содержащих текстовую информацию.
5. Разработаны алгоритмы узнавания изображений на произвольных шумах в реальном масштабе времени.
6. Разработана процедура формирования гипотез о результатах узнавания на ранних стадиях процесса узнавания.
Реализация результатов работы
Результаты исследований по многоуровневой обработке изображений реализованы в программном продукте НИР «Теоретические исследования и машинное моделирование процессов узнавания изображений на произвольных шумах», финансируемых по программе РФФИ (проекты №01-01-00452, №01-01-00459), а также в учебном процессе Нижегородского государственного технического университета.
Апробация работы
Основные положения диссертационной работы были апробированы на б научных конференциях:
- Научно-техническая конференция факультета информационных систем и технологий (Нижний Новгород, 1999);
- Всероссийская научно-техническая конференция ИСТ-2001 (Нижний Новгород, 2001);
- Региональный молодежный научно-технический форум «Будущее технической науки Нижегородского региона» (Нижний Новгород, 2002);
- Всероссийская научно-техническая конференция ИСТ-2002 (Нижний Новгород, 2002);
- Всероссийская научно-техническая конференция ИСТ-2003 (Нижний Новгород, 2003);
- II Региональная молодежная научно-техническая конференция «Будущее технической науки Нижегородского региона» (Нижний Новгород, 2003).
Публикации
По материалам диссертации опубликовано 11 научных работ, в том числе 5 ста1ей. Структура и объем диссертации
Основной текст диссертации состоит из введения, пяти глав, заключения, библиографического списка и приложения, содержит 147 страниц машинописного текста, 82 рисунка, 16 таблиц и библиографию из 130 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Во введении рассматривается актуальность, цель и задачи исследований, научная новизна и практическая ценность результатов диссертационной работы, апробация работы, публикации, объем и структура диссертации.
В первой главе проводится аналитический обзор состояния проблемы узнавания, в ней приводятся общие положения принципов обработки изображений, активного восприятия, пирамидальной обработки визуальной информации, изложены основные положения теории активного восприятия. По результатам анализа поставлена цели и задачи, подлежащие решению.
Вторая глава посвящена разработке информационной модели пирамидальной координатной системы в представлении на плоскость.
В любых алгоритмах, разработанных на базе теории активного восприятия, будь то алгоритмы узнавания, сегментации и др., геометрическим элементом является та или иная подобласть изображения, которая лишь на последнем уровне разложения представляет собой пиксель исходного изображения. Обычные координатные системы на плоскости (прямоугольная, радиальная и т.д.) наделяют любую точку координатами, и таким образом не могут отразить специфики работы с изображениями в рамках теории активного восприятия. Поэтому вычисления, необходимые для определения взаимного расположения подобластей получаются достаточно громоздкими, особенно с учетом различных комбинаций. Таким образом, координатная система, которая была бы удобна с точки зрения использования в алгоритмах, основывающихся на базе теории активного восприятия, должна
оперировать не с понятием математической точки, а с понятием подобласти изображения, представленной точкой, имеющей визуальную массу подобласти.
Разложение изображения в соответствии с теорией активного восприятия происходит в виде пирамиды: сначала система фильтров Л/ (рис. 1) накладывается на все изображение, затем, изображение делится на 16 частей, и на каждую из них опять накладывается система фильтров (рис. 2).
Рис. 2.
Таким образом, в пространстве изображения на каждом уровне образуется множество подобластей изображения, на которые накладываются фильтры. Это множество назовем картой изображения на данном уровне. Тогда множество карт на множестве уровней есть атлас изображения.
На основе данного принципа построим систему координат следующим образом:
1. Так как на первом уровне карта изображения состоит только из одной области, то любая подобласть изображения на любом уровне будет относиться к этой области (лежать внутри), поэтому для обозначения координаты области карты первого уровня будем использовать пустую последовательность координат (0) (цепочку координат нулевой длины).
2. Карта второго уровня содержит 16 подобластей, таким образом, для обозначения координат подобластей этого уровня будем использовать в качестве координаты номер подобласти (п) (пока порядок нумерации подобластей не важен).
3. Карта третьего уровня содержит 16 16 = 256 подобластей, и в качестве координат этих подобластей будем использовать координату с карты предыдущего уровня и номер подобласти внутри подобласти предыдущего уровня. Таким образом, на этом уровне у нас будет по 16 подобластей имеющие одинаковые номера, но сочетание координаты на карте предыдущего уровня с номером подобласти этой карты будет уникальными. Получившиеся координаты будем записывать следующим образом: (п, m).
4. Карты последующих уровней будут содержать все большее число подобластей, но в сочетании с координатами на карте предыдущего уровня, будем иметь разбиение каждой подобласти карты предыдущего уровня на 16 подобластей, которые необходимо пронумеровать и этот номер добавить в качестве еще одной координаты к координатам карты предыдущего уровня. Таким образом, число координат в цепочке координат будет на одно меньше чем номер уровня карты, к которой относится данная подобласть.
В результате в целом получили координатное дерево, на котором можно задать координатные цепочки (пути). Это координатное дерево, соответственно, будет обладать следующими особенностями: во-первых, длина цепочки напрямую зависит от количества рассматриваемых уровней разложения; во-вторых, точность указания подобласти соответствует точности сегментации, узнавания и т.д. на данном уровне разложения. Но наиболее важной особенностью такой координатной системы является то, что для случая, когда один объект является частью другого, координатная цепочка меньшего объекта (рассматриваемого на карте более поздних уровня) будет состоять из координатной цепочки большего объекта (рассматриваемого на карте более раннего уровня) и «окончания» цепочки, которое в свою очередь будет указывать где внутри большего объекта находится меньший. Полученное координатное дерево отражает структуру пирамидальное координатной системы, моделирующей атлас карт в представлении на плоскость.
Таким образом, для определения нахождения одного объекта внутри другого, необходимо выполнить сравнение цепочек их координат и определить содержит ли более длинная из них более короткую.
Другими словами, использование рассматриваемой координатной системы в алгоритмах, построенных на базе теории активного восприятия, позволяет решить задачу стратегии восприятия с точки зрения определения подобластей интереса и взаимного расположения объектов на изображении, относящихся к разным уровням разложения изображения.
Рассмотрим теперь нумерацию 16 элементов планигона на каждом из уровней разложения изображения, т.е. соответствие между элементами координатной цепочки и 16 частями планигона. Введем на планигоне двоичную нумерацию подобластей, напоминающую рефлексный двоичный код, представленную на рис. 3.
01002 4,о 01102 6,0 11102 14,0 11002 12,о
01012 5 ю 01И2 7,о 11112 15,о 11012 13,о
00012 110 00112 3,о 10И2 П|0 10012 9,0
00002 0,о 00102 2,о 10102 Ю,о 10002 8,0
Рис. 3.
Подобно коду Грея, такая нумерация обладает тем свойством, что соседние элементы отличаются только одним разрядом, причем с учетом гладкой склейки. Это позволяет достаточно просто находить 45- и 85-связные области изображения.
Две подобласти изображения являются 45-связными, если они имеют общую сторону. Если речь идет о 45-связности с учетом гладкой склейки, то это означает, что самый левый и самый правый столбцы планигона, а также самая верхняя и самая нижняя строка планигона являются соседними, т.е. имеют общую сторону.
Необходимым и достаточным условием 45-связности с учетом гладкой склейки является различие в номерах подобластей планигона только в одном двоичном разряде. Для случая же определения 45-связности без учета гладкой склейки, необходимо выполнить соответствующую дополнительную проверку.
Две подобласти изображения являются 85-связными, если они имеют хотя бы одну общую вершину. Как и в случае 45-связности, если речь идет о 85-связности с учетом гладкой склейки, то это означает, что самый левый и самый правый столбцы планигона, а также самая верхняя и самая нижняя строка планигона являются соседними, т.е. имеют общую сторону, а, следовательно, и вершину.
Необходимым и достаточным условием 85-связности с учетом гладкой склейки является различие в номерах подобластей планигона только в одном или только в двух подряд идущих двоичных разрядах, считая первый и последний разряды соседними. Для случая же определения 85-связности без учета гладкой склейки, необходимо выполнить соответствующую дополнительную проверку.
Каждый двоичный разряд получающейся цепочки определяет принадлежность подобласти к той или иной половине всей рассматриваемой области, постепенно сужая размеры этой подобласти, при необходимости, вплоть до пикселя исходного изображения. Первый из четырех двоичных разрядов (рис. 3) определяет принадлежность подобласти левой или правой частям планигона, а второй разряд - верхней или нижней части планигона. А затем, для следующих двух разрядов наблюдается рефлексность направлений, своя для каждого из 4 углов планигона.
В третьей главе решается задача установления координатного соответствия между различными изображениями через рассмотрение всех случаев изоморфных преобразований исходного изображения и выработки меры по их устранению с целью совмещения систем координат исходного и эталонного изображений.
В параграфе 3.1 рассматривается постановка задачи установления координатного соответствия между различными изображениями, описывается формальная модель преобразований на плоскости. Задача установления координатного соответствия разбивается на 3 подзадачи:
1. Координатное совмещение при параллельном переносе.
2. Координатное совмещение при повороте.
3. Координатное совмещение при изменении масштаба.
Выбор этих трех частных случаев определяется двумя обстоятельствами:
1. Каждое из приведенных выше преобразований имеет простой и наглядный геометрический смысл.
2. Согласно аналитической геометрии, любое преобразование, связанное с изменением системы координат всегда можно представить как последовательное исполнение (суперпозицию) простейших преобразований типа параллельного переноса, поворота и изменения масштаба (или части этих преобразований).
Параграф 3.2 посвящен разработке информационной модели компенсации параллельного переноса. В качестве способа компенсации параллельного переноса распознаваемого изображения относительно эталонного изображения, используется система координат, начало которой приходится на центр тяжести изображения.
Так как, в нашем случае, начало системы координат соответствует центру рецепторного поля - центру анализируемой области изображения, то совмещением начала координат с центром тяжести изображения является центрирование изображения. Центрирование изображения достигается путем анализа значений компонентов вектора разложения на фильтрах в соответствии с теорией активного восприятия.
По знаку и определяется направление перемещения рецепторного поля, а по абсолютным величинам значений и - мера центрирования.
Отрицательные значения Ц1 и Ц2 означают необходимость перемещения изображения соответственно вправо и вверх, либо перемещения рецепторного ноля соответственно влево и вниз. Аналогично, положительные значения и Цг означают необходимость перемещения изображения соответственно влево и вниз, либо перемещения рецепторного поля соответственно вправо и вверх. Процесс завершается при нулевых значениях и либо при смене их знака на противоположный. Во втором случае выбирается то положение, которое соответствует максимальным абсолютным значениям и
Таким образом, центрирование изображения происходит за несколько шагов. На каждом шаге вычисляются компоненты вектора разложения изображения а по
ним вычисляются необходимые смещения анализируемой области и относительно предыдущего шага. В результате алгоритм центрирования имеет следующий вид:
(1)
(2)
•Л* о
• //, < 0, Сх, < С*,.!
сИл!'
Лх0 = я, .
д*,=
-Л*,
(-1
,если Ддг,_| • ,если Дху_| ■ ,если Дх,.) •
(3)
Ay0=Signp2, Sign М2
АУ,=
где
О
"АУы
.если Д>'у_, -Мг < Су, Сум' ,если Дум-¡лг < 0, Су: < Су,-.,
1 ,еслих>0 Sign(x) = ■ -1 ,если х<0' О ,если х = О
Условие завершения процесса центрирования:
(4)
(5)
(6)
(7)
В параграфе 3.3 разрабатывается информационная модель компенсации поворота. Приводятся методы компенсации поворота на углы кратные 90° и определения поворота на углы некратные 90°.
Отследить поворот анализируемого изображения относительно эталонного представляется возможным путем вращения рецепторного поля. Однако, на практике возможность получения одного и того же изображения под разными углами встречается редко. Для решения этой проблемы возможно применение стандартных цифровых методов поворота изображения, однако их применение связано со значительным вычислительными затратами.
Более эффективный способ заключается во вращении самой системы фильтров. В случае поворота системы фильтров на 90°, каждый фильтр следует повернуть на рассматриваемый угол относительно центра фильтра. Полученный в результате такого поворота фильтр может совпадать с исходным фильтром, а может измениться (рис. 4). Однако, в любом случае, полученный в результате вращения фильтр будет совпадать с одним из фильтров системы с точностью до знака (инверсии). Аналогичная ситуация возникает и в случае поворота системы фильтров на 180° и 270°.
Таким образом, для получения результатов разложения некоторого изображения, повернутого на угол кратный 90° относительно исходного изображения, достаточно иметь результаты разложения исходного изображения, а затем выполнить пересчет в соответствии с таблицей 1. Другими словами, о повороте распознаваемого изображения относительно эталонного изображения на углы кратные 90° можно судить по узнаванию в изображении повернутого эталонного изображения, либо по узнаванию в повернутом изображении эталонного.
Таблица!.
Компонент вектора разложения Поворот против часовой стрелки
90° 180° 270°
Mo Цо к> Цо
m Ц2 -щ "Ц2
Ц2 -И! -Ц2 ш
Из •Из Цз -цз
Ц4 Ц5 Ц4 Ц5
Ц5 Ц4 Ц5 Ц4
И« -Ц7 -Цб Ц7
Ц7 Цб "Ц7 -ш
Ц8 Ц8 Ця Ц8
Ц<> Цю -Ц» -Цю
ЦЮ -Ц9 -Цю Ц9
ЦП -Ц|2 ЦП -Ц12
Й12 -Ни Ш2 -ЦП
ЦП Ц|4 -Ц|з -Ц14
Ц14 -Ц|3 -Ц|4 Шз
Р" -Ц|5 Ц15 -Ц|5
Рис. 4.
Поворот исходного изображения на произвольный угол а будем рассматривать как поворот на угол кратный 90° и поворот на острый угол [}:
а = 90" ■ п + р, (9)
где:
0°<(5<90°, (10)
Первая часть такого поворота уже рассмотрена. Теперь обратимся к повороту на острый угол р.
К сожалению, подход, связанный с поворотом системы фильтров на острый угол хотя и оказывается более эффективным по сравнению с поворотом самого анализируемого изображения, но все же требует слишком больших вычислительных затрат. Поэтому предпочтительнее следующий подход. Он основывается на том, что угол поворота можно изменять грубо, то есть в интервале от 0° до 90° рассматриваться только 2-3 значения углов, а возникающую при этом погрешность следует относить к неизбежным шумам. Что касается указанных значений поворота, то эталонные изображения повернутые на эти углы следует при таком подходе хранить вместе с «неповернутыми» эталонными изображениями, причем только в том случае, если соответствующие изображения не могут быть узнаны на «неповернутом» эталонном изображении. При необходимости для отдельных знаков количество рассматриваемых углов может быть увеличено с целью увеличения точности определения угла или увеличения надежности узнавания.
В параграфе 3.4 рассматривается информационная модель компенсации изменения масштаба. К таким преобразованиям изображения относятся не только растяжение и сжатие изображения, но и зеркальные отражения изображения относительно осей координат (при отрицательном коэффициенте масштабирования).
Вариант зеркального отражения относительно осей координат во многом схож со случаем поворота на угол кратный 90°. Здесь применим тот же способ компенсации такого вида искажений.
Существует три варианта зеркального отражения: относительно оси «X», относительно оси и относительно обоих осей.
Для каждого из этих трех случаев, следует зеркально отразить фильтры относительно соответствующих осей. Как и в случае поворота системы фильтров на углы кратные 90°, полученный в результате такого зеркального отражения фильтр может совпадать с исходным фильтром, а может измениться. Однако, как и в случае поворота, полученный в результате вращения фильтр будет совпадать с одним из фильтров системы с точностью до знака (инверсии). Кроме того, в случае зеркального отражения, в отличие от поворота, изменяться может только знак компонента вектора разложения, а позиция компонента остается неизменной.
Пересчет компонентов вектора разложения изображения на системе фильтров, применяемых в теории активного восприятия, следует в этом случае выполнять в соответствии с таблицей 2.
Таблица 2.
Компонент вектора разложения Зеркальное отражение
Относительно оси «У» Относительно оси «X» Относительно осей «X» и «У»
Цо МО НО Но
т -Ц!
И2 И2 -Ц2
Из -из -Из Из
Щ Ц4 И4 Ш
Ц5 И5 И5 И5
И« Мб -м« -м«
V -Ц7 и -Й7
Компонент вектора разложения Зеркальное отражение
Относительно оси «У» Относительно оси «X» Относительно осей «X» и «Y»
Hs Н» Н8 Не
Н9 -Ц9 Н9
М-ю Ню -Ню
Ни -Мм -Нп Ни
Hl2 -Й12 -Ш2 Hl2
Ни -Ни Н13 -Ни
Hl4 Ни "Ни -Ни
His -р,5 -Н15 Н.5
В качестве критерия меры по устранению растяжения или сжатия изображения возможно использование не абсолютных значений компонентов вектора разложения, а относительных. При этом вместо величин ц, используются величины цД1о- Такой подход позволяет компенсировать увеличение или уменьшение компонентов вектора разложения, которые происходят за счет изменения количества точек изображения при растяжении и сжатии. Отношение ^Цо имеет смысл критерия инвариантности.
В четвертой главе разрабатывается информационная модель уровня страницы текста при многоуровневой обработке изображений: на примере уровня страницы текста рассматриваются модели определения расположения и ориентации страницы текста. Разрабатывается информационная модель уровня строк и букв при многоуровневой обработке изображений. В том числе разрабатывается модель работы с объектами, подвергшимися частичному стиранию, например в результате грубой сегментации.
Под текстовой информацией понимаются страницы текста, состоящие из упорядоченного набора строк текста, которые в свою очередь могут быть разделены на слова и буквы. В случае присутствия на анализируемом изображении других объектов (например, рисунков), они относятся к шуму.
В параграфе 4.2 разрабатывается информационная модель уровня страницы текста при многоуровневой обработке изображений. Под определением ориентации объекта понимается определение месторасположения объекта и выявление взаимосвязи между направлениями осей условной координатной системы объекта и абсолютной координатной системой, привязанной к плоскости объекта. Задача определения месторасположения объекта сводится к разделению объекта и фона на изображении. При рассмотрении заной задачи с позиций теории активного восприятия, на каждом уровне -пирамиды, необходимо определить месторасположение объекта с точностью до «клетки» планигона, т.е. с точностью до % от высоты и ширины участка изображения, на который накладываются фильтры. При этом по мере увеличения уровня разложения на -пирамиде точность будет увеличиваться вплоть до пикселя изображения (на последнем уровне).
В качестве критерия границ объекта выберем максимальный перепад сумм яркостей по «столбцам» (для левой и правой границ) планигона и «строкам» планигона (для верхней и нижней границ). Например, для определения левой границы изображения страницы текста (рис. 5) находим максимальный перепад в сторону увеличения суммарной яркости «столбцов» планигона. Аналогично для определения правой границы находим максимальный перепад в сторону
Рис. 5.
уменьшения суммарной яркости. Номера переходов изображены на
рис. 6. 2____
При переходе на следующий уровень рассматривается область вокруг перехода, имеющая в два раза меньший размер (исходя из
точности), чем на предыдущем уровне. Значения перепадов сумм 1----
яркостей (для горизонтальных переходов) и (для
вертикальных переходов) могут быть вычислены на основании 0 12 3 4
компонентов вектора разложения полученных на -пирамиде, Рис. 6.
следующим образом:
№о=(Ц9+Й>-Ц1"Ц4)М, (Щ
Й54=(Ц9-Ц|)/2-Я5О, (15)
^0=(Ц10+Ц0-Ц2-Ц5)М, (16)
Причем формулы (11), (15), (16) и (20) используются только для первого уровня разложения, т. к. границы объекта в соответствующих переходах могут быть только на этом уровне, а на последующих уровнях лишь на переходах 1, 2 и 3.
Таким образом, алгоритм нахождения границ объекта можно сформулировать следующим образом
1. Раскладываем изображение на Q-пирамидс, вычисляем значения компонентов вектора разложения ц,.
2. Вычисляем значения №/и КУ/ (/ = 0 - 4) по формулам (11)-(20).
3. Определяем номера переходов (/), соответствующие максимальным и минимальным значениям Н31 и (| = 0 - 4).
4. Определяем уточненные границы изображения в соответствии с полученными номерами переходов.
5. Раскладываем части изображения, лежащие «вокруг» уточненных границ изображения (левой, правой, верхней и нижней границ), на Q-пирамиде, вычисляем значения компонентов вектора разложения для этих частей изображения. Например, если мы определили на предыдущем шаге, что левая граница соответствует переходу «1», то, на этом шаге, разложению на Q-пирамиде подлежит участок изображения, находящийся между переходом «0» и переходом «2» В результате получаем 4 различных вектора соответствующие соответственно левой, правой, верхней и нижней границам объекта (на этом уровне разложения).
6. Для каждой из уточняемых границ (левой, правой, верхней и нижней), на основе полученных векторов {ц,}, по формулам (12) - (14) и (17) - (19) вычисляем значения Н$, и И, (/ = 1 - 3).
7. Определяем номера переходов (|), соответствующие максимальным и минимальным значениям /й, и (/' = 1 - 3).
8 Переходим снова к шагу 4.
Процесс прекращается при достижении заданной точности определения границ, при этом на каждой итерации (шаги 4-8), мы повышаем точность нахождения границ в 2 раза. Таким образом, возможно нахождение границ объекта с необходимой точностью (вплоть до пикселя исходного изображения)
Задача выявления взаимосвязи между направлениями осей координатной системы объекта и абсолютной координатной системой сводится к определению угла поворота между двумя прямоугольными системами координат на плоскости: условной системой координат самого объекта и абсолютной системой координат плоскости объекта; а также к определению возможного зеркального отражения осей координат, возникающего, например, в случае получения изображения с прозрачной пленки, если ее положили «другой» стороной.
Для определения угла поворота условной системы координат объекта относительно абсолютной системы координат необходимо иметь как «правильно ориентированный» эталонный образ объекта, так и его «повернутые» образы. Определение угла поворота в этом случае выполняется за счет узнавания в анализируемом изображении «повернутого» эталонного образа. Этот же подход используется для определения зеркального отражения осей координат.
При наличии таких «повернутых» эталонных образов определение угла поворота выполняется путем узнавания в анализируемом изображении «повернутого» эталонного образа. При этом вместе с самим эталонным образом (в виде результатов разложения на Ц-пирамиде) должна храниться и информация относительно величины угла поворота. Для случая уровня страницы текста это означает необходимость хранения образов прямоугольника, повернутого на различные углы.
Для случаев, когда угол поворота - прямой или когда мы имеем дело с зеркальным отражением, в целях уменьшения необходимых ресурсов, компоненты векторов разложения «повернутых» эталонных изображений можно не хранить в памяти, т. к. их легко вычислить на основе компонентов векторов разложения «правильно ориентированного» эталонного изображения. В этих случаях достаточно пересчитать соответствующие компоненты вектора разложения. Такой подход возможен благодаря особенности фильтров, используемых в теории активного восприятия.
Для определения поворота на острые углы, соответствующие эталонные образы приходится хранить в памяти. При этом обычно достаточно хранить только один уровень разложения (16 значений поэтому это не оказывает значительного влияния на необходимый объем ресурсов.
Количество «повернутых» образов зависит от требуемой точности определения угла наклона. Если определение ориентации объекта изображения необходимо для его последующего узнавания с помощью алгоритмов, базирующихся на теории активного восприятия, то, как правило, достаточно определять угол с точностью не более 15°. Поворот на углы большие 90° рассматривается как поворот на уже рассмотренный прямой угол и последующий поворот на так же рассмотренный острый угол.
Параграф 4.3 посвящен разработке информационной модели выделения на странице текста строк и букв.
Для выделения строк можно использовать сканирующее перемещение анализируемой области сверху вниз и вычисления на каждом шаге перемещения компонента вектора разложения (12' На рис. 7 представлен пример текста, а на рис 8 -фрагмент графика изменения компонента . Как видно из графика, координатам, соответствующим началу и концу строк в
вертикальном направлении соответствуют всплески значений на графике.
Однако в данном, случае существует одна сложность:. наибольшие всплески на графике соответствуют не началу и концу всей строки в вертикальном направлении, а лишь основной ее части, не включающей верхние части заглавных букв, а так же букв, имеющих, так называемые «надстрочные» и «подстрочные» части, если, конечно, такие символы не
У лукоморья дуб зеленый. Златая цепь на дубе том. И днем и ночью кот ученый Все ходит по цепи кругом; * Идет направо - песнь заводит, На чево - сказку говорит
Рис. 7.
составляют большинство символов строки. Решением данной проблемы является рассмотрение случая частичного стирания изображения, т.е. возможности узнавания символов с отсутствующими частями. Для этого в состав эталонных образов должны быть включены «урезанные» таким образом изображения букв, и этим эталонам должны быть поставлены в соответствие соответствующие гипотезы о результате узнавания, а так же направления изменения анализируемой области изображения для выполнения проверки выработанной гипотезы. Процесс проверки гипотезы, таким образом, сводится к расширению анализируемой области изображения в определенном направлении (или нескольких направлениях), заложенном в эталонном образе, с которым, согласно выработанной ранее гипотезе, произошла ассоциация анализируемого изображения и последующему сравнению, в соответствии с используемой системой признаков, расширенной области изображения с эталонными образами, что, в конечном итоге, может привести к формированию новой, более вероятной гипотезы о результате узнавания.
asno паю йш оооао
4SOOO
«ооо 31000 ЗОЮ МОП
за ооо 11000 10 ООО • ООО
-ЗОЮ
-маю
-II осп
-30 ООО
•29 ООО
-за ооо
-40 000
•4S0DO
46 ООО
40 ООО
а ю х lo «о в ао п ао ао 1оо но 1зо IX но ш ioo iñ iod 100 эоо
Рис. 8.
Таким образом, узнавание изображение может приводить к появлению целого ряда конкурирующих гипотез о результате узнавания, после проверки которых, остается одна — наиболее вероятная.
Выделение в составе строки отдельных символов может проходить аналогично процессу выделения строк, с той лишь разницей, что сканирование происходит не в вертикальном, а в горизонтальном направлении, соответственно вместо компонента вектора разложения следует анализировать компонент
Рассмотрим подробно первую строчку текста (рис. 9) и график изменения значения компонента вектора разложения Ц) (рис. 10, для удобства сравнения с другими графиками, на этом графике изменен знак компонента на противоположный, т.е. фактически на рисунке представлен график изменения значения
.v лукомсюья nvo зеленый:
Рис. 9.
Рис 10
Отметим, что данный алгоритм работает и при значительном уровне шума на рис 11 представлено изображение с рис 7, но в данном случае на него был нанесен равномерный случайный шум, а на рис 12 представлен график изменения компонента вектора разложен [для этого изображения
Рис 11
Рис 12
Пятая глава посвящена практическому применению разработанных моделей.
В параграфе 5.1 рассматривается узнавание изображений на произвольных шумах. Разработка алгоритма узнавания основывается на выборе критерия поиска эталонного образа, соответствующего узнаваемому изображению, по результатам разложения узнаваемого изображения и эталонных образов на фильтрах в соответствии с теорией активного восприятия.
В качестве критерия поиска выбран минимум суммы квадратов отклонений соответствующих компонентов вектора разложения исходного и эталонного изображений на фильтрах, как квадрат расстояния между двумя точками в многомерном пространстве компонентов вектора разложения:
(21)
где:
Р) - у-ая компонента вектора разложения исходного (узнаваемого) изображения на фильтрах;
М,) - у-ая компонента вектора разложения (-того эталонного изображения на фильтрах.
Такой выбор обусловлен тем, что, во-первых, он достаточно нетребователен к вычислительным ресурсам, а во-вторых, результат узнавания зависит не столько от выбора критерия соответствия, сколько от системы эталонных образов.
Таким образом, нахождение эталонного образа, соответствующего узнаваемому изображению, сводится к отысканию наименьшего
Разложение изображения может производиться как на одном уровне пирамиды, например, на верхнем, когда используются только компоненты вектора разложения, полученные при наложении фильтров на все изображение, так и на нескольких уровнях пирамиды. Соответственно, при вычислении используются все компоненты вектора разложения, относящиеся к задействованным в расчете уровням.
Исследуем возможности данного алгоритма узнавания, разработанного на базе теории активного восприятия, по узнаванию изображений, подвергнутым различным изменениям. Для каждой из букв латинского алфавита, исходные изображения которых используются в качестве эталонов, получим максимальный уровень равномерного случайного шума при котором данная буква узнается без ошибок, причем узнавание будем проходить на различных уровнях разложения. Исходные (эталонные) изображения букв представлены на рисунке 13.
АВСОЕРСНи
кимморояз
ти\лд/хуг
Рис. 13.
Изображения этих же букв с нанесенным шумом, влияние которого заключается в инверсии исходного изображения, представлены на рисунках при узнавании на первом уровне разложения - на рисунке 14, на втором уровне - на рисунке 15, на третьем - на рисунке 16, на четвертом - на рисунке 17
Рис 16
Рис. 17.
Параграф 5.2 посвящен формирование гипотез в процессе узнавания при неполном переборе эталонных образов
Естественно, с увеличением номера уровня, на котором производится узнавание (для каждого следующего уровня количество компонентов векторов разложения ц, увеличивается в 16 раз), необходимого для узнавания при высоком уровне шума, а также с возрастанием количества эталонных образов увеличивается и время, необходимое на узнавание объекта. В конце концов, увеличением числа образов известных системе может привести к тому, что обработка изображения за приемлемое время будет невозможна. Выходом из сложившейся ситуации является формирование гипотез о результате узнавания на ранних этапах процесса узнавания, т. е. тогда, когда обработаны еще не все эталонные образы.
Предпосылкой к такому подходу служит тот факт, что вероятности появления различных объектов существенно отличаются Например, известно, что частота появления различных букв русского алфавита в среднем постоянна для любого теста на русском языке Это справедливо и для других языков, например для английского.
Если упорядочить эталонные образы букв русского по вероятностям их появления в тексте, начиная с наибольшей, и разбить алфавита на 4 группы по 8 букв, то вероятность того, что узнаваемая буква является одной из букв первой группа 58% (таблица 3)
Таблица 3
Буква Частота Буква Частота Буква Частота Буква Частота
0 11% В 4,6% Ы 1,9% X 1,1 %
Е 8,7% Л 4,2% 3 1,8% Ж 0,9%
А 7,5% К 3,4% Ь 1,7 % ю 0,7 %
И 7,5 % м 3,1 % Ъ 1,7% ш 0,7 %
Т 6,5 % д 3,0 % Б 1,7% И 0,5 %
Н 6,5% п 2,8% Г 1,6% Щ 0,4%
С 5,5% У 2,5 % Ч 1,5% э 0,3 %
Р 4,8% я 2,2 % Й 1,2 % ф 0,2 %
Исходя из этого можно сделать вывод, что в случае, если нам удастся упорядочить эталонные образы по частоте их появления, то, проанализировав лишь небольшую часть эталонных образов в процессе узнавания, мы можем получить гипотезу, вероятность которой будет достаточно велика, чтобы мы могли передать данный результат на обработку в другие блоки системы, работающие с результатами узнавания Возможно, проанализировав
следующую часть эталонных образов, нам придется откинуть прежнюю гипотезу, и мы выдвинем новую, которая будет иметь большую вероятность.
И хотя это не означает возможности не выполнять сравнение анализируемого изображения со всеми эталонными образами, но результаты этих сравнений лишь будут подтверждать уже выработанную гипотезу. Естественно, что такой подход имеет смысл в том случае, если блоки системы функционируют параллельно. Если же возможность параллельной работы различных блоков системы, выполняющей узнавание, отсутствует, такой подход можно применить для разбиения процесса узнавания на несколько этапов: на первом этапе происходит узнавание изображений с меньшей точностью, но за меньшее время; на втором этапе сомнительные, с точки зрения функциональной взаимосвязи, логики, лингвистики и т. д, результаты перепроверяются с учетом всего множества эталонных образов.
Кроме того, данный подход может оказаться полезен и в других случаях: если система не может предпочесть один из эталонных образов другому (суммы квадратов отклонений значений компонентов векторов разложения для этих образов равны), то, очевидно, выбор следует делать на том эталоне, частота появления которого больше; и напротив, если вся память, предназначенная для эталонных образов, исчерпана, то именно наименее часто встречающийся эталонный образ должен быть удален из памяти.
Для того чтобы реализовать такой принцип и упорядочить эталонные образы по частоте, достаточно воспользоваться некоторым аналогом «пузырьковой» сортировки: каждый раз, когда происходит узнавание некоторого образа, соответствующий эталонный образ перемещается на одну позицию к «началу» списка, увеличивая тем самым свою вероятность для системы. Этот процесс перемещения будет происходить постоянно, адаптируя систему эталонных образов к, изменению вероятностных характеристик обрабатываемых объектов. При этом, несмотря на постоянные перемещения в системе эталонных образов, в целом она будет отражать вероятностные закономерности обрабатываемой последовательности объектов изображения.
В параграфе 5.3 рассматривается задача определения ориентации объекта изображения с заданной точностью на примере определения ориентации изображения микросхемы.
В ряде задач необходимо определять месторасположение и ориентацию объекта изображения на плоскости с вполне определенной заданной точностью. Мы рассмотрим задачу определения
месторасположения и ориентации
изображения микросхемы (рис. 18) с точностью до пикселя исходного изображения, что позволит выбирать любую точность путем изменения разрешающей способности оптического датчика.
Для определения месторасположения и ориентации объекта с большой точностью, необходимо выбрать на изображении характерные точки, определить их месторасположение на изображении и по ним рассчитать месторасположение всего объекта
и его ориентацию. В качестве характерных Рис. 18.
точек изображения микросхемы удобно
выбрать углы корпуса микросхемы. В этом случае определив точное месторасположение даже одной такой характерной точки, мы можем с необходимой точностью определить сдвиг месторасположения микросхемы относительно ее места на электронной плате.
Определив точное месторасположение двух характерных точек мы можем определить угол наклона прямой, проходящей через эти две точки, и таким образом определить ориентацию данного объекта на изображении.
С целью повышения надежности определения месторасположения и ориентации объектов можно анализировать положение большего числа характерных точек на изображении. В нашем случае, можно определять точное расположение всех четырех углов микросхемы, и следовательно, увеличить надежность работы системы.
В соответствии с этой моделью, было разработано алгоритмическое программное обеспечение, определяющее положение (смещение) центра микросхемы и угол ее поворота относительно системы координат видеодатчика, с которого происходит получение изображение. На первом этапе выполняется анализ наличия микросхемы на изображении путем анализа значения компонента вектора разложения полученного в результате разложения всего изображения на фильтрах в соответствии с теорией активного восприятия, затем используя результат этого разложения происходит грубый анализ угла поворота изображения микросхемы и грубый анализ ее месторасположения в соответствии с алгоритмами изложенными в параграфах 3.2 и 3.3 диссертации. Использование такого грубого анализа позволяет существенно сократить размеры областей изображения, которые будут анализироваться на втором этапе работы, а следовательно сократить время полного цикла анализа. На втором этапе выполняется точное (с максимальной возможной точностью, т.е. с точностью до пикселя изображения) определение месторасположения выбранных характерных точек на изображении, путем применения алгоритма определения границ, изложенного в параграфе 4.2 диссертации. При этом подразумевается, что яркость ножек микросхемы значительно больше яркости корпуса микросхемы на изображении. На третьем этапе по известным координатам характерных точек изображения вычисляются координаты цента микросхемы на изображении и угол поворота микросхемы относительно системы координат изображения:
Р = ап* «У?-'/ (X, - Х2)) (34)
где (ХС) Ус) - координаты цента микросхемы, (X], У|) и (Хз, Уз) - координаты характерных точек, соответствующие противолежащим углам корпуса микросхемы, и (Хг, Уг) - координаты характерных точек, соответствующие углам корпуса микросхемы, имеющим общую сторону, р - угол поворота микросхемы относительно системы координат изображения.
Параграф 5.4 посвящен задаче определения номеров на железнодорожных вагонах, (рис. 19). В данном случае алгоритм работы программы был следующий:
1. Определение факта нахождения номера вагона в ожидаемом месте изображения (внизу, в центре): разложение части изображения, в которой ожидается появление номера, на Q-пирамиде, вычисление и анализ компонента вектора разложения Цц.
2. Уточнение области изображения, в которой находится номер: использование алгоритма определения границ, изложенного в параграфе 4.2 диссертации.
3. Сегментация номера на отдельные знаки номера: в данном случае априори известно, что номер восьмизначный, поэтому сегментация возможна простым разделением всей области номера на 8 равных по ширине частей. Если такой априорной информации нет, следует воспользоваться алгоритмом, изложенным в параграфе 4.3 диссертации.
4. Узнавание изображений отдельных знаков номера: использование алгоритма узнавания, изложенного в параграфе 5.1 диссертации.
5. Последовательное объединение результатов узнавания и вывод результата.
6. Переход к шагу 1.
Рис. 19.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Решена задача построения пирамидальной координатной системы в представлении на плоскость.
2. Разработана информационная модель определения взаимного расположения объектов на разных уровнях разложения с использованием пирамидальной координатной системы.
3. Разработана информационная модель определения взаимного расположения объектов на одном уровне разложения с использованием пирамидальной координатной системы.
4. Решена задача установления координатного соответствия между различными изображениями на множестве изоморфных преобразований исходного изображения и разработаны процедуры по их устранению с целью совмещения систем координат исходного и эталонного изображений.
5. Разработана информационная модель уровня страницы текста при многоуровневой обработке изображений, позволяющая определять расположение и ориентацию страницы текста.
6. Разработана информационная модель уровня строк и букв при многоуровневой обработке изображений, позволяющая выделять на изображении строки текста, в внутри строк - буквы.
6. Разработана информационная модель работы с объектами, подвергшимися частичному стиранию, например в результате грубой сегментации.
8. Разработано алгоритмическое программное обеспечение на основе выбранного критерия поиска эталонного образа, соответствующего узнаваемому изображению, базирующийся на системе признаков, соответствующих теории активного восприятия, доказывающее эффективность использования указанного критерия при построении систем узнавания изображений.
9. Разработано алгоритмическое программное обеспечение, позволяющее в реальном масштабе времени обрабатывать сложные изображения на фоне интенсивных помех.
10. Проведены экспериментальные исследования, результаты которых позволяют утверждать о высокой надежности узнавания даже при наличии значительных помех на изображении.
11. Предложена модель формирования гипотез в процессе узнавания при многоуровневой обработке изображений, позволяющая без значительного усложнения системы узнавания в целом эффективно накапливать и использовать опыт, основанный на существенных различиях в той частоте, с которой в реальных условиях встречаются те или иные образы в процессе узнавания.
Основные публикации по теме диссертации
1. Авербух М. Л. Алгоритм координатного совмещения эталонного и анализируемого изображений // Тез. докл. Всероссийской научно-техн. конф. «Информационные системы и технологии». - Н. Новгород, 2001, с. 147 - 149.
2. Авербух М. Л. Алгоритм узнавания символьных изображений на произвольных шумах // Тез. докл. научно-техн. конф. фак. информационных систем и технологий «ФИСТ - 99». - Н. Новгород, 1999, с. 81- 82.
3. Авербух М. Л. Информационная модель определения взаимного расположения объектов при многоуровневой обработке изображений // сб. «Труды НГТУ: Системы обработки информации и управления», том 35, - Н. Новгород, 2002, с. 48 -50.
4. Авербух М. Л. Информационная модель определения ориентации объекта изображения на плоскости // Межвуз. сб. науч. тр. «Системы обработки информации и управления», вып. 8, - Н. Новгород, 2001, с. 32 - 36.
5. Авербух М. Л. Информационная модель пирамидальной координатной системы на плоскости // Тез. докл. Всероссийской научно-техн. конф. «Информационные системы и технологии». - Н. Новгород, 2002, с. 161 -162.
6. Авербух М. Л. Информационная модель построения гипотез в процессе узнавания по части изображения // Тез. докл. 2-й региональной молодежной научно-техн. конф. «Будущее технической науки Нижегородского региона». - Н. Новгород, 2003, с. 3.
7. Авербух М. Л. Информационная модель узнавания частично загороженных и частично стертых изображений // Тез. докл. Всероссийской научно-техн. конф. «Информационные системы и технологии». - Н. Новгород, 2003, с. 141.
8. Авербух М. Л. Информационная модель формирования гипотез в процессе узнавания при многоуровневой обработке изображений // Межвуз. сб. науч. тр. «Системы обработки информации и управления», вып. 7, - Н. Новгород, 2001, с. 91-94.
9. Авербух М. Л. Информационные модели совмещения систем координат эталонного и анализируемого изображений // Межвуз. сб. науч. тр. «Системы обработки информации и управления», вып. 7, - Н. Новгород, 2001, с. 84 - 90.
10. Авербух М. Л. Исследование работы алгоритма узнавания символьных изображений на произвольных шумах // сб. «Труды НГТУ: Системы обработки информации и управления», том 37, - Н. Новгород, 2003, с. 31-38.
11. Авербух М. Л. Пирамидальная координатная система многоуровневой обработки изображений // Тез. докл. научно-техн. форума «Будущее технической науки Нижегородского региона». - Н. Новгород, 2002, с. 110.
Подписано в печать 05.05.04. Формат 60 х 84 '/16. Бумага офсетная. Печать офсетная. Уч.-изд. л. 1,0. Тираж 100 экз. Заказ 301.
Нижегородский государственный технический университет. Типография НГТУ. 603600, Нижний Новгород, ул. Минина, 24.
12 69 2 «
Оглавление автор диссертации — кандидата технических наук Авербух, Михаил Леонидович
ВВЕДЕНИЕ.
Актуальность темы.
Цель работы.
Задачи.
Методы исследования.
Научная новизна.
Практическая ценность.
Апробация работы.
Публикации.
Структура и объем диссертации.
ГЛАВА 1. Аналитический обзор.
1.1. Исходные положения.
1.1.1. Понятие изображения.
1.1.2. Активное восприятие.
1.1.3. Пирамидальная обработка визуальной информации.
1.2. Анализ состояния проблемы узнавания.
1.2.1. Зрительное восприятие человека и машинное зрение.
1.2.2. Проблема отыскания соответствия анализируемого и эталонных изображений.
1.3. Основные положения теории активного восприятия.
ГЛАВА 2. Информационная модель пирамидальной координатной системы в представлении на плоскость.
2.1. Постановка задачи.
2.2. Определение взаимного расположения объектов на разных уровнях разложения.
2.3. Определение взаимного расположения объектов на одном уровне разложения.
2.4. Выводы.
ГЛАВА 3. Координатное совмещение эталонного и анализируемого изображений.
3.1. Постановка задачи.
3.1.1. Формальная модель преобразований на плоскости.
3.2. Информационная модель компенсации параллельного переноса.
3.3. Информационная модель компенсации поворота.
3.3.1. Определение поворота на углы кратные 90°.
3.3.2. Грубое определение поворота на углы некратные 90°.
3.4. Информационная модель компенсации изменения масштаба.
3.4.1. Зеркальное отражение.
3.4.2. Деформации типа расширения и сжатия.
3.5. Выводы.
ГЛАВА 4. Информационная модель многоуровневой обработки на примере текста.
4.1. Постановка задачи.
4.2. Информационная модель уровня страницы текста при многоуровневой обработке изображений.
4.3. Информационная модель выделения на странице текста строк и букв.
4.4. Выводы.
ГЛАВА 5. Практические применения разработанных моделей.
5.1. Узнавание изображений на произвольных шумах.
5.2. Формирование гипотез в процессе узнавания (неполный перебор эталонных образов).
5.3. Определение ориентации объекта изображения с заданной точностью на примере определения ориентации изображения микросхемы.
5.4. Определение номеров на железнодорожных вагонах.
5.5. Выводы.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Авербух, Михаил Леонидович
Актуальность темы
Одной из фундаментальных проблем современности является проблема зрительного восприятия. Возникнув очень давно, она является актуальной и в настоящее время, ибо изображение является естественным средством взаимодействия человека и окружающего его мира; изображение является естественным средством общения человека и машины в любых системах обработки, анализа и контроля.
Вопросы обработки, анализа и распознавания изображений получили фундаментальное развитие в работах научных коллективах Вычислительного центра РАН, Института проблем передачи информации РАН, Института систем обработки изображений РАН, Института прикладной математики и кибернетики при Нижегородском госуниверситете и др. Значительный вклад в решение проблемы распознавания изображений внесли М.А. Айзерман, Э.М. Браверман, В.Н. Вапник, Ю.Г. Васин, А.И. Галушкин, A.J1. Горелик, И.Б. Гуревич, Р. Дуда, Ю.И. Журавлев, Н.Г. Загоруйко, Д. Марр, М. Минский, Ю.И. Неймарк, С. Пейперт, К.В. Рудаков, Ф. Розенблатт, А. Розенфельд, В.А. Сойфер, Р. Фишер, К. Фу, П. Харт, М.И. Шлезингер и другие российские и зарубежные ученые.
Развитие современных средств компьютерной техники и информационных технологий способствует широкому внедрению в практику систем автоматической обработки изображений.
Одной из актуальных проблем, стоящей перед разработчиками таких систем является узнавание в анализируемом изображении или его части известных системе эталонных образов, особенно при высоком уровне шума в анализируемом изображении и в реальном масштабе времени. Именно неспособность успешно функционировать при наличии высокого уровня шума в анализируемых изображениях наиболее ограничивает возможность использования существующих в настоящее время систем автоматической обработки изображений.
Другой актуальной проблемой является координатное описание анализируемой информации, под которым понимается соответствие систем координат различных уровней представления данных. В широком смысле координатное соответствие есть взаимно-однозначная связь объекта изображения на множестве уровней разложения на пирамиде описания и принятия решений. В узком смысле — соответствие объекта и его эталона на i-ом уровне разложения. Возникновение этой проблемы связано с необходимостью обработки изображений в условиях априорной неопределенности их системы координат. Несоответствие системы координат исходного изображения с системами координат эталонных образов, хранящихся в памяти, приводит к невозможности обработки таких изображений. Поэтому, в настоящее время актуально стоит задача совмещения систем координат исходного изображения и эталонных образов. Особенно остро эта задача стоит в случае необходимости работы системы в реальном масштабе времени, так как большинство существующих методов совмещения координатных систем при обработке изображений требуют значительных вычислительных затрат.
Цель работы
Целью данной работы является разработка информационной модели многоуровневой обработки изображений.
Задачи
Для достижения поставленной цели необходимо решить следующие задачи:
1. Решить задачу построения пирамидальной координатной системы в представлении на плоскость.
2. Разработать информационную модель определения взаимного расположения объектов на разных уровнях разложения с использованием пирамидальной координатной системы.
3. Разработать информационную модель определения взаимного расположения объектов на одном уровне разложения с использованием пирамидальной координатной системы.
4. Решить задачу установления координатного соответствия между различными изображениями через рассмотрение всех случаев изоморфных преобразований исходного изображения и выработать меры по их устранению с целью совмещения систем координат исходного и эталонного изображений.
5. Разработать информационную модель уровня страницы текста при многоуровневой обработке изображений: на примере уровня страницы текста рассмотреть модели определения расположения и ориентации страницы текста.
6. Разработать информационную модель уровня строк и букв при многоуровневой обработке изображений.
Методы исследования
Для решения поставленных задач в работе использованы методы распознавания образов, теории активного восприятия, системного анализа, математического моделирования, анализа и синтеза изображений, теории групп и теории вычислительных систем.
Научная новизна
Научная новизна работы состоит в следующем:
1. Решена задача построения пирамидальной координатной системы в представлении на плоскость.
2. Разработана информационная модель определения взаимного расположения объектов на разных уровнях разложения с использованием пирамидальной координатной системы.
3. Разработана информационная модель определения взаимного расположения объектов на одном уровне разложения с использованием пирамидальной координатной системы.
4. Решена задача установления координатного соответствия между различными изображениями на множестве изоморфных преобразований исходного изображения и выработаны меры по их устранению с целью совмещения систем координат исходного и эталонного изображений.
5. Разработана информационная модель уровня страницы текста и уровня строк и букв при многоуровневой обработке изображений.
6. Разработана информационная модель обработки изображений объектов при их частичном стирании.
Практическая ценность
Реализованы в виде программных модулей алгоритмы узнавания на произвольных шумах, формирования гипотез о результатах узнавания на ранних стадиях процесса узнавания, подавления искажений, возникающих ввиду воздействия на анализируемое изображение всех видов изоморфных преобразований, формирования гипотез в процессе узнавания частично стертых изображений объектов, анализа изображений, содержащих текстовую информацию. Проведена проверка разработанного программного комплекса на множестве изображений как реальных, в том числе искаженных, так и созданных специально для проведения исследования.
Результаты работы использованы проектах РФФИ №01-01-00452, №0101-00459 и внедрены в учебный процессе Нижегородского государственного технического университета.
Полученные результаты подтверждают эффективность методов анализа и разработанных алгоритмов.
Апробация работы
Основные положения диссертационной работы были апробированы на 6 научных конференциях:
• Научно-техническая конференция факультета информационных систем и технологий (Нижний Новгород, 1999);
• Всероссийская научно-техническая конференция ИСТ-2001 (Нижний Новгород, 2001); • Региональный молодежный научно-технический форум «Будущее технической науки Нижегородского региона» (Нижний Новгород, 2002);
• Всероссийская научно-техническая конференция ИСТ-2002 (Нижний Новгород, 2002);
• Всероссийская научно-техническая конференция ИСТ-2003 (Нижний Новгород, 2003);
• II Региональная молодежная научно-техническая конференция «Будущее технической науки Нижегородского региона» (Нижний Новгород, 2003);
Публикации
По материалам диссертации опубликовано 11 научных работ [1-11], в том числе 5 статей.
Структура и объем диссертации
Основной текст диссертации состоит из введения, 5 глав, заключения, библиографического списка и приложения, содержит 147 страниц машинописного текста, 82 рисунка и 16 таблиц.
Заключение диссертация на тему "Информационные модели многоуровневой обработки изображений"
5.5. Выводы
1. Разработано алгоритмическое программное обеспечение на основе выбранного критерия поиска эталонного образа, соответствующего узнаваемому изображению, базирующийся на системе признаков, соответствующих теории активного восприятия, доказывающее эффективность использования указанного критерия при построении систем узнавания изображений.
2. Разработано алгоритмическое программное обеспечение, позволяющее в реальном масштабе времени обрабатывать сложные изображения на фоне интенсивных помех.
3. Проведены экспериментальные исследования, результаты которых позволяют утверждать о высокой надежности узнавания даже при наличии значительных помех на изображении.
4. Предложена модель формирования гипотез в процессе узнавания при многоуровневой обработке изображений, позволяющая без значительного усложнения системы узнавания в целом эффективно накапливать и использовать опыт, основанный на существенных различиях в той частоте, с которой в реальных условиях встречаются те или иные образы в процессе узнавания.
5. Решена задача определения ориентации объекта изображения с заданной точностью.
6. Показана работоспособность алгоритмического программного обеспечения на примерах обработки текста, ориентации объекта по его изображению для робототехнических систем, анализа номеров на железнодорожных вагонах.
Заключение
Наиболее важным результатом диссертационной работы является разработка информационных моделей и алгоритмического обеспечения многоуровневой обработки изображений.
В соответствии с поставленными целью и задачами в ходе выполнения диссертационной работы были получены следующие основные результаты:
1. Решена задача построения пирамидальной координатной системы в представлении на плоскость.
2. Разработана информационная модель определения взаимного расположения объектов на разных уровнях разложения с использованием пирамидальной координатной системы.
3. Разработана информационная модель определения взаимного расположения объектов на одном уровне разложения с использованием пирамидальной координатной системы.
4. Решена задача установления координатного соответствия между различными изображениями на множестве изоморфных преобразований исходного изображения и разработаны процедуры по их устранению с целью совмещения систем координат исходного и эталонного изображений.
5. Разработана информационная модель уровня страницы текста при многоуровневой обработке изображений, позволяющая определять расположение и ориентацию страницы текста.
6. Разработана информационная модель уровня строк и букв при многоуровневой обработке изображений, позволяющая выделять на изображении строки текста, в внутри строк - буквы.
7. Разработана информационная модель работы с объектами, подвергшимися частичному стиранию, например в результате грубой сегментации.
8. Разработано алгоритмическое программное обеспечение на основе выбранного критерия поиска эталонного образа, соответствующего узнаваемому изображению, базирующийся на системе признаков, соответствующих теории активного восприятия, доказывающее эффективность использования указанного критерия при построении систем узнавания изображений.
9. Разработано алгоритмическое программное обеспечение, позволяющее в реальном масштабе времени обрабатывать сложные изображения на фоне интенсивных помех.
Ю.Проведены экспериментальные исследования, результаты которых позволяют утверждать о высокой надежности узнавания даже при наличии значительных помех на изображении.
11 .Предложена модель формирования гипотез в процессе узнавания при многоуровневой обработке изображений, позволяющая без значительного усложнения системы узнавания в целом эффективно накапливать и использовать опыт, основанный на существенных различиях в той частоте, с которой в реальных условиях встречаются те или иные образы в процессе узнавания.
Библиография Авербух, Михаил Леонидович, диссертация по теме Теоретические основы информатики
1. Авербух М. J1. Алгоритм координатного совмещения эталонного и анализируемого изображений // Тез. докл. Всероссийской научно-техн. конф. «Информационные системы и технологии». - Н. Новгород, 2001, с. 147-149.
2. Авербух. М. JI. Алгоритм узнавания символьных изображений на произвольных шумах // Тез. докл. научно-техн. конф. фак. информационных систем и технологий «ФИСТ 99». - Н. Новгород, 1999, с. 81- 82.
3. Авербух М. JI. Информационная модель определения взаимного расположения объектов при многоуровневой обработке изображений // сб. «Труды НГТУ: Системы обработки информации и управления», том 35, -Н. Новгород, 2002, с. 48 50.
4. Авербух М. JI. Информационная модель определения ориентации объекта изображения на плоскости // Межвуз. сб. науч. тр. «Системы обработки информации и управления», вып. 8, Н. Новгород, 2001, с. 32-36.
5. Авербух М. JI. Информационная модель пирамидальной координатной системы на плоскости // Тез. докл. Всероссийской научно-техн. конф. «Информационные системы и технологии». Н. Новгород, 2002, с. 161 — 162.
6. Авербух М. JI. Информационная модель построения гипотез в процессе узнавания по части изображения // Тез. докл. 2-й региональной молодежной научно-техн. конф. «Будущее технической науки Нижегородского региона». Н. Новгород, 2003, с. 3.
7. Авербух М. JI. Информационная модель узнавания частично загороженных и частично стертых изображений // Тез. докл. Всероссийской научно-техн. конф. «Информационные системы и технологии». — Н. Новгород, 2003, с. 141.
8. Авербух М. JI. Информационная модель формирования гипотез в процессе узнавания при многоуровневой обработке изображений // Межвуз. сб. науч. тр. «Системы обработки информации и управления», вып. 7, -Н. Новгород, 2001, с. 91 94.
9. Авербух М. JI. Информационные модели совмещения систем координат эталонного и анализируемого изображений // Межвуз. сб. науч. тр. «Системы обработки информации и управления», вып. 7, Н. Новгород, 2001, с. 84-90.
10. Авербух М. JI. Исследование работы алгоритма узнавания символьных изображений на произвольных шумах // сб. «Труды НГТУ: Системы обработки информации и управления», том 37, Н. Новгород, 2003, с. 3138.
11. Авербух М. JI. Пирамидальная координатная система многоуровневой обработки изображений // Тез. докл. научно-техн. форума «Будущее технической науки Нижегородского региона». — Н. Новгород, 2002, с. 110.
12. Аггарвал Дж.К., Нандхакумар Н. Определение параметров движения по последовательности изображений. Обзор // ТИИЭР, 1988, т.76, № 8, с. 69 -90.
13. Алгебраическая теория автоматов, языков и полугрупп // Под ред. А.Арбиба. М.: Статистика, 1975. - 335 с.
14. Александров В. В., Горский Н. Д. Зрительное восприятие человека и машинное зрение // Искусственный интеллект. В 3-х кн. - М.: Радио и связь, 1990. Кн. 2. Модели и методы: Справочник / Под ред. Д. А. Поспелова. — 304 с.
15. Александров П.С. Теория размерностей и смежные вопросы; статьи общего характера. М.: Наука, 1978. - 295 с.
16. Алоимокос Дж. Зрительное определение формы // ТИИЭР, 1988, т.76, № 8, с. 50-69.
17. Андреев Ю.Н. Управление конечномерными линейными объектами. М.: Наука, 1976. - 424 с.
18. Андросов В. А., Бойко Ю. В., Бочкарев А. М., Одногор А. П. Совмещение изображений в условиях неопределенности // Зарубежная радиоэлектроника, 1985, № 4, с. 54 — 69.
19. Анисимов Б. В., Курганов В. Д., Злобин В. К. Распознавание и цифровая обработка изображений. -М.: Высшая школа, 1983.-295 с.
20. Аркадьев А.Г., Браверман Э.М. Обучение машины классификации объектов. — М.: Наука, 1971. 192 с.
21. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980. - 248 с.
22. Байчи Р. Активное восприятие // ТИИЭР, 1988, т.76, № 8, с. 164 175.
23. Бакут П.А., Колмогоров Г.С. Сегментация изображений: методы выделения границ областей // Зарубежная радиоэлектроника, 1987, № 10, с. 33-52.
24. Балашов Е. П., Пузанков Д. В. Проектирование информационно-управляющих систем. М.: Радио и связь, 1987. - 256 с.
25. Берт П.Дж. Интеллектуальное восприятие в пирамидальной зрительной машине // ТИИЭР, 1988, т.76, № 8, с. 175 186.
26. Бертеро М., Поджо Т.А., Торре В. Некорректные задачи в предварительной обработке визуальной информации // ТИИЭР, 1988, т.76, № 8, с. 17 40.
27. Бесл Дж. Геометрическое моделирование и машинное зрение // ТИИЭР, 1988, т.76, №8, с. 90-117.
28. Бессонов А.А., Загашвили Ю.В., Маркелов А.С. Методы и средства идентификации динамических объектов. — JL: Энергоатомиздат, 1989. — 280 с.
29. Бир. Ст. Кибернетика и управление производством. М.: Гос. изд-во физмат лит-ры, 1963. - 275 с.
30. Бьемон Ж., Логендейк P.JL, Мерсеро P.M. Итерационные методы улучшения изображения // ТИИЭР, 1990, т.78, № 5, с. 58 84.
31. Вапник В.Н., Червоненкис А .Я. Теория распознавания образов (статистические проблемы обучения). М.: Наука, 1974. - 416 с.
32. Васильев В. И., Ивахненко А. Г. и др. Алгоритм распознающей системы перцептронного типа с корректором на входе. // Автоматика. Киев: Наукова думка, 1966, № 1, с. 7 — 21.
33. Галушкин А. И. Синтез многослойных систем распознавания образов. -М.: Энергия, 1974. 368 с.
34. Гилой В. Интерактивная машинная графика: Структуры данных, алгоритмы, языки. — М.: Мир, 1981. — 384 с.
35. Горелик А. Л., Гуревич И. Б., Скрипкин В. А. Современное состояние проблемы распознавания. — М.: Радио и связь, 1985. — 160 с.
36. Горелик А. Л., Скрипкин В. А. Методы распознавания. М.: Высшая школа, 1984.-222 с.
37. Грановская Р. М., Березная И. Я., Григорьева А. Н. Восприятие и признаки формы. М.: Наука, 1981. - 208 с.
38. Гуревич И.Б. Проблемы распознавания изображений / Распознавание, классификация, прогноз. Математические методы и их применение, вып. 1.- М.: Наука, 1989, с. 280 328.
39. Дей Дж. Д., Зиммерман Ю. Эталонная модель взаимодействия открытых систем (ВОС) // ТИИЭР, 1983, т.71, №12, с. 8 17.
40. Денисов Д.А., Низовкин В.А. Сегментация изображений на ЭВМ // Зарубежная радиоэлектроника, 1985, №10, с. 5 30.
41. Джордж Ф. Мозг как вычислительная машина. М.: ИЛ, 1969. — 528 с.
42. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. -511 с.
43. Евреинов Э.В. Однородные вычислительные системы, структуры и среды.- М.: Радио и связь, 1981. 208 с.
44. Елисеев И. И., Руковишников В. О. Группировка, корреляция, распознавание образов. М.: Статистика, 1977. — 144 с.
45. Жаботинский Ю. Д., Исаев Ю. В. Адаптивные промышленные роботы и их применение в микроэлектронике. М.: Радио и связь, 1985. - 413 с.
46. Жиков В.В., Козлов С.И., Олейник О.А. Усреднение дифференциальных операторов. — М.: Физматлит, 1993. — 464 с.
47. Журавлев Ю. И., Гуревич И. В. Распознавание образов и анализ изображений // Искусственный интеллект. — В 3-х кн. М.: Радио и связь, 1990. Кн. 2. Модели и методы: Справочник / Под ред. Д. А. Поспелова. — 304 с.
48. Журавлев Ю.И. Об алгоритмическом подходе к решению задач распознавания и классификации // Проблемы кибернетики : Сб. ст. — М.: Наука, 1978, вып. 33, с. 5 68.
49. Завалишин H. В., Мучник И. Б. Модели зрительного восприятия и алгоритм анализа изображений. — M.: Наука, 1974. — 344 с.
50. Загоруйко Н. Г. Методы распознавания и их применение. — М.: Сов. радио, 1972. 208 с.
51. Зрительное опознание и его нейрофизиологические механизмы // Под ред. В.Д. Глезер. Л.: Наука, 1975. - 272 с.
52. Зубов В.И. Динамика управляемых систем. М.: Высш. школа, 1982. — 285 с.
53. Игнатов В.А. Теория информации и передачи сигналов. М.: Радио и связь, 1991.-280 с.
54. Икэути К., Канадэ Т. Автоматическое формирование программ распознавания образов // ТИИЭР, 1988, т.76, №8, с. 186 209.
55. Ильин В. А., Позняк Э. Г. Аналитическая геометрия. М.: Наука, 1988. — 224 с.
56. Информационные процессы мозга и психическая деятельность / Иваницкий А.М. и др. М.: Наука, 1984. - 300 с.
57. Калман Р., Фалб П., Арбиь М. Очерки по математической теории систем. — М.: Мир, 1971.-400 с.
58. Кантони В., Левиальди С. Мультипроцессорные системы для обработки изображений // ТИИЭР, 1988, т.76, №8, с. 118 130.
59. Катыс Г. П. Автоматическое сканирование. М.: Машиностроение, 1969. -520 с.
60. Катыс Г. П. Обработка визуальной информации. — М.: Машиностроение, 1990.-320 с.
61. Кодирование и обработка изображений / Под ред. В. В. Зяблова, Д. С. Лебедева. -М.: Наука, 1988. 181 с.
62. Козлов Ю.М. Адаптация и обучение в робототехнике. — М.: Наука, 1990. -248 с.
63. Колмогоров А.Н. Теория информации и теория алгоритмов. М.: Наука, 1987.-304 с.
64. Кольцов П.П. Математические модели теории распознавания образов / Компьютер и задачи выбора. -М.: Наука, 1989, с. 89 — 119.
65. Кондратьев В.В., Утробин В.А. Активное восстановление — решение проблемы неопределенности // Докл. АН, 1996, т.350, №3.
66. Кондратьев В.В., Утробин В.А. Анализ изображений в условиях неопределенности // Межвуз. сб. науч. тр. Системы обработки информации и управления. Н. Новгород, 1996, с. 7 - 17.
67. Кондратьев В.В., Утробин В.А. Основы теории активного восприятия изображений: Монография. Н. Новгород: Вектор, 1997. - 249 с.
68. Кондратьев В.В., Утробин В.А. Основы теории активного восприятия. -Н. Новгород: НГТУ, 1999. 217 с.
69. Кондратьев В.В., Утробин В.А. Формирование описания изображения в условиях неопределенности // Докл. АН, 1996, т.347, №3, с. 316 318.
70. Кохонен Т. Ассоциативная память. М.: Мир, 1980. - 239 с.
71. Куафе Ф. Взаимодействие робота с внешней средой. М.: Мир, 1985. -538 с.
72. Кухарев Г.А., Шмерко В.П., Зайцева Е.Н. Алгоритмы и систолические процессоры для обработки многозначных данных. Мн.: Нав. i тэх., 1990. -296 с.
73. Лебедев Д.Е. Упругая модель изображения / Сб. ст. «Кодирование и обработка изображений» / Под ред. В.В. Зяблова, Д.С. Лебедева. — М.: Наука, 1988, с. 61-64.
74. Ли Д. Вычислительные аспекты нижнего уровня машинного зрения // ТИИЭР, 1988, т.76, №8, с. 40 50.
75. Лорьер Ж.-Л. Системы искусственного интеллекта. М.: Мир, 1991. — 568 с.
76. Лотон Д.Т., Макконел К.С. Системы понимания изображений // ТИИЭР, 1988, т.76, №8, с. 209 227.
77. Марр Д. Информационный подход к представлению и обработке зрительных образов у человека. — М.: Радио и связь, 1987. 402 с.
78. Месарович М., Мако Д., Танахара И. Теория иерархических многоуровневых систем. -М.: Мир, 1973. 344 с.
79. Миллер У. мл. Симметрия и разделение переменных. М.: Мир, 1981. -342 с.
80. Минский М. Структура для представления знаний // Психология машинного зрения / Под ред. П. Уинстон. М.: Мир, 1978, с. 249 - 340.
81. Минский М., Пейперт С. Перцептроны. М.: Мир, 1971. - 264 с.
82. Михели-Цанаку Э. Нейрофизиологические механизмы зрения и успехи в области нейромоделирования и машинного зрения // ТИИЭР, 1988, т.76, №9, с. 80-93.
83. Мушик Э., Мюллер П. Методы принятия технических решений. М.: Мир, 1990.-208 с.
84. Неймарк Ю. И., Баталова 3. С., Васин Ю. Г., Брейдо М. Д. Распознавание образов и медицинская диагностика. — М.: Наука, 1972. 328 с.
85. Нотон Д., Старк JI. Движение глаз и зрительное восприятие / Восприятие: механизмы и модели. — М.: Мир, 1974, с. 226 — 240.
86. Пайтген Х.-О., Рихтер П.Х. Красота фракталов. Образы комплексных динамических систем. — М.: Мир, 1993. — 176 с.
87. Патрик Э. Основы теории распознавания образов. М.: Сов. радио, 1980. -408 с.
88. Передача и обработка информации голографическими методами / С.Б. Гуревич, В.Б. Константинов, В.К. Соколов, Д.Ф. Черных; Под ред. С.Б. Гуревича. — М.: Сов. радио, 1978. — 304 с.
89. Перцептрон система распознавания образов // Под ред. А. Г. Ивахненко. — Киев: Наукова думка, 1975. — 432 с.
90. Прэтт У. Цифровая обработка изображений: В 2 т. М.: Мир, 1982. Т.2. -480 с.
91. Психология машинного зрения / Под ред. П. Уинстон. М.: Мир, 1978. -344 с.
92. Распознавание образов: состояние и перспективы / К. Верхаген, Р. Дейн, Ф. Грун др. М.: Радио и связь, 1985. - 104 с.
93. Реконструкция изображений / Под ред. Г. Старка. М.: Мир, 1992. - 636 с.
94. Розенфельд А. Распознавание и обработка изображений. М.: Мир, 1972. -232 с.
95. Стаут К.Ф. Реализация алгоритмов машинного зрения в параллельных вычислительных архитектурах // ТИИЭР, 1988, т.76, №8, с. 145-163.
96. Тиман А.Ф., Трофимов В.Н. Введение в теорию гармонических функций. -М.: Наука, 1968.-207 с.
97. Тихонов В.И. Оптимальный прием сигналов. М.: Радио и связь, 1983. -320 с.
98. Трухаев Р. И. Модели принятия решений в условиях неопределенности. — М.: Наука, 1981.-257 с.
99. Ту Дж., Гонзалес Р. Принципы распознавания образов. М.: Мир, 1978. — 315с.
100. Ульман Ш. Принципы восприятия подвижных объектов. М.: Радио и связь, 1983.-467 с.
101. Уторобин В. А. Информационные модели стандартных задач обработки изображений // Научно-техническая конференция факультета информационных систем и технологий. ФИСТ 99. Тезисы докладов. — Н. Новгород, НГТУ, 1999, с. 79 - 80.
102. Утробин В. А. Методы обработки изображений в условиях априорной неопределенности: Дисс. д.т.н. Н. Новгород: НГТУ, 1998. - 409 с.
103. Утробин В.А. Информационные модели системы зрительного восприятия для задач компьютерной обработки изображений. — Н. Новгород.: НГТУ, 2001.-234 с.
104. Утробин В.А. Потенциальные операторы оценивания изображений //Системы обработки информации и управления: Межвуз. сб. науч. тр. /НГТУ. Н. Новгород, 1995, с. 17 26.
105. Утробин В.А., Кондратьев В.В. Теория активного восприятия изображения. Н. Новгород.: НГТУ, 1997. - 303 с.
106. Фанц Р. Восприятие формы / Восприятие: механизмы и модели. М.: Мир, 1974, с. 338-350.
107. Фишберн П. Теория полезности для принятия решений. М.: Наука, 1978. -352 с.
108. Фишер Р. От поверхностей к объектам. Машинное зрение и анализ трехмерных сцен. М.: Радио и связь, 1993. - 288 с.
109. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977. — 319с.
110. Харалик P.M. Статистический и структурный подходы к распознаванию структур U ТИИЭР, 1979, т.67, №5, с. 95 120.
111. Ш.Хорн Б. Определение формы по данным о полутонах / Психология машинного зрения / Под ред. П. Уинстон. М.: Мир, 1978, с. 137 — 184.
112. Хорн Б. Отмывка рельефа и карта отражательных способностей // ТИИЭР, 1981, т.69, №1, с. 16-35.
113. ПЗ.Цзуанг Ц., Эстевалд Э., Харалик Р. Принцип максимальной энтропии в восстановлении изображений // Реконструкция изображений / Под ред. Г. Старка. М.: Мир, 1992, с. 196 - 239.
114. Цыпкин Я.3. Адаптация и обучение в автоматических системах. — М.: Моск. ун-т, 1987.-324 с.
115. Чукин Ю. В. Структуры данных для представления изображений // Зарубежная радиоэлектроника, 1983, №8, с. 35 — 47.
116. Шевяков С.Б. Выделение границ текстур на изображении // Тезисы докладов научно-технического форума «Будущее технической науки Нижегородского региона». — Н. Новгород: НГТУ, 2002, с. 117 — 120.
117. Шевяков С.Б. Измерение элементарного блока текстуры // Тезисы докладов Всероссийской научно-технической конференции «Информационные системы и технологии 2002». - Н. Новгород: НГТУ, 2002, с. 202-203.
118. Шевяков С.Б. Методы анализа текстур с позиции теории активного восприятия // Межвузовский сборник научных трудов «Системы обработки информации и управления». Вып. 7 Н. Новгород: НГТУ, 2001, с. 104-110.
119. Шевяков С.Б. Методы и средства анализа текстур // Тезисы докладов VII Нижегородской сессии молодых ученых (технические науки). -Н. Новгород: НГТУ, 2002, с. 213 215.
120. Шевяков С.Б. Обнаружение искажений на текстурах // Сборник научных трудов «Современные проблемы радиоэлектроники». — Красноярск: ИПЦ КГТУ, 2002, с. 74 75.
121. Шибанов Г. П. Распознавание в системах автоконтроля. — М.: Машиностроение, 1973. 424 с.
122. Шикин Е. В., Боресков А. В. Компьютерная графика. Динамика, реалистические изображения. М.: ДИАЛОГ-МИФИ, 1995. - 288 с.
123. Шлезингер М. И. Математические средства обработки изображений. -Киев: Наукова думка, 1989. -200 с.
124. Шубников А.В., Копцик В.А. Симметрия в науке и искусстве. — М.: Наука, 1972.-339 с.
125. Шустер Г. Детерминированный хаос. Введение. М.: Мир, 1988. - 240 с.
126. Шутц Б. Геометрические методы математической физики. М.: Мир, 1984. - 304 с.
127. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. — М.: Наука, 1969. -424 с.
128. Эшби У.Р. Конструкция мозга. Происхождение адаптивного поведения. -М.: Мир, 1964.-411 с.
129. Эшби У.Р. Принципы самоорганизации / Принципы самоорганизации / Под ред. А .Я. Лернера. М.: Наука, 1966, с. 15 - 47.
130. Яншин В. В. Анализ и обработка изображений: Принципы и алгоритмы. — М.: Машиностроение, 1980. 112 с.
-
Похожие работы
- Поиск изображений с использованием семантических признаков
- Модель и алгоритмы поиска изображений в графических базах данных на основе теории активного восприятия
- Разработка программно-аппаратных средств для обработки информационных сигналов на основе гистограммных преобразований для визуализации изображений
- Методы обработки в условиях априорной неопределенности
- Система идентификации космических изображений поверхности Земли для автономной навигации ИСЗ
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность