автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.05, диссертация на тему:Устройство распознавания изображений текстовых знаков по энтропийным характеристикам

кандидата технических наук
Бородин, Михаил Владимирович
город
Курск
год
2004
специальность ВАК РФ
05.13.05
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Устройство распознавания изображений текстовых знаков по энтропийным характеристикам»

Автореферат диссертации по теме "Устройство распознавания изображений текстовых знаков по энтропийным характеристикам"

На правах рукописи

БОРОДИН МИХАИЛ ВЛАДИМИРОВИЧ

УСТРОЙСТВО РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ТЕКСТОВЫХ ЗНАКОВ ПО ЭНТРОПИЙНЫМ ХАРАКТЕРИСТИКАМ

Автореферат

диссертации на соискание ученой степени кандидата технических наук по специальности

05.13.05 - «Элементы и устройства вычислительной техники и систем управления»

Курск - 2004 г.

Работа выполнена в Курском государственном техническом университете

Научный руководитель: кандидат физико-математических наук, профессор СТАРКОВ Ф. А.

Официальные оппоненты: доктор технических наук, профессор ТИТОВ В. С, кандидат технических наук ЛЕОНОВ Е. И.

Защита состоится 23 июня 2004 г. в 16:00 на заседании диссертационного совета Д212.105.02 при Курском государственном техническом университете по адресу: 305040. г. Курск, ул. 50 лет Октября, 94, конференц-зал.

С диссертацией можно ознакомиться в библиотеке университета

Ведущая организация: войсковая часть 25714

Автореферат разослан 22.05.04

Ученый секретарь диссертационного совета:

Общая характеристика работы Актуальность работы

Создание текстов в электронной форме, при помощи персонального компьютера, в последние десять-пятнадцать лет стало повседневной практикой. Сейсас абсолютное боль-тинство создаваемой офисной, научной и конструкторской документации представлено именно в электронной форме. Возникли и получили широкое распространение электронные библиотеки и базы данных научной, технической и учебной направленности.

Вместе с тем, в настоящее время, огромный массив текстовой информации по-прежнему доступен лишь на бумажных носителях. Нет необходимости подробно останавливаться на всех недостатках указанной ситуации — они очевидны. Достаточно упомянуть лить о том, что поиск информации в электронном издании обычно занимает несколько секунд, в то время как для поиска той же информации в том же издании на бумажном носителе может потребоваться до нескольких часов.

Процесс перевода текстовой информации в электронную форму обычно состоит из двух этапов — сканирования и распознавания. К настоящему моменту разработано множество способов распознавания текстовых символов и целый ряд систем, реализующих эти способы. Большинство из них являются программными реализациями, среди которых есть несколько популярных пакетов OCR (Optical Character Recognition — оптическое распознавание символов). Современные программные реализации алгоритмов распознавания, как правило, приспособлены ко вводу единичных документов и мало подходят для обработки больших массивов текстовой информации по причине недостаточного быстродействия. Причина этому — плохая приспособленность универсальных компьютеров к решению как задач распознавания изображений текстовых знаков в частности, так и задач обработки изображений вообще.

Путь к достижению высокой скорости распознавания состоит в создании высокопроизводительных специализированных устройств распознавания. Применение таких устройств должно помочь решению проблемы массового перевода бумажных текстовых документов в электронную форму. В настоянщее время известен ряд устройств распознавания, однако большинство из них характеризуется недостаточной вероятностью правильного распознавания или повышенной вычислительной сложностью.

В связи с вышеизложенным, научно-техническая задача повышения вероятности правильного распознавания, а также скорости распознавания изображений текстовых знаков является актуальной.

Работа выполнена в рамках гранта Министерства образования и науки Российской Федерации 1.10.98 «Разработка фундаментальных основ и алгоритмического обеспечения автоматизированных систем обработки изображения» и темы 1-37.02 «Разработка программных средств обработки измерительной информации».

Объект исследования

Объектом исследования является процесс распознавания текстовых знаков.

Цель работы

Цель работы состоит в повышении вероятности правильного распознавания текстовых знаков при вводе текстов с бумажных носителей путем разработки способа распознавания, с использованием шаблонов, сформированных на основе этр-рогшАиму у^пактрригти* элементов эталонов, и быстродействующего устройст наКфСЗДЮдамШАЛЫМОД

БИБЛИОТЕКА 3 СПтр«

09

Задачи, решаемые в работе

1. Исследование зависимости между энтропийными характеристиками элементов эталонов и разработка способа определения информативности элементов на ее основе.

2. Разработка способа формирования шаблонов, на основе информативности элементов эталонов.

3. Сравнительное исследование предлагаемого способа формирования шаблонов и известного способа, основанного на использовании спинового стекла.

4. Разработка устройства, реализующего предложенный способ распознавания.

Методы исследования

При решении поставленных задач использовались методы теории проектирования элементов и устройств вычислительной техники и устройств управления, теории цифровых автоматов, теории алгоритмов, теории вероятностей и математического моделирования.

Научная новизна

1. Установлена связь между энтропийными характеристиками элементов эталонов и вероятностью правильного распознавания знаков.

2. Разработан способ оценки информативности элементов эталонных изображений на основе энтропийных характеристик.

3. Разработан способ формирования шаблонов на основе оценки информативности элементов эталонных изображений.

Практическая ценность

Практическая ценность работы заключается в разработке специализированного устройства и программных средств ПЭВМ для распознавания текстовых знаков.

Положения, выносимые на защиту

1. Способ оценки информативности элементов эталонных изображений на основе энтропийных характеристик.

2. Способ формирования шаблонов на основе оценки информативности элементов эталонных изображений.

3. Структурно-функциональная организация устройства распознавания изображений текстовых знаков.

Реализация и внедрение результатов исследований

Результаты работы внедрены в ОКБ «Авиаавтоматика», а также в учебный процесс кафедры «Программное обеспечение вычислительной техники» Курского государственного технического университета.

Апробация работы

Основные результаты диссертационной работы докладывались на:

1. III и IV Всероссийской научно-технической конференции «Теоретические и при-I-ладные HortpötrW современных информационных технологий» (Улан-Удэ. 2002 и 2003 гг.);

2. XXXI вузовской научно-технической конференции «Молодежь и XXI век» (Курск 2003 г.);

3. I Международной научно-технической конференции «Современные инструментальные системы, информационные технологии и инновации» (Курск, 2003 г.);

4. VI Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации» (Курск 2003 г.).

Публикации и личный вклад автора

Результаты исследований отражены в тести печатных работах. В работе |]| лично автором проведено моделирование распознавания с использованием различных наборов эталонов и установлена количественная связь между расстоянием между эталонами в пространстве признаков и вероятностью правильного распознавания. В работе автором предложен алгоритм распознавания с использованием нелинейных преобразований. В работах [6, 3, 5] лично автором разработан способ формирования шаблонов на основе энтропийных характеристик эталонов, а также проведено моделирование распознавания с использованием этих шаблонов. В работах [4, 6] лично автором разработана структурно-функциональная схема устройства распознавания текстовых символов с использованием шаблонов.

Структура и объем работы

Работа состоит из введения, четырех глав, заключения, списка литературы и двух приложений. Работа изложена на 178 страницах и содержит 36 рисунков, 8 таблиц и 64 наименования библиографии. Основной текст работы содержит 107 страниц.

Основное содержание работы

Работа состоит из четырех глав, введения, заключения и двух приложений.

Во введении обоснована актуальность темы, сформулирована цель и основные задачи исследования, показана научная новизна и практическая значимость работы, приведены основные положения, выносимые на защиту.

В первой главе содержится обзор современных алгоритмических и технических средств распознавания изображений текстовых знаков. Из обзора следует, что большинство алгоритмов распознавания текстовых знаков и устройств, построенных на их основе, характеризуются повышенной вычислительной сложностью.

Наибольшем быстродействием характеризуются устройства, осуществляющие непосредственное сравнение распознаваемого изображения с эталонным. Классификация в таких устройствах производится на основании минимума расстояния между распознаваемым и эталонным изображениями, вычисленного с использованием некоторой метрики. С точки зрения снижения вычислительной сложности, наилучшей метрикой является дистанция Хемминга. Для двоичных изображений дистанция Хемминга определяется формулой

¿1 (*, и) = ^ ^ X, (1 - Г„) + Г„ (1 - X,) , (1)

а, для биполярных — формулой

где х} — }-ы& элемент распознаваемого и з о б р а ж е-ц'-мйяэдеэда'П ¿л® н н о г о изображения, а т — количество элементов в изображении.

Повысить быстродействие устройств распознавания текстовых знаков, использующих сравнение распознаваемого образа с набором эталонов, можно путем использования шаблонов. Шаблон представляет собой подмножество наиболее информативных элементов эталонного изображения. Формально шаблон можно определить так

М,С{1,2,...,т}, (3)

где Л/, — шаблон 1-го эталонного изображения, а т — количество элементов в эталонном изображении.

Использование шаблонов позволяет ускорить распознавание за счет исключения из обработки неинформативных элементов распознаваемого изображения.

Существующие к настоящему моменту способы формирования шаблонов носят большей частью эмпирический характер. Известен способ построения шаблонов, основанный на использовании спинового стекла. Согласно этому способу шаблон формируется из элементов, обладающих положительным приращением энергии. Приращение энергии элемента эталонного изображения вычисляется по формуле

Де,, = (4)

где С {—1, +1} — ,7-ый элемент ¿-го эталонного изображения, т — количество элементов в эталонном изображении, а с,* € {—т, —т ■+-1,... ,т} — обобщенный коэффициент связи между ¡-ым и к-ым элементами в наборе эталонных изображений, вычисляемый, в свою очередь, по формуле

(5)

где п — количество эталонных изображений.

Во второй главе описан способ оценки информативности элементов эталонных изображений на основе их энтропийных характеристик, а также способ формирования табло-нов на основе оценки информативности.

Если рассматривать распознавание как процесс уменьшения неопределенности, то для оценки информативности элемента можно воспользоваться количественной мерой неопределенности — энтропией.

Как известно, энтропия множества, состоящего из событий Е и Е, может быть определяется по формуле

Н {{Е, £}) = в (я) = -р1о8р - (1 - р) 1ое(1 - р), (6)

где р = Р (Е) — вероятность события Е.

Пусть имеется п знаков, а количество элементов в распознаваемом изображении равно т. Обозначим ¿-ый элемент распознаваемого изображения через х}, а ¿-мА элемент 1-го эталонного изображения через гч. Введем событие Е„ состоящее в том, что распознаваемое изображение принадлежит г-му знаку, Обозначим вероятность события Е, через р, и определим энтропию в системе, состоящей из событий Согласно (6), энтропия в

этой системе задается формулой

Н({Е.,£.})=б(р,)- (7)

Теперь вычислим энтропию в той же системе с учетом информации о элементе распознаваемого изображения. Предположим, что ^-ый элемент равен 0, т. е. наступило событие X; = 0. Для определения вероятности события Е^ при условии события х^ = 0 можно воспользоваться формулой Байеса

' (Е./х, = 0) = Р (Е.) Р (х,- = О/Я.) ^ Р (Ек) Р (*, = О/Я»)^ .

(8)

Очевидно, что вероятность события х} = 0 при условии события £* зависит от значения }-го элемента 1-го эталонного изображения. Не принимая во внимание наличие в распознаваемом изображении шума, при условии события Е„ событие х1 = 0 можно считать достоверным, если элемент эталонного изображение равен 0, и невозможным в противном случае.

Т. о., справедливо равенство

Если ввести обозначения Рч о

если = 0; 0 в противном случае.

>• = 0/Е.) =

я

Р(£;)Р(г,=о/Е,)=Ь еслиг'^0;

[0 в противном

случае.

(9)

(10)

Я]0 = У.РФ,

то выражение (8) можно переписать в виде

Я]0

(12)

Соответственно, вероятность противоположного события Е„ при условии события у, = 0, выражается равенством

Теперь предположим, что У-ый элемент распознаваемого изображения равен 1. Введем по аналогии с (10) и (И) величины р,}\ и ^ и определим вероятности событий л ^ при условии события = 1 в виде

(14)

(15)

Энтропия в системе событий и Д при условии событщ = 0 определяется форму-а при условии события = 1 формулой

Н ({£./„, = 1, Д/у, = 1})= Лч, = в .

(17)

Как так и характеризуют величину энтропии в рассматриваемой системе, с учетом значения элемента распознаваемого изображения. Однако, для их использования необходимо знать конкретное значение элемента.

Чтобы устранить этот недостаток перейдем к оценке энтропии, взвешенной с учетом вероятности появления каждого значения элемента. Средневзвешенная энтропия в системе событий с учетом информации о элементе распознаваемого образа определяется формулой

К, - ,о + Ч]\К,\- (18)

Рассмотрим часто встречающийся частный случай, когда вероятности появления всех знаков равны, т. е. когда

для всех i 6 {1,2, ..,п}.

1

Pt =

п

(19)

Подставив (19) в (10) и

Рч О

ли х,: = 0; противном случае

{п~1 ее 0 в

Í0 если i„ = 0,

(20)

РЧ1=М ' • (21)

I п в противвом случае

Обозначим количество эталонных изображений, в которых j-ыЛ элемент равен 0 и 1 через «jo и п}\ соответственно. Тогда для величин (11) и (15) получим выражения

п]0

(22)

= !bi

(23)

Теперь с использованием (22) и (23) выражение (18) для случая равновероятного появления знаков можно записать в виде

К-* fe)М*?))-

(24)

Принимая во внимание то, что из величин (22) и (23) в точности одна всегда равна нулю, а также то, что функция в(р) в точке р = 0 обращается в ноль, выражение (24) можно записать в виде

h _ í n}<¡e (l/nj0) если xv = 0; 4 n 1 (1/п;[) в противном случае

Введем величину п,г вычисляемую по формуле

(п, о е< "у = {

*

если x,j = 0, противном случае

(25)

(26)

Эта величина представляет собой количество эталонных изображений, в которых ¿-ый элемент совпадает с элементом эталонного изображения.

и

и

Поставив (26) в (25) получим выражение средневзвешенной энтропии через п^

или, с учетом (6),

П., 1ой - (п., - 1) (п., - 1)

(28)

п

Чтобы перейти от средневзвешенной энтропии к оценке информативности элемента эталона принимаем во внимание тот факт, что элемент эталонного изображения следует считать тем более информативным, чем .меньше неопределенности остается относительно того, какому символу принадлежит распознаваемое изображение. Учитывая вышесказанное, можно предложить способ оценки информативности элемента эталонного изображения, состоящий в том, чтобы сначала вычислить средневзвешенную энтропию всех элементов во всех эталонных изображениях, найти максимум среди них, а затем получить информативность данного элемента эталонного изображения как разность между найденным максимумом и собственной средневзвешенной энтропией этого элемента. Т. о., вычислить опенку информативности можно по формуле

где д,} — информативность з-го элемента »-го эталонного изображения, а Лт,х — максимальное значение средневзвешенной энтропии среди всех элементов всех эталонных изображений, которое определяется выражением

Разработанный способ оценки информативности элементов эталонных изображений делает возможным формирования шаблонов, состоящих из наиболее информативных элементов.

Помимо необходимости учитывать при формировании шаблонов информативность элементов, другим важным критерием является обеспечение «равнопрочности» шаблонов. «Равнопрочными» станем называть такие шаблоны, которые обеспечивают примерно ран-ную вероятность правильного распознавания изображений каждого знака. Количественной оценкой «равнопрочности» может служить среднеквадратичное отклонение оценки вероятности правильного распознавания изображений различных знаков. Способ формирования шаблонов, отвечающий указанным критериям, состоит в том, чтобы включать в шаблоны самые информативные элементы, причем количество элементов в каждом шаблоне подбирать так, чтобы суммы информативностей шаблонных элементов были примерно равны между собой. «Равнопрочность» шаблонов, формируемых этим способом, достигается за счет «компенсации» отсутствия в эталонном изображении необходимого количества высокоинформативных элементов добавлением в шаблон ббльшего числа несколько менее информативных элементов.

Разработанный способ формирования шаблонов может быть реализован следующим алгоритмом.

Входные данные: п — количество классов, тп — количество элементов в эталоне, — информативность ¿-го элемента ¿-го класса, I — общее количество шаблонных элементнов.

Выходные данные: М< — шаблон 1-го класса.

Временные переменные: г,з,к, и— счетчики, с, — суммарная информативность шаблонных элементов класса.

94 = Лю»х —

(29)

ктлх — тахтах /ц*.

(30)

for ie {l,2,...,n} do

for u€ {l,2,...,i} do

for fee {2,3,...,n} do

while j € Mi do

for fee {2,3,...,m} do if к $ M, Л > gtj then

В третьей главе содержится описание разработанной программы моделирования распознавания с использованием шаблонов и полученных с ее помощью результатов моделирования.

Разработанная программа моделирования позволяет исследовать зависимость между вероятностью правильного распознавания знаков, уровнем шума, присутствующим в изображениях знаков, и общим количеством шаблонных элементов. Оценкой вероятности правильного распознавания служит отношение количества правильно распознанных знаков к общему количеству знаков, предъявленных к распознаванию.

В ходе работы программа моделирования производит чтение эталонных изображений знаков из дисковых файлов (по одному файлу в формате Taurga для одного знака), формирование шаблонов, формирование тестовых изображений знаков на основе эталонных путем наложения шума, моделирование распознавания тестовых изображений и вывод результатов. Параметры моделирования передаются через командную строку.

В качестве знаков в процессе моделирования использовались цифры от «<О» до «9», представленные черно-белыми изображениями размером 24 х 12 пикселя, взятые из шрифтов Ариэль (Arial), Курьер (Courier) и Таймз (Times). Один из использовавшихся наборов эталонных изображений представлен на рис. 1, а оценки информативности его элементов — на рис. 2

При моделировании использовались шаблоны, содержащие от 60 до 240 элементов. Один из сформированных наборов шаблонов показан на рис. 3.

Из результатов моделирования удалось установить, что шаблоны из 120 элементов обеспечивают правильное распознавание всех классов с вероятностью 1 при уровне шума до 0,1, а из 240 элементов — при уровне шума до 0.2. Также было установлено, что при использовании шаблонов из 180 элементов правильное распознавание с вероятностью 0,9 обеспечивается при уровне шума до 0,3, а при использовании шаблонов из 240 элементов — при уровне шума до 0,4. Графики, отражающие эти результаты приведены на рис. 4.

°°8о п8о

ООО ООО

ооооо о

эоо

оос ООО

ООООООО 00 ООО

° 88° ОО ООО

(а) «О»

(Ь) «ь

(с) ч2>

(<1) <3>

ООООО ОО ООО

88

ООО

ОС

ООООООО

ООО

088080

88 00 ОО ОО ОООООООО ООО ОО

°8(

>0000 ООО

ОО

о88

ООО

(е) «4»

(О «5,

(в) «в»

(1.) «7»

(>) «8» (¡) <9»

Рис. 1: Эталонные изображения 11

Рис. 2: Информативность элементов. Величина показателя информативности пропорциональна площади соответствующей точки на рисунке.

о о

о О о

о о

о о о

о О О о

оо О о

о О О

о о

о о оо

о

О

0)<9,

Рис. 3: Шаблоны, сформированные из 120 элементов. Шаблонные элементы показаны точками.

0 95-

правильного

распазча- ®

винил

08-

0 75-

0 1

02

03

04

05

Интенсивность шума

Рис 4 Зависимость вероятности правильного распознавания от уровня шума для шаблонов, содержащих 60 элементов (сплошная линия), 120 элементов (короткие штрихи), 180 элементов (длинные штрихи) и 240 элементов (чередование короткого длинного штрихов) Также приведена зависимость вероятности правильного распознавания от уровня шума, при распознавании без использования шаблонов (чередование двух коротких и одного длинного штрихов).

Также было проведено моделирование распознавания с использованием шаблонов сформированных с использованием спинового стекла, при этом общее количество шаблонных элементов составило 274,219 и 240 для наборов эталонов, полученных из шрифтов Ариэль, Курьер и Таймз, соответственно Для сравнения было проведено моделирование распознавания с использованием предлагаемого метода для того же общего количества шаблонных элементов

Результаты моделирования позволили установить, что использование шаблонов, сформированные по предлагаемому способу позволяет при уровне шума до 0,45 - 0,55 (в зависимости от набора эталонов) повысить вероятность правильного распознавания по сравнению с шаблонами, сформированными с использованием спинового стекла. В частности при уровнях шума, не превышающих 0,3. предложенный способ, по сравнению с использованием спинового стекла, позволяет сократить количество ошибок распознавания более чем в 2 раза, а при уровнях шума не превышающих 0,4 — в 1,5 раза. Графики, отражающие эти результаты приведены на рис. 5.

Также было установлено, что предлагаемый способ по сравнению со способом, использующим спиновое стекло, при всех уровнях шума обеспечивает меньшее среднеквадратичное отклонение вероятности правильного распознавания изображений текстовых знаков, т. е. лучше соответствует критерию «равнопрочности». Графики, отражающие эти результаты приведены на рис. 6.

Говоря о сравнении предлагаемого способа со способом, основанным на использовании спинового стекла, можно отметить, что еще одним преимуществом первого является возможность варьировать количество шаблонных элементов, а значит и уровень вычислительной сложности.

0.1 0.2 0.3 0.4 0.5

Интенсивность шума

Рис. 5: Зависимость вероятности правильного распознавания от уровня шума для табло-нов, построенных с использованием спинового стекла (сплошная линия) и с использованием энтропийных характеристик (штрихи).

В четвертой главе содержится описание разработанного устройства распознавания текстовых знаков, представляющего собой специализированный процессор.

Управление устройством распознавания осуществляется путем передачи ему команд. Команды могут сопровождаться дополнительными 8-битными входными данными. После завершения выполнения команды устройство распознавания может передавать внептему устройству дополнительные 8-битные выходные данные.

Особенностью устройства является то, что во многих случаях элементы эталонного и распознаваемого изображений обрабатываются не по одиночке, а в составе блоков, состоящих из восьми элементов. Такие блоки элементов в дальнейшем изложении называются октетами. Указанная особенность связана с тем, что в устройстве распознавания применен блок памяти с восьмиразрядными словами, что делает возможным запись и чтение октета элементов за одно обращение к памяти.

Логический символ устройства распознавания изображений текстовых знаков представлен на рис. 7.

Входы и выходы устройства распознавания имеют следующее назначение:

• вход ЯЗТ используется для сброса устройства в начальное состояние;

• вход СЬК — для тактирования;

• вход ЕМ — для запроса выполнения команды;

• входы СМОц... СМ Да — для передачи кода команды. Предусмотрены команды для формирования шаблонов, распознавания изображения знака, а также для записи эталонного и распознаваемого изображений в память устройства;

• входы Ц)... Д- — для передачи дополнительных входных данных;

• выход КОУ— для индикации того, что выполнение команды завершено;

• выходы <Э0...<?7 — для передачи дополнительных выходных данных.

Использованный в устройстве алгоритм формирования шаблонов включает три цикла: цикл вычисления информативности элементов эталона, цикл очистки памяти и цикл

Рис. б: Зависимость среднеквадратичного отклонения вероятности правильного распознавания от уровня шума для шаблонов, построенных с использованием спинового стекла (сплошная линия) и с использованием энтропийных характеристик (штрихи).

формирования шаблонов. Количество тактов, необходимых для выполнения этих циклов определяется выражениями

«мз = ((3 + la) п + (2 + 8 • (2 + Щ)т + 5) / = (1а + 3 )nl + (8/3 + 18) ml + 51, (33)

где п — количество знаков, т — количество октетов, I — общее количество элементов в шаблонах, а € (0,1] — коэффициент, показывающий как часто суммарная информативность элементов текущего шаблона, оказывается меньше наименьшей суммарной информативности, а — коэффициент, показывающий как часто информативность текущего элемента, оказывается больше наибольшей.

Таким образом, количество тактов tM, необходимое для выполнения всего алгоритма формирования шаблонов определяется выражением

tM = trn + tm + trn = 5 nm + (la + 3)ni+ (80 + 18) ml+3n-t-41m + 51. (34)

Из выражения (34) для tм можно получить неравенство 5пт + ЗЫ + 18т! + Зп + 41т + 51 < tM < 5пт + Ап1 + 26ml + Зп + 41т + 5i. (35)

С использованием О-нотации, время, затрачиваемое на формирование шаблонов, определяется выражением

0М = О (nm) + О (Ы) + О (mi). (36)

Использованный в устройстве алгоритм распознавания также включает три цикла: цикл очистки памяти, цикл вычисления дистанций и цикл поиска класса с наименьшей

Рис. 7: Логический символ устройства распознавания

дистанцией. Количество тактов, необходимых для выполнения этих циклов определяется выражениями

¿К = ((5а + 2) п -г 2) т = (5а + 2) пт + 2т, (39)

где п — количество классов, т — количество октетов, а е [0,1] — коэффициент, показывающий насколько часто встречаются октеты, содержащие по крайней мере один элемент, входящий в шаблон, а — коэффициент, показывающий как часто дистанция

между распознаваемым и текущим эталонным изображениями (с учетом шаблона), оказывается меньше наименьшей.

Таким образом, количество тактов необходимое для выполнения всего алгоритма распознавания определяется выражением

tR = {да + «м + ¿яз = (5а + 2) пт + (1/3 + 4) п + 2т. (40)

Из выражения (40) для Ьц можно получить неравенство

С использованием О-нотации, время, затрачиваемое на распознавание, определяется выражением

0я = 0(пт). (42)

Представляет интерес сравнение уровня временной сложности алгоритмов распознавания образов с использованием шаблонов и без них.

Рассмотрим устройство распознавания не использующее шаблоны, а во всем остальном сходное с разработанным. Для принятия решения о классификации в этом устройстве используется дистанция между распознаваемым образом и эталонами, но, в отличие от

предлагаемого устройства, эта дистанция вычисляется с использованием всех элементов эталонов и распознаваемого образа.

Можно установить, количество тактов, необходимое для выполнения второго цикла в устройстве, не использующем шаблоны, определяется выражением

=(6п + 2)т = 6пт + 2т. (43)

С использованием выражений (40) и (43), выигрыш в количестве тактов, необходимых предлагаемому устройству для распознавания образа, по сравнению с устройством, не использующим шаблонов, можно записать так

Де = - <и = (6пт + 2т) - ((5а + 2) пт + 2т) = (4 - 5а) пт. (44)

Из условия Л! > 0 можно определить, что использование шаблонов оправдано, если а < 4/5, т. е. когда октеты, в которых, по крайней мере, один элемент входит в шаблон, составляют менее 80% от общего количества октетов.

Для набора эталонных изображений, представленных на рис. 1, приведенные формулы позволяют установить, что использование шаблонов сокращает в тактах время распознавания в 1,3-1,7 раза.

Разработанное устройство описано и смоделировано на языке УИБЬ.

Основные результаты работы

1. Найдена связь между энтропийными характеристиками элементов эталонного изображения и вероятностью правильного распознавания.

2. Разработан способ оценки информативности элементов эталонных изображений, основанный на вычислении средневзвешенной энтропии.

3. Разработан способ формирования шаблонов на основе оденки информативности элементов эталонных изображений.

4. Разработана программа моделирования распознавания текстовых знаков, заданных двоичными эталонным изображениями. Проведенное, при помощи разработанной программы, моделирование показало, что при использовании одинакового количества шаблонных элементов предлагаемый способ формирования шаблонов позволяет сократить количество ошибок распознавания в 1,5-2 раза по сравнению с использованием спинового стекла при условии того, что зашумленность распознаваемого образа не превосходит 0,45-0,55.

5. Разработано устройство распознавания, реализующее предлагаемый способ формирования шаблонов и обеспечивающее тем самым меньшее количество ошибок распознавания по сравнению с устройством, использующим спиновое стекло, при одинаковых вычислительных затратах на этапе распознавания. Предложенное устройство позволяет сократить вычислительные затраты на этапе распознавания, по сравнению с устройством, не использующими шаблоны, в 1,3-1.7 раза.

Список работ, опубликованных по теме диссертации

[1] Старков Ф. А., Бородин М. В. О взаимосвязи качества распознавания и расстояния между эталонами //Материалы третьей Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий». - Улан-Уде: ВСГТУ, 2002. - С. 113-116.

[2] .Бородин М. В. Об использовании нелинейного преобразования при распознавании образов //Тезисы докладов XXXI вузовской научно-технической конференции «Молодежь и XXI век». — Курск: КГТУ, 2003. - С. 98.

[3] Старков Ф. А.. Бородин М. В. О способе формирования шаблонов с использованием энтропии //Материалы четвертой Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий». — Улан-Уде: ВСГТУ, 2003. - С. 62-65.

[4] Бородин М. В. Устройство распознавания образов по шаблонам //Материалы первой международной научно-технической конференции «Современные инструментальные системы, информационные технологии и инновации». — Курск: КГТУ, 2003. — С. 5962.

|5] Старков Ф. А., Бородин М. В. Способ формирования шаблонов на основе векторного показателя различимости //Сборник материалов 6-ой Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации». — Курск: КГТУ, 2003. — С. 108-110.

[6] Старков Е. Ф.. Бородин М. В. Устройство распознавания биомедицинской информации. //Системный анализ и управление в биомедицинских системах. — М., 2003 г., Т. 2, № 4, С. 350-353.

Подписано в печать_._._г. Формат 60 х 84 1/16.

Печ. листов 1,25. Тираж 100 экз. Заказ и$_.

Издательско-полиграфический центр Курского государственного технического университета, 305040, г. Курск, ул. 50 лет Октября, 94

- 1 40 7«

Оглавление автор диссертации — кандидата технических наук Бородин, Михаил Владимирович

Введение

1 Методы и устройства распознавания символов

1.1 Ввод информации.

1.2 Кодирование.

1.3 Предварительная обработка.

1.4 Распознавание.

1.5 Обучение.

1.6 Устройства распознавания текстовых знаков.

1.7 Выводы.

2 Способ формирования шаблонов

2.1 Способ оценки информативности элементов двоичных эталонных изображений

2.2 Обобщение способа оценки информативности элементов на случай цветных изображений.

2.3 Способы формирования шаблонов на основе информативности элементов

2.4 Связь между вероятностью правильного распознавания и расстоянием между эталонами.

2.5 Выводы.

3 Моделирование распознавания

3.1 Моделирующая программа.

3.2 Результаты моделирования.

3.3 Выводы.

4 Описание устройства распознавания

4.1 Устройство распознавания.

4.2 Блок формирования шаблонов.

4.3 Блок распознавания.

4.4 Выводы.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Бородин, Михаил Владимирович

Создание текстов в электронной форме, при помощи персонального компьютера, в последние десять-пятнадцать лет стало повседневной практикой. Сейсас абсолютное большинство создаваемой офисной, научной и конструкторской документации представлено именно в электронной форме. Возникли и получили широкое распространение электронные библиотеки и базы данных научной, технической и учебной направленности.

Вместе с тем, в настоящее время, огромный массив текстовой информации по-прежнему доступен лишь на бумажных носителях. Нет необходимости подробно останавливаться на всех недостатках указанной ситуации — они очевидны. Достаточно упомянуть лишь о том, что поиск информации в электронном издании обычно занимает несколько секунд, в то время как для поиска той же информации в том же издании на бумажном носителе может потребоваться до нескольких часов.

Процесс перевода текстовой информации в электронную форму обычно состоит из двух этапов — сканирования и распознавания. К настоящему моменту разработано множество способов распознавания текстовых символов и целый ряд систем, реализующих эти способы. Большинство из них являются программными реализациями, среди которых есть несколько популярных пакетов OCR (Optical Character Recognition — оптическое распознавание символов). Современные программные реализации алгоритмов распознаг вания, как правило, приспособлены ко вводу единичных документов и мало подходят для обработки больших массивов текстовой информации по причине недостаточного быстродействия. Причина этому — плохая приспособленность универсальных компьютеров к решению как задач распознавания изображений текстовых знаков в частности, так и задач обработки изображений вообще.

Путь к достижению высокой скорости распознавания состоит в создании высокопроизводительных специализированных устройств распознавания. Применение таких устройств должно помочь решению проблемы массового перевода бумажных текстовых документов в электронную форму. В настоянщее время известен ряд устройств распознавания, однако большинство из них характеризуется недостаточной вероятностью правильного распознавания или повышенной вычислительной сложностью.

В связи с вышеизложенным, научно-техническая задача повышения вероятности правильного распознавания, а также скорости распознавания изображений текстовых знаков является актуальной.

Работа выполнена в рамках гранта Министерства образования и науки Российской Федерации 1.10.98 «Разработка фундаментальных основ и алгоритмического обеспечения автоматизированных систем обработки изображения» и темы 1-37.02 «Разработка программных средств обработки измерительной информации».

Объект исследования

Объектом исследования является процесс распознавания текстовых знаков. Цель работы

Цель работы состоит в повышении вероятности правильного распознавания текстовых знаков при вводе текстов с бумажных носителей путем разработки способа распознавания, с использованием шаблонов, сформированных на основе энтропийных характеристик элементов эталонов, и быстродействующего устройства, реализующего этот способ.

Задачи, решаемые в работе

1. Исследование зависимости вероятности правильного распознавания от энтропийных характеристик элементов эталонов и разработка способа определения информативности элементов на ее основе.

2. Разработка способа формирования шаблонов, на основе информативности элементов эталонов.

3. Сравнительное исследование предлагаемого способа формирования шаблонов и известного способа, основанного на использовании спинового стекла.

4. Разработка устройства, реализующего предложенный способ распознавания.

Методы исследования

При решении поставленных задач использовались методы теории проектирования элементов и устройств вычислительной техники и устройств управления, теории цифровых автоматов, теории алгоритмов, теории вероятностей и математического моделирования.

Научная новизна

1. Установлена связь между энтропийными характеристиками элементов эталонных изображений и вероятностью правильного распознавания знаков,-позволяющая оценить информативность элементов через их энтропийные характеристики.

2. Разработан способ оценки информативности элементов эталонных изображений на основе энтропийных характеристик.

3. Разработан способ формирования шаблонов на основе оценки информативности элементов эталонных изображений, позволивший снизить выроятность ошибки распознавания.

Практическая ценность

Практическая ценность работы заключается в разработке алгоритмических, аппаратных и программынх средств для распознавания изображений текстовых знаков. Предложенные алгоритмы могут найти широкое применение в системах распознавания текстовых знаков. Использование разработанных аппаратных средств позволит повысить вероятность правильного распознавания текстовых знаков при сохранении скорости распознавания, присущей наиболее быстродействующим устройствам этого класса.

Положения, выносимые на защиту

1. Способ оценки информативности элементов эталонных изображений на основе энтропийных характеристик.

2. Способ формирования шаблонов на основе оценки информативности элементов эталонных изображений.

3. Структурно-функциональная организация устройства распознавания изображений текстовых знаков.

Реализация и внедрение результатов исследований

Результаты работы внедрены в ОКБ «Авиаавтоматика», а также в учебном процессе кафедры «Программное обеспечение вычислительной техники» Курского государственного технического университета в рамках дисциплин «Методы и алгоритмы обработки изображений», «Высокоскоростные системы обработки символьной информации» и «Моделирование»

Апробация работы

Основные результаты диссертационной работы докладывались на:

1. III и IV Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2002 и 2003 гг.);

2. XXXI вузовской научно-технической конференции «Молодежь и XXI век» (Курск 2003 г.);

3. I Международной научно-технической конференции «Современные инструментальные системы, информационные технологии и инновации» (Курск, 2003 г.);

4. VI Международной конференции «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации» (Курск 2003 г.).

Публикации

Результаты исследований отражены в шести печатных работах. В работе [62] лично автором проведено моделирование распознавания с использованием различных наборов эталонов и установлена количественная связь между расстоянием между эталонами в пространстве признаков и вероятностью правильного распознавания. В работе [10] автором предложен алгоритм распознавания с использованием нелинейных преобразований. В работах [60, 63, 64] лично автором разработан способ формирования шаблонов на основе энтропийных характеристик эталонов, а также проведено моделирование распознавания с использованием этих шаблонов. В работах [9, 60] лично автором разработана структурно-функциональная схема устройства распознавания текстовых символов с использованием шаблонов.

Структура работы

Материалы исследований излагаются в четырех главах диссертации, введении, заключении и приложениях.

В первой главе проведен аналитический обзор методов и устройств распознавания символьной информации.

Во второй главе проведено исследование энтропийных характеристик элементов эталонов и их связи с вероятностью верного распознавания предъявленных образов. Также в этой главе рассматривается способ формирования шаблонов на основе вышеназванных характеристик.

В третьей главе описываются программные средства для проведения моделирования распознавания образов по предлагаемому методу, а также представлены результаты моделирования распознавания цифр по их черно-белым изображениям.

В четвертой главе описывается устройство, реализующее предложенный способ формирования шаблонов и распознавания образов.

В приложениях представлены исходные тексты программ моделирования алгоритма и устройства распознавания.

Область возможного применения

Разработанное устройство может быть использовано в системах автоматического чтения текстов при вводе их с бумажных носителей.

Заключение диссертация на тему "Устройство распознавания изображений текстовых знаков по энтропийным характеристикам"

4.4 Выводы

1. Разработан алгоритм функционирования устройства распознавания образов с использованием шаблонов, основанных на энтропийных характеристиках.

2. На основе разработанного алгоритма синтезировано устройство распознавания.

Заключение

1. Разработан способ определения информативности элементов эталонов, основанный на вычислении изменения энтропии в процессе распознавания, взвешенного с учетом вы-роятности появления реализации каждого класса. Способ может использоваться как с двоичными эталонами, так и с эталонами, элементы которых принадлежат некоторому конечному множеству.

2. Разработан способ формирования шаблонов на основе анализа информативности элементов эталонов, позволяющий регулировать уровень вычислительной сложности процесса распознавания путем задания общего количества шаблонных элементов.

3. Разработана программа моделирования распознавания образом, заданых двоичными эталонами. Программа позволяет формировать шаблоны на основе предлагаемого способа или с использованием спинового стекла, а также формировать тестовые последовательности образов и распознавать как с использованием шаблонов, так и без такового. Проведенное, при помощи разработанной программы, моделирование показало, что при использовании одинакового количества шаблонных элементов предлагаемый способ формирования шаблонов позволяет сократить количество ошибок распознавания в 1,5-2 раза по сравнению с использованием спинового стекла при условии того, что зашумленность распознаваемого образа не превосходит 45-55%.

4. Разработанно устройство распознавания, реализующее предлагаемый способ формирования шаблонов и обеспечивающее тем самым меньшее количество ошибок распознавания по сравнению с устройством, использующим спиновое стекло, при одинаковых вычислительных затратах на этапе распознавания. Также предложенное устройство позволяет сократить вычислительные затраты на этапе распознавания по сравнению с устройством, не использующими шаблоны.

Библиография Бородин, Михаил Владимирович, диссертация по теме Элементы и устройства вычислительной техники и систем управления

1. Предобработка ультразвуковых снимков с помощью нейронных сетей Хопфилда / Агапкин О. А., Орлов Ю. В., Персианцев И. Г., Доленко С. А. // Распознавание образов и анализ изображений: б-ая Междунар. конф. 21-26 октября 2002. — Новгород, 2002. - С. 1-6.

2. А. с. № 1508255. Устройство для распознавания графических изображений / Акимов В. М. и др. МКИ G 06 К 9/00.

3. А. с. № 1418775. Устройство для считываения стилизованных знаков / Алферьев Н. А. и др. МКИ G 06 К 9/18.

4. Аникин И. В., Шагиахметов М. В. Методы нечеткой обработки, распознавания и анализа изображений // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002. — Новгород, 2002. — С. 16-21.

5. Арлозоров В. В. Cognitive Form: Распределенная система потокового распознавания стандартных форм документов // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002 г. — Новгород, 2002. — С. 41-46.

6. Методы цифровой обработки изображений / А. Е. Архипов, С. В. Дегтярев, С. С. Садыков и др. Ч. 2 — Курск: Изд-во Курск гос. техн. ун-та. 2002. — 118 с.

7. Бородин М. В. Устройство распознавания символов по шаблонам. / Современные инструментальные системы, информационные технологии и инновации: Междунар. науч.техн. конф. Курск: КГТУ, 2003. - С. 59-62.

8. Бородин М. В. Об использовании нелинейного преобразования при распознавании образов. / Молодежь и XXI век: Вуз. науч.-техн. конф. — Курск: КГТУ, 2003. — С. 98-99.

9. А. с. JST* 760134. Устройство для распознавания образов / Боюн В. П. и др. — МКИ G 06 К 9/00.

10. Бутаков Е. А. и др. Обработка изображений на ЭВМ. — М.: Радио и связь, 1987. — 250 с.

11. Вапник В. Н., Червоненкис А. Я. Теория распознавания образов. — М.: Наука, 1974. 416 с.

12. Ветров Д. П. Об устойчивости алгоритмов распознавания образов // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002. — Новгород, 2002. С. 96-100.

13. А. с. JV« 1339601. Устройство для распознавания изображений / Гавришин А. И. и др. МКИ G 06 К 9/00.

14. А. с. № 1652984 Способ формирования признаков при распознавании изображений объектов / Гордиенко В. И. и др. — МКИ G 06 К 9/18.

15. А. с. № 746610. Способ распознавания изображений / Грицык В. В. и др. — МКИ G 06 К 9/00.

16. Гуревич И. В., Коребкина И. В. Метод классификации изображений на основе их информационных характеристик // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002. — Новгород, 2002. — С. 172-177.

17. А. с. JV® 2003174. Способ распознавания изображений / Деныциков И. К. и др. — МКИ G 06 К 9/00.

18. А. с. № 945875. Способ автоматической классификации знаков и устройство для его осуществления / Диетер Ш. — МКИ G 06 К 9/00.

19. Дорофенюк А. А. Алгоритмы автоматической классификации. // Автоматика и телемеханика, 1971, №12, с. 78-113.

20. А. с. JV® 1583946. Устройство для коррекции изображений / Државетский А. Л. — МКИ G 06 К 9/00.

21. А. с. N® 1631562. Устройство для селекции дефектов изображений / Државетский А. Л. МКИ G 06 К 9/16.

22. Дуда Р., Харт П. Распознавание образов и анализ сцен. — М.: Мир, 1976. — 512 с.

23. Еремин И. И., Мазуров В. Д. Кусочно-аффинная разделяющая функция в распознавании // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26октября 2002. — Новгород, 2002. — С. 224-226.

24. А. с. № 1575211. Устройство для распознавания образов / Ефимов Ю. Н. — МКИ G 06 К 9/00.

25. Жгун Т. В., Киросянов Б. Ф. Распознавания двоичной информации, перемешанной со случайными символами // Распознавание образов и анализ изображений: 6-ая Между-нар. конф. 21-26 октября 2002. — Новгород, 2002. — С. 231-233.

26. А. с. № 1543431. Устройство для идентификации текстовых изображений / Жук Ю. К. и др. МКИ G 06 К 9/00.

27. Забияка Ю. И. Инвариантный критерий близости контуров, основанный на представлении изображений неравномощными множествами признаков // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002. — Новгород, 2002. С. 233-237.

28. Загоруйко Н. Г. Методы распознавания и их применение. — М.: Книга, 1972.

29. А. с. № 1236518. Устройство для распознавания рукописных символов / Зубарев Ю. Б. МКИ G 06 К 9/00.

30. А. с. J№ 1164749. Устройство для считывания символов / Исмаилов Т. К. и др. — МКИ G 06 К 9/00.

31. Катыс Г. П. Восприятие и анализ оптической информации автоматической системой. — М.: Машиностроение, 1986. — 415 с.

32. Катыс Г. П. Обработка визуальной информации. — М.: Машиностроение, 1990. — 314 с.

33. А. с. № 1298782. Устройство для распознавания цифр / Корнейчук В. И. и др. — МКИ G 06 К 9/00.

34. А. с. № 1658181. Устройство для логической обработки изображений / Красиленко В. Г. и др. МКИ G 06 К 9/00.

35. А. с. № 1668984. Устройство для логической обработки изображений / Красиленко В. Г. и др. МКИ G 06 К 9/00.

36. А. с. № 1107139. Устройство для распознавания стилизованных цифр / Кудрявцев В. Б. и др. МКИ G 06 К 9/00.

37. А. с. № 1244683. Устройство для распознавания образов / Латышенок Н. Н. и др. — МКИ G 06 К 9/00.

38. Логинов А. И. Системы технического зрения. — М.: МИРЭА, 1991.

39. А. с. № 1705843. Устройство для корреляционной обработки изображений / Май-орчук М. А., Самохин Ю. С. МКИ G 06 К 9/00.

40. А. с. № 1101856. Устройство для считывания и распознавания нормализованных символов / Осипов JI. А. — МКИ G 06 К 9/00.

41. А. с. № 1229784. Устройство для считывания стилизованного шрифта / Осипов. JI. А. МКИ G 06 К 9/00.

42. Осовский С. Нейронные сети для обработки информации. — М.: Финансы и статистика, 2002. — 344 с.

43. А. с. № 1665395. Устройство для распознавания изображений объектов / Попов. М. А. МКИ G 06 К 9/00.

44. Постников В. В. Идентификация и распознавание документов заранее известной структуры // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002 г. — Новгород, 2002. — С. 459-464.

45. Пратт Т., Зелковиц М. Языки программирования. Разработка и реализация. — СПб.: Питер, 2002. 688 с.

46. Прет У. Цифровая обработка изображений: В 2-х кн.: Пер. с англ. — М.: Мир, 1972 г. Кн. 1. 312 е., Кн. 2. - 480 с.

47. Принс М. Д. Графические методы связи человек — вычислительная машина при машинном проектировании. // ТИИЭР. — 1966. №16. — с. 78.

48. Пытьев Ю. П., Чуличнов А. И. Морфологический анализ изображений: принципы и применение // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002. — Новгород, 2002. — С. 464-469.

49. Рахманкулов В. 3. и др. Алгоритм распознавания объемных образов на базе модифицированного метода максимальной клики. / Сб. тр. Института системного анализа РАН. М.: РАН, 2002 г.

50. Розенфельд А. Распознавание и обработка изображений. — М.: Мир, 1972. — 230 с.

51. Распознавание оптических изображений / Под. ред. Ю. С. Сагдулаева, В. С. Титова. — Ташкент: ТЭИС, 2000. 315 с.

52. Сайфер В. А. Компьютерная обработка изображений // Методы и алгоритмы: Соровский образовательный журнал. — 1996. 3. — с. 110-121.

53. Семерий О. С. Распознавание геометрических объектов с помощью функций расстояния // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002 г. — Новгород, 2002. — С. 484-491.

54. Старков Е. Ф. Устройство выделения ядра класса изображений. / Тр. Юбилейной науч. конф. Курск: КГТУ, 1995. — С. 62-64.

55. Старков Е. Ф. Нейронно-структурная модель распознавания изображений символов. / Тез. докл. Юбилейной конф. ученых Курского политехнического института. — Курск: КПИ, 1994. С. 98-100.

56. Старков Е. Ф., Титов В. С. Использование спинового стекла для получения шаблонов символов // Автоматика и телемеханика. — М., 1999, № 9. — С. 144-154.

57. Старков Е. Ф., Бородин М. В. Устройство распознавания биомедицинской информации. // Системный анализ и управление в биомедицинских системах. — М., 2003, Т. 2, № 4. С. 350-353.

58. А. с. № 2178916. Устройство для распознавания изображений символов / Старков Е. Ф., Старков Ф. А. МКИ G 06 К 9/00.

59. Старков Ф. А., Бородин М. В. О взаимосвязи качества распознавания и расстояния между эталонами. / Теоретические и прикладные вопросы современных информационных технологий: Всерос. научн.-техн. конф. — Улан-Удэ: ВСГТУ, 2002. — С. 113-116.

60. Старков Ф. А., Бородин М. В. О способе формирования шаблонов с использованием энтропии. / Теоретические и прикладные вопросы современных информационных технологий: Всерос. научн.-техн. конф. — Улан-Удэ: ВСГТУ, 2002. — С. 62-65.

61. Суворова Е. А., Шейнин Ю. Е. Проектирование цифровых систем на VHDL. — СПб.: БХВ-Петербург, 2003. 576 с.

62. Файн В. С. Описание изображений: основы непрерывно-групповой теории и ее приложения. — М.: Наука, 1970. — 296 с.

63. А. с. № 1387025. Устройство для распознавания образов / Федотов Н. Г. — МКИ G 06 К 9/00.

64. Федотов Н. Г., Шульга Л. А. Теория распознавания образов, основанная на статистической геометрии // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002 г. — Новгород, 2002. — С. 579-586.

65. Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов. — М.: Радио и связь, 1986. — 185 с.

66. Фор А. Восприятие и распознавание образов. — М.: Машиностроение, 1989. — 272 с.

67. Фу К. Структурные методы в распознавании образов. — М.: Мир, 1977. — 319 с.

68. Быстрые алгоритмы в цифровой обработке изображений. Пер. с англ. / Под ред. Т. Хуанга. — М.: Радио и связь, 1984. — 221 с.

69. Чикин В. А. Структура данных для представления изображений // Зарубежная радиоэлектроника. — 1983. №8. — С. 87-103.

70. А. с. N® 1583946. Устройство для фильтрации изображений / Широков В. А., Маркова А. Г. МКИ G 06 К 9/00.

71. А. с. № 945875. Способ автоматической классификации знаков и устройство для его осуществления / Шнейдер Д. — МКИ G 06 К 9/16.

72. Шоломов Д. Л. Идентификация нечетко распознанных текстовых конструкций // Распознавание образов и анализ изображений: 6-ая Междунар. конф. 21-26 октября 2002 г. — Новгород, 2002. — С. 623-627.

73. Яншин В. В. Анализ и обработка изображений: принципы и алгоритмы. — М.: Машиностроение, 1995. — 112 с.

74. Berikov V. В., Lbov G. S., Litvinenko A. G. Evaluation of Recognition Performance for Discrete Classifier // Pattern Recognition and Image Understanding: The 6th German-Russian workshop. August 25-30, 2003, Novosibirks, 2003, — pp. 34-38.

75. Fernandez G., Huntsberger T. Wavelet-based system for recognition and labeling of polyhedral junctions // Optical Engineering. — 2003. V. 37, N. 1. — pp. 158-166.

76. Freeman H. On the Encoding of Arbitrary Geometric Configurations. // IRE Trans. V. EC-10 (2). 1961. №6. - pp. 260-268.

77. Gusev V. D., Nemytikova L. A., Chuzhanova N. A. Adaptive Algorithm of Pattern Matching in Symbolic Sequences // Pattern Recognition and Image Understanding: The 6th German-Russian workshop. August 25-30, 2003, Novosibirks, 2003. — pp. 42-46.

78. Lossan N. Werden Computer denken wie wir? // VFI nachnchten magazin. — 1989.2. pp. 30-33.

79. Michalski R. S. et Dedoy E. A recent advance in data analysis. // North Holland Edit. — 1981. pp. 33-56.

80. Nedel'ko V. M. Voting by Several Decision Rules and Bayesian Strategy of Precision // Pattern Recognition and Image Understanding: The 6th German-Russian workshop. August 25-30, 2003, Novosibirks, 2003, — pp. 51-55.

81. Ogawa H. Image reconstruction from incomplete projection. IEEE. — 1982. — pp. 534539.

82. Pestunov I. Adaptation of the Nonparameterical Rosenblatt-Parzen classifiers to Non-stationary of Classes // Pattern Recognition and Image Understanding: The 6th German-Russian workshop. August 25-30, 2003, Novosibirks, 2003. — pp. 55-58.

83. Postnikov V. V., Shalomov D. L., Marchenko A. E. Flexidocs: The Template Driven Document Recognition Technology // Pattern Recognition and Image Understanding: The 6th German-Russian workshop. August 25-30, 2003, Novosibirks, 2003. — pp. 194-198.

84. Quintiliano P., Santa-Rosa A. Landsat Images Classification Based on KLI with Multiple Threshold // Pattern Recognition and Image Understanding: The 6th German-Russian workshop. August 25-30, 2003, Novosibirks, 2003. — pp. 198-202.

85. Taketsugu Yao, Takumi Minemoto Pattern recognition by quantization of modulated function to complexes of a quadrupole on matched filtering // Optical Engineering. — 2003, V. 42, N. 10. pp. 2994-3004.