автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.05, диссертация на тему:Исследование и разработка методов распознавания символов в ортокоординатной ассоциативной среде

кандидата технических наук
Мд. Абдул Малек
город
Москва
год
2004
специальность ВАК РФ
05.13.05
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка методов распознавания символов в ортокоординатной ассоциативной среде»

Автореферат диссертации по теме "Исследование и разработка методов распознавания символов в ортокоординатной ассоциативной среде"

На правах рукописи

Мд. Абдул Малек

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ РАСПОЗНАВАНИЯ СИМВОЛОВ В ОРТОКООРДИНАТНОЙ АССОЦИАТИВНОЙ СРЕДЕ

Специальность: 05.13.05 " Элементы и устройства вычислительной техники и систем управления "

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата технических наук

Москва-2004

Работа выполнена на кафедре Вычислительной техники Московского энергетического института (Технического университета).

Научный руководитель: доктор технических наук, профессор

Огнев Иван Васильевич

Официальные оппоненты: доктор технических наук, профессор

Борисов Вадим Владимирович

доктор технических наук, профессор Пескова Светлана Александровна

Ведущая организация: Научно-исследовательский электро-

механический институт, г. Москва

Защита состоится «ад. » 2005 г. в 16 час. 00 мин. на заседа-

нии Диссертационного совета Д 212.157.01 при Московском энергетическом институте (Техническом университете) по адресу: 111250, г. Москва, ул. Красноказарменная, д. 17 (ауд. Г-306).

С диссертацией можно ознакомиться в библиотеке Московского энергетического института (Технического университета).

Отзывы в двух экземплярах, заверенные печатью организации, просьба направлять по адресу: 111250, г. Москва, Красноказарменная ул. Д. 14, Ученый совет МЭИ (ТУ).

Автореферат разослан

2004.

Ученый секретарь

Диссертационного совета Д 212.157.01 к. т. н., профессор

Ладыгин И. И.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы

Стремительное развитие информационных технологий обусловлено универсальностью функциональных возможностей ЭВМ и проникновением ЭВМ во все сферы человеческой деятельности. При этом постоянно растущие скорость вычислений и объем хранимой в ЭВМ информации не могут в полной мере удовлетворить потребностей практики применения информационных технологий. Тем более, что возможности современной элементной базы и классической архитектуры аппаратных средств ЭВМ по быстродействию и производительности приближаются к физическим пределам. Выход за эти пределы возможен только при реализации новых идей в области аппаратно-программных средств и применения новых технологий, в частности, путем разработки методов и средств искусственного интеллекта, сочетающих в себе формальные подходы с эвристическими приемами, присущими человеку, основанными на принципах адаптации к окружающим условиям. Анализ показывает, что решение интеллектуальных задач основывается на специфических методах обработки огромного объема информации в условиях неполной или нечетко заданной информации. Попытки применения классических методов обработки данных в этих условиях требуют всё большего повышения быстродействия процессора и емкости памяти ЭВМ.

Ассоциативная организация памяти, совмещающая функции хранения и обработки информации, позволяет в определенной мере решать эти проблемы. Ассоциативный способ доступа к информации основан на установлении взаимосвязи, ассоциации между хранимой в ЗУ информации и поисковыми аргументами. Запоминающие устройства, в которых использован такой способ доступа, получили название ассоциативных ЗУ (АЗУ). АЗУ характеризуются двумя основными признаками:

• доступ к хранимой информации в АЗУ осуществляется исходя из её содержания;

• при каждом обращении к АЗУ возможен параллельный доступ ко всей хранящейся информации.

Эти два признака определяют возможность обработки данных непосредственно в логико-запоминающей среде АЗУ, и обеспечивают параллельную обработку информации.

АЗУ, реализующие помимо стандартных операций ассоциативной обработки информации, функции преобразования многомерной информации, называют многокоординатным АЗУ (МКАЗУ). Ассоциативное проецирование, ассоциативный поиск, ассоциативный опрос, комбинированные виды ассоциативных взаимодействий, определяющие концепцию иерархической по размерности многокоординатной ассоциативной памяти, позволяют выделить новый класс АЗУ - ортокоординатные АЗУ (ОКАЗУ). ОКАЗУ являются перспективным направлением в развитии интеллектуальных ЗУ. Они позволяют производить более эффективное по сравнению с традиционным АЗУ выполнение локальных и глобальных вычислений, линейных и нелинейных вычислений, интенсивное использование логико-запоминающей среды АЗУ, объектно и коор-динатно ориентированных вычислений, символьных вычислений и вычислений на элементах, контекстно свободных и контекстно зависимых вычислений.

Данная работа посвящена исследованию свойств ортокоординатной ассоциативной среды (ОКАС), применению их для обработки информации и разработке на основе результатов исследований методов и алгоритмов распознавания символьной информации. Работа является дальнейшим развитием работ, проводимых на кафедре Вычислительной техники Московского энергетического института под руководством профессора Огнева И. В.

Цель работы состоит в исследовании свойств ортокоординатной ассоциативной среды и в разработке новых методов распознавания символов в ор-токоординатной ассоциативной среде.

Для достижения поставленной цели в диссертации решаются следующие основные задачи:

• исследование свойств ортокоординатной ассоциативной среды, обеспечивающей совмещение функций хранения и обработки информации;

• разработка методов и алгоритмов предварительной обработки символов в ортокоординатной ассоциативной среде;

• разработка метода опроса и алгоритма распознавания символов в ортоко-ординатной ассоциативной среде;

• разработка метода секущих отрезков и алгоритма распознавания символов в ортокоординатной ассоциативной среде;

• разработка метода выделения характерных узлов символов и алгоритмов распознавания в ортокоординатной ассоциативной среде.

Объектом исследований являются ортокоординатные ассоциативные среды, применение их для разработки методов и алгоритмов предварительной обработки, кластеризации и распознавания символьной информации.

Методы исследования базируются на теориях арифметических и логических основ вычислительной техники, системного анализа. Экспериментальные исследования, для подтверждения полученных в ходе диссертационной работы результатов, проводились на основе моделирования на ЭВМ. Научная новизна работы заключается в следующем:

• разработаны и исследованы методы и алгоритмы предварительной обработки символов в ортокоординатной ассоциативной среде;

• разработаны методики реализации алгоритмов предварительной обработки символов в ортокоординатной ассоциативной среде для применения их в задачах распознавания;

• разработаны методы распознавания символов в ортокоординатной ассоциативной среде;

• разработаны алгоритмы распознавания символов на основе предложенных методов;

• разработаны методики и программы реализации алгоритмов распознавания символов в ортокоординатной ассоциативной среде. Практическая ценность

Практическая ценность работы состоит в следующем:

• разработаны информационные программные модели предварительной обработки символов в ортокоординатной ассоциативной среде;

• разработаны программы кластеризации и распознавания символов в ор-токоординатной ассоциативной среде;

• разработаны библиотеки нормированного представления символов в ассоциативной среде.

Достоверность научных положений выводов и практических рекомендаций, сформулированных в диссертации, подтверждается вычислительными экспериментами и данными, полученными при моделировании на ЭВМ.

Апробация работы Основные результаты работы докладывались на: международных форумах информатизации МФИ-2000, МФИ-2002 и МФИ-2003 «Информационные средства и технологии», секция «Интеллектуализация современных информационных средств и систем», и на девятой международной научно-технической конференции студентов и аспирантов, Москва-2003.

Публикации Основные результаты диссертации опубликованы в 4-х печатных работах.

Структура и объем диссертационной работы Диссертация состоит из введения, пяти глав, заключения, списка литературы из 71 наименования и четырех приложений. Работа содержит 152 страницы текста, включая 34 рисунка, 22 таблицы, 6 страниц библиографии.

Основные научные положения, выносимые на защиту:

1. методы и алгоритмы предварительной обработки символов в ортокоординат-ной ассоциативной среде;

2. метод и алгоритм распознавания символов с помощью опросов нормализованных кодов символов в ортокоординатной ассоциативной среде;

3. метод и алгоритм распознавания символов методом выбранных секущих отрезков в ортокоординатной ассоциативной среде;

4. метод и алгоритм распознавания символов выделением характерных узлов в ортокоординатной ассоциативной среде.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность исследуемой проблемы, сформулирована цель и задачи диссертационной работы, перечислены полученные в диссертации новые результаты, их практическая ценность, представлены положения, выносимые на защиту и описана структура диссертации.

В первой главе приводится обзор ортокоординатных ассоциативных сред и их функциональных возможностей, классификация методов кластеризации и распознавания символов, основанных на использовании понятий метрического пространства, полуметрик и понятия частичного упорядочения.

Одной из областей эффективного применения ассоциативных сред является цифровая обработка изображений.

Для разработки алгоритмов обработки изображений широко используется клеточная логика. Операции клеточной логики применяются в основном для решения задач предварительной обработки изображений, например, для определения размеров, формы и площади отдельных компонент изображений, для повышения резкости, изменения контраста, фильтрации по толщине, устранения помех типа "бахромы", фильтрации случайных отклонений, ликвидации микроразрывов, мелких пробелов (пустот) внутри связных областей.

В большинстве случаев рассматривается квадратная мозаика со связностью элементов, равной четырем (окрестность фон Неймана), или со связностью, равной восьми (окрестность Мура). В алгоритмах предварительной обработки, исследуемых в данной диссертационной работе, используется окрестность Мура. Задачи предварительной обработки изображений являются задачами нечисловой обработки данных. При их решении необходимо выполнение большого числа такой нечисловой операции как поиск.

Принципы организации многокоординатной ассоциативной среды можно проиллюстрировать на примере ортокоординатной ассоциативной среды с двумя координатами доступа (Рис. 1).

управления

Рис. 1. Структурная схема ортокоординатной ассоциативной среды.

Одним из свойств поиска информации в ассоциативной среде является возможность выявления трех ситуаций результата поиска информации:

1) Отсутствие совпадений (искомой информации в ассоциативной среде нет).

2) Однократное совпадение (искомая информация находится в одной ячейке).

3) Многократное совпадение (искомая информация находится в двух и более ячейках).

Идентификация этих ситуаций пройсходит с помощью блоков D1 и Q1 -по координате X, D2 и Q2 - по координате ^

В соответствии с функциональными возможностями ортокоординатной ассоциативной среды (ОКАС) обеспечивает выполнение следующих режимов работы: Строчная/столбцовая маскируемая запись/мультизапись, маскируемое прямое/инверсное чтение, ассоциативной последовательный/параллельный поиск по критерию «равно».

Рассмотренные возможности ОКАС и средства их аппаратной реализации показывают, что к основным операциям, выполняемым в ОКАС, практическии без выделения существенных дополнительных аппаратных средств и без

дополнительных временных затрат, следует отнести логические операции, на которых, в частности, основываются алгоритмы распознавания символов. Анализ методов и алгоритмов распознавания символьной информации показывает, что основными операциями при этом является такие операции как сравнение кодов, сдвиг кода, логические операции, отрицание, сложение и умножение.

В данной работе для распознавания символов русского алфавита применяются эвристические методы, основанные на "геометрических" свойствах изображений символов, а именно на подсчете количества точек пересечения символа секущей линией. Определены принципиальные возможности применения ортокоординатной ассоциативной среды для повышения скорости выполнения кластеризации и распознавания символов за счет множественной выборки информации и совмещения функций хранения и обработки данных в ортокоординатной ассоциативной среде.

Во второй главе рассматриваются задачи предварительной обработки изображения, представленного в растровом виде. Эти задачи включают в себе стирание бахромы, заполнение пустот и утоньшение линий.

К случайным отклонениям в растровом изображении символа относятся незначительные выступы и впадины по длине линий, различные отростки и хвостики - так называемая бахрома.

Метод стирания бахромы заключается в просмотре всего растра и удалении в нем концевых точек. Предполагается, что точка принадлежит бахроме, если она концевая, то есть из восьми точек окружения типа окрестности Мура данной точки не менее семи из них имеет значение "0". Стирание концевых точек можно рассматривать как способ устранения шумов в виде бахромы и небольших изолированных групп точек, образующих фон.

Алгоритм стирания бахромы состоит из четырех частей и заключается в выявлении и стирании концевых точек сверху, снизу, справа и слева. Основой алгоритма является процедура анализа окрестности Мура точки растра. Выбираются четыре направления окрестности точки — по горизонтали, по вертикали

и по двумя диагоналями. Особые случае составляют точки растра, лежащие на границе растрового изображения.

Метод заполнения пустот основан на предположении, что линия должна быть сплошной и, следовательно, обнаруженная пустота на линии должна быть заполнена, то есть значение "0", соответствующее пустоте, должно быть заменено на "1". Метод заключается в последовательном просмотре растра наложением на него матрицы 3x3 - окрестности Мура (аналогично методу стирания бахромы) и замене пустых точек (со значением "0") на заполненные точки (значение "1") в том случае, если окрестность этой точки - одно из 16 состояний определенных в результате предварительного исследования.

После заполнения пустот и стирания бахромы осуществляется утоныде-ние линий, заключающееся в таком преобразовании исходного изображения, в результате которого ширина отрезков линий по всему контуру символа становится равной одному разряду, расстояние между вертикальными параллельными отрезками линий составляет 2 разряда. Таким образом, получаются нормализованные представления исходных изображений символов размером 7x9.

Суть алгоритма утоньшения линии состоит в последовательном чтении столбцов исходного изображения, анализе вариантов конфигурации столбцов и формировании соответствующей конфигурации столбца нормированного представления символов.

Предварительный анализ показал, что при чтение столбцов (вертикальной секущей) изображений символов русского алфавита целесообразно выделить шесть вариантов конфигураций по количеству групп непрерывных последовательностей "0" и " 1". Для каждого варианта конфигураций при одинаковом количестве групп возможны различные типы конфигурации. Все варианты включают 21 тип конфигураций.

Таким образом, в главе 2 определены задачи и предложены методы предварительной обработки растрового изображения символа, включающие стирание бахромы, заполнение пустот, утоньшение линий, приводящие к получению нормированного представления изображения символа.

В третьей главе приводится разработка и реализация метода распознавания символов, основанного на опросе специальными кодами одновременно по строкам и столбцам ортокоординатной ассоциативной среды, хранящей нормированный код символа.

Основная идея этого меюда состоит в формировании библиотеки эталонов кодов символов и в задании такого набора кодов опроса, который позволил бы однозначно выделить (идентифицировать) каждый символ из множества заданных символов. Для выбора этих кодов опроса было разработан алгоритм, основанный на двухкратном обращении к МС ОКАС двух пар специальных кодов С1, С2. Нормированный код распознаваемого символа, сформированный после предварительной обработки исходного растрового изображения символа, заносится в специально отведенную матрицу символа (МС) ОКАС. Далее одновременно по строкам и столбцам МС подается заранее определенная первая пара кодов опроса. В результате сравнения на равенство кодов опросов с кодами соответствующих фрагментов символа в МС и формируется код в регистрах фиксации Я1 и Я2 ОКАС и подается на регистр опроса строк С1 ОКАС, хранящей библиотеку эталонных кодов.

Результатом выбора данных при опросе ОКАС по С1 может быть два исхода: однозначное распознавания символа, означающее завершение процесса распознавания, или многозначное, соответствующее выделению группы символов по коду регистра опроса С1. В последнем случае на матрицу символа МС подается вторая пара кодов опроса. Показано, что предложенный в работе набор из двух пар кодов опроса оказывается достаточным для распознавания всех символов русского алфавита.

Алгоритм формирования кодов опроса для распознавания символов основывается на следующих предпосылках: нормированный код символа занимает матрицу размером 7x9 (7 строк, 9 столбцов), единичные значения элементов матрицы образуют "скелет" символа. С учетом этих предпосылок для выбора минимального набора кодов опроса МС необходимо было провести исследование по возможности разделения всех кодов символов.

Результаты исследования показали, что существует несколько вариантов наборов кодов опроса, обеспечивающих распознавание всех символов за два обращения к ОКАС.

Кластеризация символов по одному из наборов кодов представлена в виде дерева решений на рис. 2.

Рис. 2. Дерево решений, иллюстрирующее процесс распознавания символов русского алфавита при двух обращениях к ортокоординатной ассоциативной среде.

Экспериментально (моделированием на ЭВМ) показано, что при распознавании символов в ортокоординатной ассоциативной среде количество обращений к памяти в 30 раз меньшее, чем при использовании оперативной памяти.

В четвертой главе предлагается метод секущих отрезков для распознавания символов в ортокоординатной ассоциативной среде. Основная идея метода секущих заключается в следующем:

• Секущим отрезком длины К называется непрерывная (связанная) последовательность К разрядов, содержащих 1 (единицы), по строке или по столбцу. Минимальным является отрезок из двух разрядов. Длина максимального отрезка определяется размером растра. Для символов русского алфавита в работе принято 9 разрядов по строке и 7 разрядов по столбцу.

• Для каждого символа в коде МС можно выделить определенное количество единичных участков по строкам и столбцам, совпадающих с заранее определенными кодами секущих отрезков.

• Количество всех секущих отрезков длины К на интервале длиной п определяется по формуле:

Максимальное количество секущих отрезков, которые можно расположить на матрице размерности 7x9, равно

Разработан алгоритм формирования секущих отрезков, в котором количество непрерывных (связанных) единичных разрядов кода изображения символа, совпадающих с кодом одного из секущих отрезков, определяется за одну операцию ассоциативного поиска в накопителе ОКАС, так как возможна проверка совпадения кода секущего отрезка одновременно со всем кодами строк (или соответственно столбцов) МС.

Суть алгоритма состоит сравнении выбранных секущих отрезков по строкам и столбцам с фрагментами матрицы распознаваемого символа и под-считывается количество совпадений кодов фрагментов изображения символа с кодами секущих отрезков. Совокупность полученных таким образом чисел (количества совпадений) представляет собой код данного символа.

Для выбора минимального набора секущих отрезков, которые обеспечили бы кластеризацию всех символов русского алфавита, было проведено исследование и сформулированы основные рекомендации по набору секущих.

Процедура минимизации числа секущих отрезков заключается в том, что на каждом шаге из всего списка возможных секущих отрезков последовательно выбирается очередной секущий отрезок и с его помощью проводится идентификация кодов символов на всех символах, не идентифицируемых к данному шагу.

Рассмотрены три подхода, отличающиеся способом выбора секущих отрезков: последовательной перебор, случайный выбор секущего отрезка из на-

бора всевозможных отрезков, эвристический подход, который основывается на анализе конфигурации символов русского алфавита, оставшихся нераспознанными к данному шагу алгоритма, и подбора такого секущего отрезка, который, по мнению исследователя, дает некоторое удовлетворительное решение по разделению символов из списка оставшихся (нераспознанных) к данному шагу. Удовлетворительным будем считать решение, которое приводит к максимальному разделению оставшихся символов на подгруппы или к идентификации символов. Результаты исследования показали, что наиболее эффективным является эвристический подход, позволивший получить за приемлемое число попыток восемь секущих отрезков, обеспечивающих полное разделение всех символов русского алфавита по их нормированным кодам.

На рис. 3 приведено дерево решений, иллюстрирующее процесс полного распознавания символов русского алфавита по методу секущих отрезков.

Рис. 3. Дерево решений, иллюстрирующее процесс распознавания символов русского алфавита заданным наборов секущих отрезков.

В результате проведенных исследований была построена библиотека эталонных кодов символов русского алфавита. Показано, что при применении алгоритма распознавания ко всем символам русского алфавита распознавание

символов может занимать от 4 до 8 шагов, где шагом называется процесс сравнения всех строк и столбцов МС с определенным кодом секущего отрезка

Приводятся также экспериментальные данные скорости распознавания символов русского алфавита, выраженные в количестве обращений к памяти двух типов: ОЗУ и ОКАС. Результаты показывают, что при организации распознавания символов на основе ортокоордииатной ассоциативной среды количество обращений к памяти в три раза меньшее, чем при использовании оперативной памяти.

В пятой главе разрабатывается метод распознавания символов выделением характерных узлов. Идея этого метода основывается на предположении, что можно найти некоторую совокупность элементарных типовых узлов (ЭТУ), совпадающих с фрагментами распознаваемых символов. Под ЭТУ понимается некоторая конфигурация связанных единичных элементов МС, располагающихся по вертикали, горизонтали и диагонали. Последовательное сканирование МС такими ЭТУ позволяет найти всевозможные совпадения кодов этих узлов с соответствующими кодами фрагментов символа. Сканированием МС называется перемещение ЭТУ по строкам МС слева направо с целью сравнения на равенство кода ЭТУ с фрагментами кода символа. Совокупность совпадений для конкретного символа образует уникальный (эталонный) код данного символа, по которому и идентифицируется этот символ. Набор эталонных кодов образует библиотеку кодов символов.

В работе было проведено исследование по выбору минимального набора ЭТУ, обеспечивающего кластеризацию всех символов рассматриваемого алфавита. При этом параметрами выбора были приняты количество строк и столбцов матрицы ЭТУ, структура конфигурации в матрице ЭТУ и порядок применения ЭТУ из заданного набора для сканирования МС.

Результатом этих исследований являются предложенные варианты наборов из десяти ЭТУ, обеспечивающих полную кластеризацию символов.

Разработан алгоритм формирования библиотеки кодов эталонов символов методом выделения характерных узлов и построена библиотека кодов эталонов символов - букв русского алфавита. Разработан алгоритм и программа распо-

знавания символов в ортокоординатной ассоциативной среде, основанные на методе выделения характерных узлов. Проведена экспериментальное исследование работы программы на ЭВМ и получены оценки скорости распознавания символов русского алфавита. Показано, что для скорости распознавания важным фактором является порядок представления ЭТУ из заданного набора.

Известно, что в текстах на русском языке частота появления символов имеет определенную устойчивость. Учитывая эту статистику и экспериментальные данные скорости распознавания символов, в настоящей работе рекомендуется для повышения скорости распознавания выбирать такую последовательность ЭТУ, которая обеспечила бы максимальное приближение к частоте появления символов в текстах.

Сравнение экспериментальных данных скорости распознавания символов русского алфавита, выраженной в количестве обращений к памяти двух типов -ОЗУ и ОКАС, показывает, что при организации распознавания символов на основе ортокоординатной ассоциативной среды количество обращений к памяти меньшее в 3-5 раз, чем при использовании оперативной памяти.

Таким образом, в работе разработана методика анализа, обработки и распознавания символов на основе применения ортокоординатной ассоциативной среды, включающая процедуры предварительной обработки, кластеризации и распознавания символов - рис. 4. Предложено три метода кластеризации и распознавания символов, ориентированные на применение в ортокоординатной ассоциативной среде: Метод опроса нормированных кодов символов, Метод се-кущихотрезков, Метод выделенияхарактерныхузлов символов.

По первому методу опрос нормированных кодов символов, располагающихся в ортокоординатной ассоциативной среде, проводится по всем строкам и столбцам одновременно, но с учетом маскируемых строк и столбцов. Поэтому этот метод имеет наибольшую скорость выполнения, но и требует более сложного алгоритма, а следовательно, и реализующей его схемы управления (например, формирование или хранение масок и кодов опроса большой разрядности - 16 и 32 разряда).

Рис. 4. Этапы проведения работ по предварительной обработке и распознаванию символов в ОКАС.

По второму методу опрос нормированных кодов символов проводится последовательно по строкам и по столбцам с возможностью маскирования отдельных строк или столбцов. Поэтому быстродействие этого метода ниже в 3 -5 раз, чем первого метода. Достоинством этого метода является меньшее число опрашиваемых разрядов (до 8) и меньшая разрядность кодов эталонов символов (8 разрядов).

По третьему методу опрос нормированных кодов символов проводится последовательным перемещением матриц ЭТУ по строкам МС с вычислением количества сравнений на равенство кодов ЭТУ с фрагментами кода символа и последующим сравнением на совпадение с кодами эталонов символов. Быстродействие этого метода в среднем в 3 раза ниже быстродействия второго метода. К достоинству этого метода можно отнести возможность быстрой адаптации к классу распознаваемых символов, так как смена набора символов приводит только к поиску набора типовых элементарных узлов, соответствующих конфигурациям этих символов, а алгоритм (следовательно, и программа) распознавания остаются неизменными.

Экспериментальные данные оценки скорости распознавания символов по каждому из предложенных методов приведены на рис. 5.

а) Количество обращений при использовании метода выделения характерных узлов: 1.........1 - в оперативном запоминающем устройстве, I I - в ортокоординатной ассоциативной среде

Кеп-м оИржотич ■ юмятя

г! г г Г гПг » э Г и к гЯГ л м Г н г о Г п г р г с Г т г У Г ф г X гЛ Г а ч гП пЛ Г 111 щ ы Г ь 3 Г я

б) Количество обращений к ОКАС при использовании методов:

- выделения характерных узлов; - секущих отрезков, - опроса нормированных кодов символов.

Рис. 5. Гистограммы скорости распознавания символов русского алфавита: а) методом выделения характерных узлов - при реализации в ОЗУ и ОКАС; б) тремя предложенными в работе методами распознавания.

Сравнительный анализ этих данных показывает, что по количеству обращений к ортокоординатной ассоциативной среде наиболее эффективным является метод опроса кодами, а наиболее трудоемким метод выделения характерных узлов. Такой эффект можно объяснить использованием свойства ортокоординатной ассоциативной среды - возможностью опроса ассоциативного накопителя одновременно по строкам и столбцам. При этом основная трудность состояла в выборе кодов опроса, которые собственно и заключают в себе информацию об особенностях конфигураций распознаваемых символов (в нашем случае - символы русского алфавита).

В заключении приведены основные результаты работы.

Основные результаты работы. Основные результаты работы заключаются в следующем:

1. разработаны алгоритмы предварительной обработки символов в ортокоор-динатной ассоциативной среде: стирания бахромы, заполнения пустот, утоньшения линий символа;

2. предложен метод распознавания символов в ортокоординатной ассоциативной среде, основанный на свойствах параллельного опроса по строкам и столбцам матрицы ассоциативной среды;

3. предложен метод распознавания символов в ортокоординатной ассоциативной среде, основаны на формировании секущих отрезков и сравнении их на равенство с фрагментами распознаваемых символов;

4. на основе анализа свойств класса распознаваемых символов предложены наборы минимальные секущих отрезков, обеспечивающих полную кластеризацию и распознавание символов русского алфавита;

5. предложен метод распознавания символов в ортокоординатной ассоциативной среде, основанный на выделении элементарных типовых узлов и сравнении их с фрагментами распознаваемых символов;

6. на основе анализа свойств распознаваемых символов предложен эвристический подход к определению набора ЭТУ, обеспечивающий кластеризацию заданного набора символов;

# 2 4 2 4 2

7. на основе предложенных методов разработаны алгоритмы и программы для моделирования процессов кластеризации и распознавания символов в орто-коодинатной ассоциативной среде. На примере символов русского алфавита проведено машинное моделирование, кластеризации и распознавания и получены оценки скорости распознавания символов;

8. показано, что скорость выполнения алгоритмов, реализующих предложенные методы, ориентированные на реализацию в ортокоординатной ассоциативной среде, на 1.5-2 порядка выше скорости выполнения этих алгоритмов в оперативном запоминающем устройстве.

Основные положения диссертационной работы изложены в следующих публикациях:

1. Огнев И. В., Мд. Абдул Малек. Обработка матриц в ассоциативной среде // Сб. тр. МФИ-2000, Международный форум информатизации 2000. Информационные средства и технологии. - М.: 2000. -С. 72-75.

2. Огнев И. В., Мд. Абдул Малек. Методы сортировки в многокоординатном ассоциативном ЗУ (МКАЗУ) // Сб. тр. МФИ-2002, Международный форум информатизации 2002. Информационные средства и технологии. -М.: 2002.-С. 78-81.

3. Огнев И. В., Мд. Абдул Малек. Особенности выполнения методов сортировки в ассоциативном ЗУ // Сб. тр. Девятая Международная научно-техническая конференция студентов и аспирантов 2003, - М.: 2003. -С. 325-326.

4. Огнев И. В., Мд. Абдул Малек. Распознавание символов в ассоциативной среде // Сб. тр. МФИ-2003, Международный форум информатизации 2003. Информационные средства и технологии. -М.: 2003. -С. 15-19.

Подписано в печать ^^Зак. ис Тир. {11 П.л. 1^0 Полиграфический центр МЭИ (ТУ) Красноказарменная ул., д. 13

310

Оглавление автор диссертации — кандидата технических наук Мд. Абдул Малек

ВВЕДЕНИЕ.

ГЛАВА 1. ОБЗОР АССОЦИАТИВНЫХ СРЕД И МЕТОДОВ РАСПОЗНАВАНИЯ СИМВОЛОВ.

1.1. Ассоциативные среды хранения и обработки информации

1.2. Организация ортокоординатных ассоциативных сред.

1.3. Обзор и классификация методов кластеризации и распознавания

1.4. Выводы.

ГЛАВА 2. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА СИМВОЛОВ В ОРТО-КООРДИНАТНОЙ АССОЦИАТИВНОЙ СРЕДЕ.

2.1. Задачи предварительной обработки информации при растровом представлении изображений.

2.2. Метод стирания бахромы.

2.3. Метод заполнения пустот.

2.4. Метод утоньшения линий.

2.5. Выводы.

ГЛАВА 3. РАСПОЗНАВАНИЕ СИМВОЛОВ В ОРТОКООРДИНАТНОЙ АССОЦИАТИВНОЙ СРЕДЕ МЕТОДОМ ОПРОСА НОРМИРОВАННЫХ КОДОВ СИМВОЛОВ.

3.1. Принципы распознавания символов методом опроса нормированных кодов символов.

3.2. Правила представления символов в матрице ортокоординатной ассоциативной среды.

3.3. Алгоритм формирования кодов опроса в ортокоординатной ассоциативной среде.

3.4. Алгоритм формирования библиотеки кодов эталонов символов русского алфавита.

3.5. Алгоритм распознавания кодов символов, располагающихся в ор-токоординатной ассоциативной среде.

3.6. Выводы.

ГЛАВА 4. РАСПОЗНАВАНИЕ СИМВОЛОВ В ОРТОКООРДИНАТНОЙ АССОЦИАТИВНОЙ СРЕДЕ МЕТОДОМ СЕКУЩИХ ОТРЕЗКОВ

4.1. Общие принципы метода секущих отрезков.

4.2. Алгоритм формирования секущих отрезков.

4.3. Минимизация секущих отрезков.

4.4. Алгоритм распознавания символов, реализующий метод секущих отрезков.

4.5. Выводы.

ГЛАВА 5. РАСПОЗНАВАНИЕ СИМВОЛОВ В ОРТОКООРДИНАТНОЙ АССОЦИАТИВНОЙ СРЕДЕ МЕТОДОМ ВЫДЕЛЕНИЯ ХАРАКТЕРНЫХ УЗЛОВ.

5.1. Принципы распознавания символов методом выделения характерных узлов.

5.2. Алгоритм формирования библиотеки кодов эталонов символов русского алфавита методом выделения характерных узлов.

5.3. Алгоритм распознавания символов в ортокоординатой ассоциативной среде, методом выделения характерных узлов.

5.4. Выводы.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Мд. Абдул Малек

Актуальность темы

Стремительное развитие информационных технологий обусловлено универсальностью функциональных возможностей ЭВМ и проникновением ЭВМ во все сферы человеческой деятельности. При этом постоянно растущие скорость вычислений и объем хранимой в ЭВМ информации не могут в полной мере удовлетворить потребностей практики применения информационных технологий. Тем более, что возможности современной элементной базы и классической архитектуры аппаратных средств ЭВМ по быстродействию и производительности приближаются к физическим пределам. Выход за эти пределы возможен только при реализации новых идей в области аппаратно-программных средств и применения новых технологий, в частности, путем разработки методов и средств искусственного интеллекта, сочетающих в себе формальные подходы с эвристическими приемами, присущими человеку, основанными на принципах адаптации к окружающим условиям. Анализ показывает, что решение интеллектуальных задач основывается на специфических методах обработки огромного объема информации в условиях неполной или нечетко заданной информации. Попытки применения классических методов обработки данных в этих условиях требуют всё большего повышения быстродействия процессора и емкости памяти ЭВМ. Методы ассоциативной организации памяти позволяет в определенной мере решать эти проблемы, так как в этом случае на элемент памяти возлагаются также и некоторые функции обработки информации.

Ассоциативный способ основан на установлении некоторого соответствия, ассоциации между хранимой в ЗУ информации и поисковыми аргументами. Запоминающие устройства, в которых использован такой способ доступа, получили название ассоциативных ЗУ (АЗУ).

АЗУ характеризуются двумя основными признаками:

• доступ к хранимой информации в АЗУ осуществляется исходя из её содержания;

• при каждом обращении к АЗУ возможен параллельный доступ ко всей хранящейся информации.

Эти два признака определяют свойство «интеллектуальности» АЗУ. Первый из них определяет возможность обработки данных непосредственно в логико-запоминающей среде АЗУ, а второй обеспечивает возможность параллельный обработки информации.

АЗУ, реализующие помимо стандартных операций ассоциативной обработки информации, функции преобразования многомерной информации, называют многокоординатным АЗУ (МКАЗУ). Ассоциативное проецирование, ассоциативный поиск, ассоциативный опрос, комбинированные виды ассоциативных взаимодействий, определяющие концепцию иерархической по размерности многокоординатной ассоциативной памяти, позволяют выделить новый класс АЗУ - ортокоординатные АЗУ (ОКАЗУ) [3]. ОКАЗУ являются перспективным направлением в развитии интеллектуальных ЗУ. Они позволяют производить более эффективное по сравнению с традиционным АЗУ выполнение локальных и глобальных вычислений, линейных и нелинейных вычислений, интенсивное использование логико-запоминающей среды АЗУ, объектно и координатно ориентированных вычислений, символьных вычислений и вычислений на элементах, контекстно свободных и контекстно зависимых вычислений.

Данная работа посвящена исследованию свойств ортокоординатной ассоциативной среды (ОКАС) для обработки информации и разработке на основе результатов исследований методов и алгоритмов распознавания символьной информации. Работа является дальнейшим развитием исследований, проводимых на кафедре Вычислительной техники Московского энергетического института под руководством профессора Огнева И. В.

Цель работы состоит в исследовании свойств ортокоординатной ассоциативной среды и в разработке новых методов распознавания символов в ортокоординатной ассоциативной среде.

Для достижения поставленной цели в диссертации решаются следующие основные задачи:

• исследование свойств ортокоординатной ассоциативной среды, обеспечивающей совмещение функций хранения и обработки информации;

• разработка методов и алгоритмов предварительной обработки символов в ортокоординатной ассоциативной среде;

• разработка метода опроса и алгоритма распознавания символов в ортокоординатной ассоциативной среде;

• разработка метода секущих отрезков и алгоритма распознавания символов в ортокоординатной ассоциативной среде;

• разработка метода выделения характерных узлов символов и алгоритмов распознавания в ортокоординатной ассоциативной среде. Объектом исследований являются ортокоординатные ассоциативные среды, применение их для разработки методов и алгоритмов предварительной обработки, кластеризации и распознавания символьной информации.

Методы исследования базируются на теориях арифметических и логических основ вычислительной техники, системного анализа. Экспериментальные исследования, выполненные для подтверждения полученных в ходе диссертационной работы результатов, проводились на основе моделирования на ЭВМ.

Научная новизна работы заключается в следующем:

• разработаны и исследованы методы и алгоритмы предварительной обработки символов в ортокоординатной ассоциативной среде;

• разработаны методики реализации алгоритмов предварительной обработки символов в ортокоординатной ассоциативной среде для применения их в задачах распознавания;

• разработаны методы распознавания символов в ортокоординатной ассоциативной среде;

• разработаны алгоритмы распознавания символов на основе предложенных методов;

• разработаны методики и программы реализации алгоритмов распознавания символов в ортокоординатной ассоциативной среде. Практическая ценность

Практическая ценность работы состоит в следующем:

• разработаны информационные программные модели предварительной обработки символов в ортокоординатной ассоциативной среде;

• разработаны программы кластеризации и распознавания символов в ортокоординатной ассоциативной среде;

• разработаны библиотеки нормированного представления символов в ортокоординатной ассоциативной среде.

Достоверность научных положений выводов и практических рекомендаций, сформулированных в диссертации, подтверждается вычислительными экспериментами и данными, полученными при моделировании на ЭВМ.

Апробация работы Основные результаты работы докладывались на: международных форумах информатизации МФИ - 2000, МФИ - 2002 и МФИ - 2003 «Информационные средства и технологии», секция «Интеллектуализация современных информационных средств и систем», и на девятой международной научно-технической конференции студентов и аспирантов, Москва-2003.

Публикации Основные результаты диссертации опубликованы в 4-х печатных работах.

1. Огнев И. В., Мд. Абдул Малек. Обработка матриц в ассоциативной среде // Сб. тр. МФИ - 2000, международный форум информатизации 2000. Информационные средства и технологии. - М., 2000. - с. 72 - 75.

2. Огнев И. В., Мд. Абдул Малек. Методы сортировки в многокоординатном ассоциативном ЗУ (МКАЗУ) // Сб. тр. МФИ - 2002, международный форум информатизации 2002. Информационные средства и технологии. - М.,

2002.-с. 78-81.

3. Огнев И. В., Мд. Абдул Малек. Особенности выполнения методов сортировки в ассоциативном ЗУ // Сб. тр. Девятая международная научно-техническая конференция студентов и аспирантов. - М., 2003. - с. 325 - 326.

4. Огнев И. В., Мд. Абдул Малек. Распознавание символов в ассоциативной среде // Сб. тр. МФИ - 2003, международный форум информатизации

2003. Информационные средства и технологии. - М., 2003. - с. 15 - 19. Структура и объем диссертационной работы Диссертация состоит из введения, пяти глав, заключения, списка литературы из 71 наименования и четырех приложений. Работа содержит 152 страницы текста, включая 34 рисунка, 22 таблицы, 6 страниц библиографии.

Основные научные положения, выносимые на защиту:

1. методы и алгоритмы предварительной обработки символов в ортокоорди-натной ассоциативной среде;

2. метод и алгоритм распознавания символов с помощью опросов нормализованных кодов символов в ортокоординатной ассоциативной среде;

3. метод и алгоритм распознавания символов методом выбранных секущих отрезков в ортокоординатной ассоциативной среде;

4. метод и алгоритм распознавания символов выделением характерных узлов в ортокоординатной ассоциативной среде.

Заключение диссертация на тему "Исследование и разработка методов распознавания символов в ортокоординатной ассоциативной среде"

ЗАКЛЮЧЕНИЕ

В диссертационной работе решена научно-техническая задача исследования и разработки методов и средств распознавания символов в ортокоординатной ассоциативной среде с учетом особенностей и принципов функционирования среды.

Библиография Мд. Абдул Малек, диссертация по теме Элементы и устройства вычислительной техники и систем управления

1. Кохонен Т. Ассоциативные запоминающие устройства. - М.: Мир, 1982, -384 с.

2. Крайзмер Л. П., Бородаев Д. А., Гутенмахер Л. И. и др. Ассоциативные запоминающие устройства. - Л.: Энергия, 1967, - 183 с.

3. Огнев И. В., Борисов В. В., Интеллектуальные системы ассоциативной памяти М.: Радио и связь, 1996. -176 с : ил.

4. Огнев И. В., Сарычев К. Ф. Надежность запоминающих устройств. - М.: Радио и связь, 1988. - 224 с : ил.

5. Огнев И. В., Шамаев Ю. М. Проектирование запоминающих устройств: Учеб. Пособие. - М.: Высш. Школа, 1979. -320 с , ил.

6. Огнев И. В., Борисов В. В. Ассоциативные среды. - М.: Радио и связь, 2000.-312 с.

7. Огнев И. В., Борисов В. В. Проектирование систем ассоциативной памяти современных ЭВМ. - М.: Изд-во МЭИ, 1997. - 70 с.

8. Пат. № 2037892 РФ, МКИ G11C 15/00. Ассоциативные запоминающие устройство/ В. В. Борисов, И. В. Огнев. - Опубл. 1995, Бюл. № 17.

9. Фролов А. Б., Фролов Д. А. Алгоритмы распознавания упорядоченных объектов в системах принятия решений функционального типа. Вестник МЭИ, 1996. N6.

10. Фролов А. Б., Яко Э. Алгоритм распознавания частично упорядоченных объектов и их применение. Изд. АН СССР. Техническая кибернетика, 1990, N5.

11. Фролов А. Б., Фролов Д. А., Яко Э. Программируемые функциональные систем для распознавания упорядоченных объектов. Известия РАН, серия Теория и системы управления, 1997, N5.

12. СБИС для распознавания образов и обработки изображений. - М.: Мир, 1988.

13. Денисов В. М., Матвеев Ю. Н., Очин Е. Ф. Принципы организации систем обработки изображений на базе клеточной логики // зарубежная радиоэлектроника. - 1984. - N1.

14. Троффили Т., Марголус Н. Машины клеточных автоматов. Пер. с анг. - М.: Мир, 1991.

15. Фу К. структурные методы в распознавании образов. - М.: Мир. 1977.

16. Ярославский Л. П. Введение в цифровую обработку изображений, М.: Сов. Радио, 1969, 312 стр.

17. Стандартные прерывания BIOS, DOS и специализированных драйверов. Книга 1/ перевод с англ. Г. В. Зюзина. - М.: ЭНПО "Комплекс", 1992 - 96 с.

18. Романцев Ю. В., Тимофеев П. А, Шаньгин В. Ф. Защита информации м компьютерных системах и сетях/ Под ред. В. Ф. Шаньгина. - М.: Радио и связь, 1999.-328 с.

19. Огнев И. В., Мд. Абдул Малек. Обработка матриц в ассоциативной среде // Сб. тр. МФИ - 2000, международный форум информатизации 2000. Информационные средства и технологии. - М., 2000. - с. 72 - 75.

20. Огнев И. В., Мд. Абдул Малек. Методы сортировки в многокоординатном ассоциативном ЗУ (МКАЗУ) // Сб. тр. МФИ - 2002, международный форум информатизации 2002. Информационные средства и технологии. - М., 2002.-с. 7 8 - 8 1 .

21. Огнев И. В., Мд. Абдул Малек. Особенности выполнения методов сортировки в ассоциативном ЗУ // Сб. тр. Девятая международная научно-техническая конференция студентов и аспирантов. - М., 2003. - с. 325 - 326.

22. Огнев И. В., Мд. Абдул Малек. Распознавание символов в ассоциативной среде // Сб. тр. МФИ - 2003, международный форум информатизации 2003. Информационные средства и технологии. - М., 2003. - с. 15-19.

23. Амамия М., Танака Ю. Архитектура ЭВМ и искусственной интеллект: Пер. с Японск. - М.: Мир, 1993. - 400 с , ил.

24. Ахо, Альфред, В., Хопкрофт, Джон, Ульман, Джеффри, Д. Структуры данных и алгоритмы.: Пер. с англ.: Уч. Пос. - М.: Издательский дом «Вильяме», 2000. - 384 с. ил. - Парал. Тит. Англ.

25. Авдонин В. Б., Мякотина О. Л., Минина В., Либерман Е. А. Особенности пространственной организации системы, меняющей проницаемость мембраны в ответ на CAMP // Библеотечиские мембраны. 1993. Т. 10, № 6. 598-616.

26. Баклицкий В. К., Колосовская Т. П. Обработка информации комплексных системах наблюдения: Учеб. Пособие. - М.: Изд-во МАИ, 1993. 68 с : ил.

27. Белецкий Я. Энциклопедия языка Си: Пер. с польск.- М.: Мир, 1992. - 687 с , ил.

28. Березин Б. И., Березин Б. Начальный курс С и C++. -М.: ДИАЛОГ - МИФИ, 1996.-288 с.

29. Классификация и распознавание в дискретных системах. А. А. Болотов, А. Б. Фролов / Под ред. В. Н. Вагина. - М.: Изд-во МЭИ, 1997. - 120 с.

30. Бруно Бабэ Просто и ясно о Borland C++: Пер. с англ.- М.: Бином.- 400 с: ил.

31. Вирт Н. Алгоритм и структуры данных: Пер. с англ. - М.: Мир, 1989. - 360 с , ил.

32. Гончарский А. В., Кочиков И. В., Матвиенко А. Н. Реконструктивная обработка и анализ изображений в задачах вычислительной диагностики. -М.: Изд-во Моск. Ун-та, 1993. - 140 с : ил.

33. Закревский А. Д. Логический синтез каскадных схем. М.: Наука 1981.

34. Керниган Б., Ритчи Д. Язык программирования Си: Пер. с англ./ Под ред. И с предисл. Вс. Штаркмана. - 2-е изд., перераб. И доп.- М.: Финансы и статистика, 1992. - 272 с : ил.

35. Л. П. Крайзмер, Д. А. Бородаев, Л. И. Гутенмахер, Б. П. Кузьмин, И. Л. Смелянский, Ассоциативные Запоминающие Устройства. Под общей редакцией Л. П. Крайзмера - «Энергия» Ленинградское Отделение 1967. -182.

36. Т. Кохонен, Ассоциативная память, первод с английского. Издательства «Мир» Москва 1980. - 239 с :

37. Разработка диалоговых систем на языке си. Средства создания интерфейса. Князев А. В. - М.: Изд-во МЭИ, 1995. - 86 с.

38. Крайзмер Л. П., Матюхин А., Майоркин Г. Память кибернетических систем (основы мнемологии). М., Изд-во «Советское радио», 1971, 400 с.

39. Мелихов А. Н., Берштейн Л. С, Коровин Я. Ситуационные советующие системы с нечеткой логикой. - М.: Наука. Гл. ред. Физ. - мат. лит., 1990.-272 с.

40. Полупроводниковые БИС запоминающих устройств: Справочник/ В. В. Баранов, Н. В, Бекин, А. Ю. Гордонова и др.; Под ред. А. Ю. Гордонова и Ю. И. Дьякова. - М.: Радио и связь, 1987. - 360 с : ил.

41. Поиск, Первозванский А. А., Главная редакция физико-математической литературы изд-ва «Наука», М., 1970, 264 стр.

42. Пом А., Агравал О. Быстродействующие системы памяти: Пер. с англ. М.: Мир, 1987. - 264 ел., ил.

43. Потемкин И. Функциональные узлы цифровой автоматики. - М.: Энергоатомиздат, 1988. - 320 с : ил.

44. Прикладные нечеткие системы: Пер. с Японск./ К. Асаи, Д. Ватада, Иван и др.: под редакцией Т. Тэрано, К. Асаи, М. Сугэно. - М.: Мир, 1993. - 368 с , ил.

45. Уинер Р. Язык Турбо Си: Пер. с англ.- М.: 1991. - 384 с , ил.

46. Рыжиков Ю. И. Информатика. Лекции и практикум. - СПБ.: КОРОНА принт, 2000. - 256 с.

47. Радченко А. Н. Аппроксимация и точное формирование булевых функций многих переменных. 4. П. Эффективное построение ассоциативной памяти // Там же 1985. № 2. 98 - 106.

48. Радченко А. Н. Оптимизация распределенной ассоциативной памяти со случайной организацией // Биофизика. 1993 б. Т. 38. вып. 2. 294 - 299.

49. Радченко А. Н. Оптимальная самоорганизация ассоциативной памяти в случайной среде // материалы первой междунар. Конф. По проблемам самоорганизации и управления в сложных коммуникационных пространствах. 19-45 июня 1997, Россия СПБ. 1997. 49-52.

50. Радченко А. Н., Гольдин В. Е. Исследование модели ассоциативного обучения // Автоматики и вычислительная техника. 1969. № 6. 7-12.

51. Радченко А. Н. Ассоциативная память. Нейронные сети. Оптимизация нейропроцессоров. - СПБ.: Наука, 1998.-261 с.

52. Соломатин В. Ф. Теория ассоциативных запоминающих устройств с распределенной записью информации // Автометрия , 1982. № 1. 21-34.

53. Фролов А. А., Муравьев И. П. Нейронные модели ассоциативной памяти. М.: Наука, 1987.

54. Вопросы статической теории распознавания, под ред. Барского Б. В., - М.: Сов. Радио, 1967, 400 стр.

55. Горелик А. Л., Скрипкин В. А. Методы распознавания, - М.: Высшая школа, 1984, 222 стр.

56. Горелик А. Л., Гуревич И. Б., Скрипкин В. А. современное состояние проблемы распознавания, - М.: Радио и связь, 1985.

57. Загоруйко Н. Г. Методы распознавания и их применение, - М.: Сов. Радио, 1972, 206 стр.

58. Патрик Э. Основы теории распознавания образов, М.: Сов. Радио, 1980, 408 стр.

59. Претт У. Цифровая обработка изображений, в двух книгах, М.: Мир, 1982,790 стр.

60. Розенфельд А. Распознавание и обработка изображений с помощью вычислительных машин. М.: Мир, 1972, 230 стр.

61. Ту Дж., Гонзалес Р. Принцип распознавания образов, М.: Мир, 1978.

62. Фомин Я. А., Тарловский Г. Р. Статистическая теория распознавания образов, М.: Радио и связь, 1986, 264 стр.

63. Фор А. Восприятие и распознавание образов, М.: Машиностроение, 1989, 272 стр.

64. Ярославский Л. П. Введение в цифровую обработку изображений, М.: Сов. Радио, 1969,312 стр.

65. Дуда Р., Харт П. Распознавание образов и анализ сцен. - М.: Мир, 1976 511 с.

66. Бойцов В. М., Проценко И. В. Структурные алгоритмы распознавания: Тезисы доклада к конференции по проблемам навигации и управления. - Киев: КВВАИУ, 1986.

67. Валник В. Н.,Червоненкис А. Я. Теория распознавания образов. М.: Наука, 1974.415 с.

68. Ту Дж, Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. 411 с.

69. Хермен Г. Восстановление изображений по проекциям: Основы реконструктивной томографии. М.: Мир, 1983, 352 с.

70. Фурман Я. А., Юрьев А. Н., Яншин В. В. Цифровые методы обработки и распознавания бинарных изображений. - Красноярск: Изд-во Краснояр. Ун-та, 1992.-248 с.