Исследование и разработка методов локализации, идентификации и распознавания арабских символов

Аль-Рашайда Хасан Хусейн

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование и разработка методов локализации, идентификации и распознавания арабских символов

кандидата технических наук: Аль-Рашайда Хасан Хусейн
город: Санкт-Петербург
год: 2008
специальность ВАК РФ: 05.13.01

Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка методов локализации, идентификации и распознавания арабских символов»

Автореферат диссертации по теме "Исследование и разработка методов локализации, идентификации и распознавания арабских символов"

На правах рукописи

0034562 1G

Аль-Рашайда Хасан Хусейн

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ ЛОКАЛИЗАЦИИ, ИДЕНТИФИКАЦИИ« И РАСПОЗНАВАНИЯ АРАБСКИХ СИМВОЛОВ (НА ПРИМЕРЕ НОМЕРНОГО ЗНАКА АВТОМОБИЛЯ)

Специальность: 05.13.01 — Системный анализ, управление и обработка информации (технические системы)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

г№

Санкт-Петербург 2008

003456216

Работа выполнена в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» им. В.И. Ульянова (Ленина)

Научный руководитель: доктор технических наук,

профессор Александров Виктор Васильевич

Официальные оппоненты: доктор технических наук,

профессор Городецкий Андрей Емельянович

кандидат технических наук,

доцент Первицкий Александр Юрьевич

Ведущая организация:

Государственное образовательное учреждение высшего профессионального образования «Санкт-Петербургский университет аэрокосмического

приборостроения»

Защита состоится "/ " декабря 2008г. В ¡6 часов на заседании совета по защите докторских и кандидатских диссертаций Д 212.238.07 Санкт-Петербургского государственного электротехнического университета им. В.И.Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.

С диссертацией можно ознакомиться в библиотеке университета. Автореферат разослан " ноября 2008г.

Ученый секретарь совета по защите докторских и кандидатских диссертаций

Цехановский В.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Развитие компьютерных технологий обеспечивает их применение в широком диапазоне областей, в том числе в области автоматического распознавания символов. Известны автоматизированные системы распознавания символов английского, японского и китайского языков, в то время как для внедрения подобных систем на других языках, например, на арабском, необходимы дополнительные исследования. Простое применение уже разработанных алгоритмов во многих случаях невозможно из-за наличия в каждом языке своих специфических символов, знаков и лингвистики построения текстов.

Проблема автоматизированного ввода в компьютер текстовой информации также не потеряла своей актуальности. Более того, она приобретает все большую остроту в связи с массовой информатизацией всех сторон жизни.

Вследствие доступности и относительной дешевизны мощных микропроцессоров, в настоящее время появляется возможность реализации современных специализированных систем, например видео контроль автомобильного движения. Это комплексная проблема поиска, локализации и идентификации номерного знака в реальном масштабе времени при движении объектов.

В данной диссертационной работе рассматривается разработка автоматизированной системы распознавания арабско-индийских цифр и символов арабского языка, что важно для многих предметных областей, в том числе и в области локализации и распознавания номерных знаков, в которых содержатся арабско-индийские цифры и символы арабского и английского языков. Это связано с тем, что в последнее время возросла интенсивность движения и количество автомобильных аварий.

Разрабатываемая система автоматически отслеживает нарушителей дорожного движения и записывает автомобильные номера нарушителей в базу данных. Такой автоматический контроль позволяет ощутимо снизить количество нарушений и аварийность на дорогах Иордании.

Анализ известных систем показал, что они, во-первых, дают неудовлетворительные результаты на изображениях низкого качества (которые обычно как раз и получают с видеокамер), во-вторых, не работают на сложных (разноплановых) изображениях, так как на них трудно локализовать требуемую область распознавания, а в-третьих, все они ориентированы на строго определенные условия (освещенность, угол поворота камеры, яркость и т.д.).

Поиск эффективного решения описанной задачи локализации и распознавания номерного знака (арабского) составляет суть диссертационной работы.

Объектом исследования являются компьютерные методы обработки изображений, иерархические и статистические методы классификации, а также ранговые оценки семантического содержания.

Предметом исследования являются инструментально-технические средства обработки изображений: видеокамера, процессор и программы экспериментальной оценки качества распознавания арабско-индийских цифр, слов и номерных знаков.

Целью работы является исследование и разработка метода, алгоритма и программ распознавания знаков, символов, цифр и букв арабского языка, обеспечивающих анализ и обработку информации на изображении с целью обнаружения, локализации и идентификации автомобильного номерного знака. Для достижения поставленной цели в диссертационной работе решаются следующие задачи:

1. Выделение специфических особенностей символов, знаков, букв и цифр арабского языка;

2. Исследование основных подходов к системам распознавания символов арабского языка и арабско-индийских цифр;

3. Разработка алгоритма выделения специфических признаков арабского языка (выделение скелета слов, обнаружение базисной линии слов);

4. Разработка метода оценки качества признаков для распознавания арабско-индийских цифр;

5. Разработка метода повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов;

6. Разработка программы локализации и идентификации автомобильных номерных знаков и ее экспериментальная апробация;

7. Исследование надежности распознавания автомобильных номерных знаков, снятых видеокамерой под разными углами.

Основные методы исследования. В качестве методов исследования использовались цифровые методы обработки изображений, корреляционные и нейронные классификаторы, морфологические методы селекции элементов изображения.

Научная новизна. В диссертации предложены и решены следующие задачи:

1. Разработан алгоритм обнаружения базисной линии слова арабского языка;

2. Разработан алгоритм и программа распознания арабско-индийских цифр с использованием нескольких методов выделения признаков;

3. Для повышения надежности системы распознавания используются обучаемые матрицы как мажоритарные классификаторы;

4. Локализация и распознавание автомобильного номерного (арабского) знака при наличии помех на изображении и при разных углах съемки;

Положения, выносимые на защиту. На основе проведенной теоретической работы и экспериментальной апробации разработанных методов на защиту выносятся следующие положения:

1. Алгоритм обнаружения базисной линии слов арабского языка.

2. Система распознавания арабско-индийских цифр с использованием

комбинаций векторов и интеграции различных классификаторов.

3. Алгоритм локализации номерного знака с использованием нейро-сетевого

классификатора и маркировка значимых (черных) пикселов.

Теоретическая значимость работы заключается в разработке системы распознавания арабско-индийских цифр и символов арабского языка, алгоритма обнаружения базисной линии слов арабского языка, и алгоритма локализации и распознавания номерного знака.

Практическая ценность. Заключается в создании системы автоматизированного ввода и обработки текстов на арабском языке, что позволяет реализовать: распознавание и идентификацию номерного знака, считывающие устройства для банковских чеков, почтовые системы считывания, автоматизацию делопроизводства, распознавание и аутентификацию подписи.

Апробация работы. Научные результаты и основные положения работы представлялись на конференции: II Иорданская международная конференция по вычислительной технике "JICCSE-2006 " (Амман, Иордания, 2006), X Санкт-Петербургская международная конференция «Региональная информатика-2006» (Санкт-Петербург, Россия, 2006).

Реализация и внедрение. Полученные результаты реализованы в виде ряда программных систем на различных языках программирования (Java, Matlab). Данные программные системы используются для тестирования и в качестве системы локализации и распознавания номерного знака.

Публикации. Основные теоретические и практические результаты диссертации опубликованы в 5 работах, среди которых публикации в ведущих рецензируемых изданиях, рекомендованных в действующем перечне ВАК 2 работы, а также материалы научно-технических и всероссийских конференций в количестве трех.

Структура и объем диссертационной работы. Диссертация состоит из введения, 4 глав, заключения, излагается на 131 странице, включая перечень используемой литературы из 75 наименований, 40 рисунков и 4 таблицы. Кроме того, в диссертации имеется приложение на 28 листах, содержащие в себе примеры работы разработанных программ, реализующих алгоритмы, описанные в диссертации.

СОДЕРЖАНИЕ РАБОТЫ

Во введении содержится обоснование актуальности темы диссертационной работы, сформулированы основные научные результаты, выносимые автором на защиту, а также практическая ценность полученных результатов.

В первой главе обсуждается и исследуется специфика написания символов арабского языка с целью их предварительной обработки для эффективного распознавания с использованием компьютерных технологий. Проводится общий анализ предметной области.

Анализируются основные теоретические подходы к решению задачи обнаружения и распознавания объектов и символов. Приводится обоснование проблемы исследования и формулировки цели и задачи распознавания объектов и символов. Исследуется типовая модель системы распознавания образов, состав системы. Рассмотрены стандартные методы, используемые на каждом этапе обработки изображения.

Во второй главе описываются методы представления и обработки распознавания символов в рамках арабского языка, описываются области применения систем распознавания символов. Внимание заостряется на таком важном этапе работы системы распознавания, как предварительная обработка. Описан и реализован скелетный алгоритм и разработан алгоритм для определения базисной линии арабских слов. Эти алгоритмы протестированы с использованием базы данных рукописных названий Тунисских городов

гем/Ежг.

В третьей главе описывается разработанная система распознавания арабско-индийских цифр (рис. 1) с использованием интеграции различных классификаторов и комбинаций векторов. Исследованы индивидуальные классификаторы, полученные с помощью различных методов выделения признаков. Исследуется эффективность применения методов выделения признаков в различных комбинациях к распознаванию арабско-индийских цифр от одного до девяти. Представлено влияние интеграции различных классификаторов на точность распознавания цифр. Эти методы включают: зонирование (средние расстояния, метод среднего значения, кольцевое), гистограммы проекций, радон-преобразование и метод геометрических моментов. Кроме того, разработанная система может работать с различными типами источников ввода данных, например, напечатанные цифры, рукописные цифры и цифры, полученные из изображений автомобильных номерных знаков.

Чтобы улучшить качество распознавания и увеличить надежность разрабатываемой системы, производится поиск оптимальных комбинаций векторов и интеграция различных классификаторов.

При разработке программ выделения признаков используются различные независимые методы. В целях повышения эффективности системы применяется рейтинговое упорядочение комбинаций векторов для построения классификаторов.

Цр — Интеграция результатов нескольких классификаторов Р1 —Вектор признаков метода 1 Р* — Составные векторы признаков НС 1 —Нейронная сеть с использованием Р1

НС * —Нейронные сети спроектирован для исследования комбинаций векторов от различных методов выделения признаков

Р1 — РезультатНСТ1 = [>',(Л),у2(Л),---,л((-'?1)] Р* — Результат НС* Рис. 1. Общая схема системы распознавания

Методы выделения признаков включают зонирование, построение гистограмм проекций, радон-преобразование, и геометрические моменты.

Краткое описание используемых методов выделения признаков: ]. Зонирование (методы декомпозиции областей): • Средние расстояния зонирования (рис. 2): изображение цифры 60x40 пикселей разделено на 24 области, расстояния между белыми

пикселями в данной области и верхнем левом углу (0,0) вычислены, среднее значение расстояния вычислено. Расстояние белого пикселя (/, у), вычисляется по формуле:

(П

Среднее значение расстояния области, вычисляется по формуле:

2Х

р . =-

гврап

(2)

где п - количество белых пикселей в области. Метод среднего значения зонирования (рис. 3): в этом методе изображение цифры 60x40 делится на 24 области, для каждой области вычисляются отношения между суммированием значения пикселей, разделенного на размер блока, признак каждого блока вычисляется по формуле:

1

Л,

схг^Ъ

(3)

где г - количество строк в области, с - количество столбцов в области.

Рис.2. Средние Рис. 3. Метод среднего расстояния зонирования значения зонирования

Рис.4. Кольцевое зонирование

Вертикальная гистограмма

иьЛЛ

Рис. 5. Построение гистограмм проекций

• Кольцевое зонирование (рис. 4): позволяет выделить 30 признаков. Изображение разделено на 5 колец с радиусом 5, 10, 20, 30, и 40 соответственно. Каждое кольцо (круг) содержит 4 сектора. Признак есть отношение числа пикселей сегмента на число пикселей в секторе. Первое, второе и третье кольцо обеспечивают каждое по 8 признаков, а последние два кольца обеспечивают 4 и 2 признака соответственно.

2. Построение гистограмм проекций (рис. 5): метод позволяет построить гистограммы вертикальной, горизонтальной проекций и проекций главной и второй диагоналей. Этот метод позволяет извлекать глобальные признаки: изображение 60x40 делится на 4 сегмента по вертикали, 6 сегментов по горизонтали, 10 сегментов для главной диагонали, и 10 сегментов для второй диагонали. Для каждого сегмента вычисляется сумма значений пикселей, разделенная на размер сегмента.

3. Дискретное радон-преобразование: преобразование выполняется под углами 30°, 60°, 90°, 120°, 150°, и 180° соответственно, и затем коэффициенты преобразования объединяются в одном векторе. Размер вектора признаков является большим, поэтому чтобы удалить избыточные признаки и уменьшить размер вектора, применяется анализ основного компонента.

4. Геометрические моменты: признаки извлекаются с помощью геометрических инвариантных моментов, используемых как описание формы цифры. Метод предложен М. К. Ху, чаще всего его рассматривают как глобальное описание формы объекта. Двумерный момент порядка Гр, q) для изображения I в дискретной форме определяется выражением:

(4)

X у

Момент нулевого порядка mm определяет полную область формы, а моменты первого уровня m¡o, moi дают координаты центра объекта.

Центральные моменты являются инвариантными к преобразованиям изображений и определяются как:

Ррч=1^(х-хУЬ-У)Ч1(Х>У\ (5)

_ "íifj _ /Ял,

где х = —!i-, у = —ü

Центральные нормализованные моменты записываются в следующем

виде:

(6)

m

Р + Я , где у = +

Из формулы (6) получены семь основных соотношений, которые являются инвариантными к повороту и переносу двухмерного объекта на изображении и определяются выражениями:

М! =1120 +Т102' Щ — (л 20-Лог)+4П21Ь Щ = (лзо -Зтг)2 +(ЗП21 -Поз)2' м4 = (Л30 +Лп)2 +(Л21 +Т1оз)2>

М5 =(пзо -ЗгцгХлзо + Л12)Х[(Л30 -Пзо)2 -3(1121 + Лзо)21 (7)

+ (31121 ~ЛозХл21 +Л0з)х[з(т130+Т112)2 -(П21 + ЛОз)2] М6 =(^20 -Лог^Пзо + Л12)2 -(лоз +Л2|)2]+4Ли(язо +112X1103 +П21Х

м7 =(3т)21 "ЛОзХлзО +П12)Х[(П30 +Л12)2 — 3(^)21 +1103 )21

-(лзо -ЗЛ12ХП21 +лоз)х[3(лзо +Л12)2 -(Л21 + лоз)2]

Коэффициент М?, введенный как инвариант для наклонного объекта, позволяет определять зеркальные формы.

В данной работе признаки, получаемые с использованием описанных выше методов, представляются в виде векторов-столбцов размером их 1, и имеют следующий вид:

х,

X =

х„

где п — общее количество признаков. Например, в методе геометрических моментов элементам вектора-столбца ^ соответствуют значения коэффициентов МЬМ2,-,М7 из (?)■

Так как признаки имеют большой разброс значений, они нормализуются путем линейного сдвига интервала значений признаков в интервал [-1,1].

Для того чтобы распознавать цифры, используются полносвязанные нейронные сети (НС), имеющие три слоя: входной, скрытый и выходной. Размерность входного слоя равна размеру вектора признаков. Выходной слой содержит 9 нейронов. Размерность скрытого слоя равна сумме нейронов входного и выходного слоев.

Нормировка классификаторов на выходе производится по формуле:

ПА) (8)

>1

где М — количество классов и а = а^тах {(} (Р1)}.

Для оценки используемых методов выделения признаков используется шесть нейронных сетей (HCl, НС2,..., НС6). Все сети имеют одинаковую архитектуру и отличаются по размерам входного и скрытого слоев.

Другой набор нейронных сетей ({НС*}) спроектирован для исследования комбинаций векторов (F*), полученных различными методами выделения

признаков. Используется описанная выше архитектура нейронной сети, размерность входного слоя равна новому размеру вектора признаков, размерность скрытого слоя приблизительно равна сумме размерностей входного и выходного слоев.

Модель, по которой производится интеграция классификаторов, зависит от типа принятия решения классификатором. Мягкие классификаторы дают на выходе несколько решений (результатов), каждое с определенной степенью вероятности. Жесткие классификаторы на выходе дают одно решение (результат). Использование НС с количеством выходов, равным количеству классов, дает возможность исследовать два направления интеграции результатов нескольких классификаторов.

Для интеграции результатов жестких классификаторов используется модель мажоритарного голосования. Для интеграции результатов мягких классификаторов используется модель вероятностных интеграторов.

Рис. 6. Архитектура интеграции классификаторов

1) Модель ранжированного голосования (ранговые классификаторы) описывается следующим образом (рис. 6). Для N классификаторов ищется (ЛГ + 1)/2 классификаторов, которые дают одинаковые решения. Если такие классификаторы найдены, то принимается их решение, иначе ищем N12 одинаковых решений, если они существуют, выбирается результат группы классификаторов с максимальным рангом. В случае (.V > 4) может возникнуть несколько групп классификаторов, имеющих одинаковые решения. В таком

случае на выходе принимается решение той группы классификаторов, которая имеет максимальный ранг (ранг группы равен сумме рангов всех классификаторов из этой группы). Если все классификаторы имеют разные решения, то выбирается решение классификатора с максимальным рангом.

2) Модель вероятностных интеграторов

Вероятностный интегратор — это некоторый вероятностный классификатор, который получает на входе результаты интегрируемых классификаторов (Р/.-.Р^) и выдает на выходе оценки апостериорных вероятностей классов (Р).

На примере байесовского интегратора:

р(шк\ц,...,Р„) =—тгг-—-—,

ЯгГ^М)]

н

(9)

где 1\— результаты классификатора г, Р, = [/?с(ю, ,рс{а>и

!\(а>, 1 Хс) — апостериорная вероятность класса сок классификатора с; Хс — вектор признаков классификатора с; N — количество классификаторов; М —

м

количество классов и 1 Хс) = 1;

м

С целью проверки методов выделения признаков проведен ряд испытаний. База данных образцов цифр содержит 4176 символов, которые используются для обучения и тестирования системы. В первом эксперименте каждый вектор признаков подавался на вход НС. Из таблицы 1 видно, что метод геометрических моментов дает наилучший уровень распознавания (96,88%), а метод среднего расстояния зонирования имеет худший результат (92,21%).

Таблица 1.

Метод выделения признаков Вид вектор Размерность слоя нейронов Уровень ранг

признаков Входной слой скрытый слой распознавания

Р1 Средние расстояния зонирования X 24 35 92,21 1

¥2 Метод среднего значения зонирования X ■>*24]Г 24 35 94,50 3

РЗ Гистограммы проекций X •>*зоГ 30 40 95,90 5

Р4 Дискретное радон-преобразование X 40 50 95,33 4

Р5 Кольцевое зонирование X 30 40 94,55 2

?6 Геометрические моменты X 18 30 96,88 6

Во втором эксперименте (рис. 7) все комбинации векторов признаков подавались на вход соответствующего классификатора. В случае комбинирования векторов наблюдалось повышение уровня распознавания. Так, например, комбинирование векторов признаков метода гистограмм проекций и

метода геометрических моментов дает уровень распознавания 99,27%, а при комбинировании векторов методов геометрических моментов и среднего значения зонирования уровень распознавания составил 99,53%.

100%

I 98%

X

аз

| 97%

со О

0 96% со

а.

1 95%

94%

93%

92%

Р1 Р2 Р5 Р4 РЗ Р6 М Р1 Р2 Р2 Р1 Р2 РЗ Р4 Р5 Р7 Р? Р2 РЗ Р4 РЗ Р2 РЗ Р5 РЗ Р5 Р4 Р4 Р5 Р6 Р4 Р6 Р6 Р5 Р6 Р6 Комбинирование векторов признаков

Рис. 7. Результаты комбинации двух векторов признаков

I

; В третьем эксперименте исследовалась интеграция результатов

нескольких классификаторов при использовании моделей вероятностных ) интеграторов и моделей мажоритарного голосования. Результаты говорят об увеличении уровня распознавания (рис.8).

100

1 2 3 4 5

Количество классификаторов

Рис.8. Интеграция результатов различных классификаторов

В четвертой главе проводится анализ прикладных возможностей разработанных алгоритмов в системе локализации и распознавания на изображении номерного знака, содержащего арабско-индийские цифры.

Приводится описание программной системы, реализующей применение разработанных алгоритмов.

(Начало)

Извлечение видеокадра из видеокамеры

Предварительная обработка

Локализация номерного

Коррекция наклона номерного знака

Сегментаци знака на ч номерного символы

Распознавание символов

^Конец^

Рис. 9. Диаграмма предложенной системы распознавания номерного знака

Предполагается, что система локализации и распознавания номерного знака включена в сенсорную систему обнаружения объекта (например, датчик транспортного средства или система применения правил уличного движения). На рис. 9 представлена предложенная система локализации и распознавания номерного знака. Как только сенсорная система обнаруживает искомый объект, активизируется видеокамера. Изображение, зафиксированное видеокамерой, посылается системе локализации и распознавания номерного знака, в которой потенциальные номерные знаки извлекаются из изображения. Если номерной знак не найден, система возвращается в состояние ожидания изображения. Если найдено потенциальное местонахождение номерных знаков, то производится коррекция наклона номерного знака.

Затем в системе активизируется этап сегментации номерного знака на символы, на данном этапе номерной знак разделяется на символы и слова. После завершения процесса сегментации система переходит к этапу распознавания символов. Эти два этапа повторяются до достижения оптимальных результатов и для сегментации и для распознавания. Символы,

распознанные на данном этапе как элементы номерного знака, затем проверяются на этапе проверки номерного знака.

вариантов возможных значений этого элемента. Данная процедура повторяется для всех потенциальных местоположений номерного знака на исходном изображении.

Предварительная обработка изображения осуществляется с целью устранения различного рода помех, неоднородностей фона на изображении номерного знака, подлежащего распознаванию.

Рис. 10. Блок-схема подсистемы локализации номерного знака

Входной информацией для подсистемы локализации номерного знака является оцифрованное изображение автомобиля, получаемое с видеокамеры.

Цель первого шага обработки этого изображения состоит в том, чтобы выделить информацию о номерном знаке, отделив ее от остальной части изображения, а затем очистить выделенные потенциальные местоположения номерного знака от шума и других объектов.

Проблема локализации номерного знака усложняется низким качеством изображений, получаемых с видеокамеры. В связи с этим часто трудно отличить символы номерного знака от фоновых изображений или от шума, возникающего из-за различных условий освещения.

В общем случае конечной целью алгоритма локализации номерного знака является принятие решения о принадлежности каждого пиксела изображения к одному из двух классов: символу номерного знака или фону, сравниваются с базой данных. Если какой-либо из элементов номерного знака пропущен или не может быть распознан, система предлагает несколько

Группа предполагаемых элементов номерного знака сравнивается с эталонами форм номерных знаков, затем элементы распознаются и

Блок-схема подсистемы локализации номерного знака показана на (рис. 10). Основными этапами обработки изображения и локализации номерного знака являются следующие:

1. Изображение преобразуется в двухуровневое изображение с использованием глобального и локального методов.

2. Для каждого метода преобразования в двухуровневое изображение производится объединение всех черных пикселов изображения в непересекающиеся группы.

3. Классификация выделенных связных компонентов на символ и фон.

4. Объединение и проверка результатов классификации.

На первом шаге осуществляется маркировка всех связных компонентов. Для каждого связного компонента запоминается его площадь, периметр, а также координаты левой, правой, верхней и нижней границ.

На втором шаге для каждого связного компонента используется следующие методы выделения признаков (метод среднего значения зонирования, построение гистограмм проекций, и геометрические моменты).

Для принятия решения о принадлежности связного компонента, значения его признаков поступают на нейронную сеть. Используется описанная выше архитектура нейронной сети, имеющая 3 слоя, размерность входного слоя равна размеру вектора признаков, размерность выходного слоя содержит два нейрона( символ, фон).

Тестирование разработанной системы производилось на 500 различных изображениях автомобилей, полученных в различных условиях (освещенность, яркость, угол наклона) с камер, установленных на дорогах Иордании. На рис. 11 показан пример результата локализации номерного знака.

В заключении содержится перечень задач, которые были решены в результате диссертационного исследования, а также сведения об апробации и внедрении результатов работы.

-•-"790523

Рис. 11. Пример локализаций номерного знака

ОСНОВНЫЕ НАУЧНЫЕ И ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ

1. Разработан алгоритм для обнаружения базисной линии слова арабского языка.

2. Разработан метод распознавания арабско-индийских цифр с использованием различных методов выделения признаков.

3. Предложен метод оценки качества признаков для распознавания арабско-индийских цифр.

4. Разработан метод повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов.

5. Предложен метод выявления характерных признаков для эффективного выделения и распознавания автомобильного номерного знака при наличии помех и при различных углах обзора.

6. Разработаны программы локализации и идентификации автомобильных номерных знаков,

7. Экспериментальная апробация показала эффективность разработанных алгоритмов и программ.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ:

В рецензируемых журналах из списка ВАК:

1. Аль-Рашайдех, X. Метод распознавания арабско-индийских цифр / X. Аль-Рашайдех, С. В. Кулешов.// Изв. вузов. Приборостроение. -2007. -Т. 50, №12.-С. 8-12.

2. Аль-Рашайда, Хасан. X. Предварительная обработка для представления символов арабского языка // Изв. СПбГЭТУ «ЛЭТИ» (Известия государственного электротехнического университета), «Сер. Информатика, управление и компьютерные технологии». - 2006. - Вып. 3. — С. 75-81.

В других изданиях:

3. Al-Rashaideh, Hasan. Preprocessing phase for Arabic word handwritten Recognition (Предварительная обработка для распознавания рукописных слов арабского языка) // Информационные процессы, - 2006. - Т. 6, № 1, -С. 11-19.

4. Аль-Рашайда, Хасан. Выявление несанкционированных вставок в видеопотоке методом ранговых распределений / С. В. Кулешов, А. А. Зайцева, Хасан Аль-Рашайда // Труды СПИИРАН. - СПб.: Наука. - 2006. -Т. 2, Вып. З.-С 96- 101.

5. Al-Rashaideh, Hasan. Arabic-Indic number recognition using combining multiple classifiers and multiple feature vectors (Распознавание арабско-индийских чисел с использованием составных классификаторов и комбинирования векторов признаков) // In: 2nd Jordan International Conference on Computer Science & Engineering (JICCSE). Jordan, Amman, Dec 2006, - pp. 67-73.

Подписано в печать 13.10.08. Формат 60*84 1/16. Бумага офсетная. Печать офсетная. Печ. л. 1,0. Тираж 100 экз. Заказ 66.

Отпечатано с готового оригинал-макета в типографии Издательства СПбГЭТУ "ЛЭТИ"

Издательство СПбГЭТУ "ЛЭТИ" 197376, С.-Петербург, ул. Проф. Попова, 5

Оглавление автор диссертации — кандидата технических наук Аль-Рашайда Хасан Хусейн

СОЕРЖАНИЕ.1.

ВВЕДЕНИЕ.

ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ.

1.1. Исторический обзор.

1.2. Арабские символы.

1.2.1. Характеристики сгшвоюв арабского языка.

1.3. Арабско-индийские цифры.

1.4. Краткий обзор распознавания символов.

1.4.1. Распознавание символов в режиме on-line.

1.4.2. Распознавание символов в режиме off-line.

1.5. Типовая модель системы распознавания символов.

1.5.1. Стадия предварительной обработки.

1.5.2. Стадия сегментации.

1.5.3. Стадия выделения признаков.

1.5.4. Стадия обучения и распознавания.

1.5.5. Стадия постобработки.

1.6. Выводы по первой главе.

ГЛАВА 2. ПРЕДОБРАБОТКА ДЛЯ ПРЕДСТАВЛЕНИЯ СИМВОЛОВ АРАБСКОГО ЯЗЫКА

2.1. Введение.

2.2. Система распознавания.

2.3. Набор данных.

2.4. Фаза предварительной обработки.

2.4.1. Обнаружение скелета посредством утончения.

2.4.2. Базисная линия идентифицирования.

2.5. Выводы по второй главе.

ГЛАВА 3. МЕТОД РАСПОЗНАВАНИЯ АРАБСКО-ИНДИЙСКИХ ЦИФР.

3.1. Введение.

3.2. Набор данных.

3.3. Система Распознавания.

3.3.1. Предварительная обработка.

3.3.1.1. Коррекция наклона цифры.

3.3.2. Выделение признаков.

3.3.3. Классификация и распознавание.

3.3.4. Критерии качества распознавания.

3.3.5. Интеграция результатов нескольких классификаторов.

3.3.5.1. Модель принципа мажоритарного голосования.

3.3.5.1.1. Простое мажоритарное голосование. ' 3.3.5.1.2. ранжированное голосование (раш овые классификаторы).

3.3.5.2. Модель вероятностных интеграторов.

3.3.5.2.1. Байесовский интегратор.

3.4. Оценка полученных результатов.

3.5. Выводы по третье главе.

ГЛАВА 4. ЛОКАЛИЗАЦИЯ И РАСПОЗНАВАНИЕ НОМЕРНОГО ЗНАКА.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Аль-Рашайда Хасан Хусейн

4.2. Подходы к решению задачи.87

4.3. разработанный подход к решению задачи.90

4.4. Стадия предварительная обработка изображения.91

4.5. Стадия локализации номерного знака.92

4.5.1. преобразования в черно-белое изображение.94

4.5.1Л. Глобальные методы.95

4.5.1.2. Локальный метод (адаптивный метод).97

4.5.2. маркировка связных компонентов.100

4.5.3. Классификация выделенных связных компонентов.101

4.6. Выводы по четвертой главе.106

ЗАКЛЮЧЕНИЕ.108

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.109

ПРИЛОЖЕНИЕ 1.116

ПРИЛОЖЕНИЕ 2.118

ПРИЛОЖЕНИЕ 3.124

ВВЕДЕНИЕ

Развитие компьютерных технологий обеспечивает их применение в широком диапазоне областей, в том числе в области автоматического распознавания символов. Известны автоматизированные системы распознавания символов английского, японского и китайского языков, в то время как для внедрения подобных систем на других языках, например, на арабском, необходимы дополнительные исследования. Простое применение уже разработанных алгоритмов во многих случаях невозможно из-за наличия в каждом языке своих специфических символов, знаков и лингвистики построения текстов.