автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование и разработка методов локализации, идентификации и распознавания арабских символов
Автореферат диссертации по теме "Исследование и разработка методов локализации, идентификации и распознавания арабских символов"
На правах рукописи
0034562 1G
Аль-Рашайда Хасан Хусейн
ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ ЛОКАЛИЗАЦИИ, ИДЕНТИФИКАЦИИ« И РАСПОЗНАВАНИЯ АРАБСКИХ СИМВОЛОВ (НА ПРИМЕРЕ НОМЕРНОГО ЗНАКА АВТОМОБИЛЯ)
Специальность: 05.13.01 — Системный анализ, управление и обработка информации (технические системы)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
г№
Санкт-Петербург 2008
003456216
Работа выполнена в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» им. В.И. Ульянова (Ленина)
Научный руководитель: доктор технических наук,
профессор Александров Виктор Васильевич
Официальные оппоненты: доктор технических наук,
профессор Городецкий Андрей Емельянович
кандидат технических наук,
доцент Первицкий Александр Юрьевич
Ведущая организация:
Государственное образовательное учреждение высшего профессионального образования «Санкт-Петербургский университет аэрокосмического
приборостроения»
Защита состоится "/ " декабря 2008г. В ¡6 часов на заседании совета по защите докторских и кандидатских диссертаций Д 212.238.07 Санкт-Петербургского государственного электротехнического университета им. В.И.Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.
С диссертацией можно ознакомиться в библиотеке университета. Автореферат разослан " ноября 2008г.
Ученый секретарь совета по защите докторских и кандидатских диссертаций
Цехановский В.В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Развитие компьютерных технологий обеспечивает их применение в широком диапазоне областей, в том числе в области автоматического распознавания символов. Известны автоматизированные системы распознавания символов английского, японского и китайского языков, в то время как для внедрения подобных систем на других языках, например, на арабском, необходимы дополнительные исследования. Простое применение уже разработанных алгоритмов во многих случаях невозможно из-за наличия в каждом языке своих специфических символов, знаков и лингвистики построения текстов.
Проблема автоматизированного ввода в компьютер текстовой информации также не потеряла своей актуальности. Более того, она приобретает все большую остроту в связи с массовой информатизацией всех сторон жизни.
Вследствие доступности и относительной дешевизны мощных микропроцессоров, в настоящее время появляется возможность реализации современных специализированных систем, например видео контроль автомобильного движения. Это комплексная проблема поиска, локализации и идентификации номерного знака в реальном масштабе времени при движении объектов.
В данной диссертационной работе рассматривается разработка автоматизированной системы распознавания арабско-индийских цифр и символов арабского языка, что важно для многих предметных областей, в том числе и в области локализации и распознавания номерных знаков, в которых содержатся арабско-индийские цифры и символы арабского и английского языков. Это связано с тем, что в последнее время возросла интенсивность движения и количество автомобильных аварий.
Разрабатываемая система автоматически отслеживает нарушителей дорожного движения и записывает автомобильные номера нарушителей в базу данных. Такой автоматический контроль позволяет ощутимо снизить количество нарушений и аварийность на дорогах Иордании.
Анализ известных систем показал, что они, во-первых, дают неудовлетворительные результаты на изображениях низкого качества (которые обычно как раз и получают с видеокамер), во-вторых, не работают на сложных (разноплановых) изображениях, так как на них трудно локализовать требуемую область распознавания, а в-третьих, все они ориентированы на строго определенные условия (освещенность, угол поворота камеры, яркость и т.д.).
Поиск эффективного решения описанной задачи локализации и распознавания номерного знака (арабского) составляет суть диссертационной работы.
Объектом исследования являются компьютерные методы обработки изображений, иерархические и статистические методы классификации, а также ранговые оценки семантического содержания.
Предметом исследования являются инструментально-технические средства обработки изображений: видеокамера, процессор и программы экспериментальной оценки качества распознавания арабско-индийских цифр, слов и номерных знаков.
Целью работы является исследование и разработка метода, алгоритма и программ распознавания знаков, символов, цифр и букв арабского языка, обеспечивающих анализ и обработку информации на изображении с целью обнаружения, локализации и идентификации автомобильного номерного знака. Для достижения поставленной цели в диссертационной работе решаются следующие задачи:
1. Выделение специфических особенностей символов, знаков, букв и цифр арабского языка;
2. Исследование основных подходов к системам распознавания символов арабского языка и арабско-индийских цифр;
3. Разработка алгоритма выделения специфических признаков арабского языка (выделение скелета слов, обнаружение базисной линии слов);
4. Разработка метода оценки качества признаков для распознавания арабско-индийских цифр;
5. Разработка метода повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов;
6. Разработка программы локализации и идентификации автомобильных номерных знаков и ее экспериментальная апробация;
7. Исследование надежности распознавания автомобильных номерных знаков, снятых видеокамерой под разными углами.
Основные методы исследования. В качестве методов исследования использовались цифровые методы обработки изображений, корреляционные и нейронные классификаторы, морфологические методы селекции элементов изображения.
Научная новизна. В диссертации предложены и решены следующие задачи:
1. Разработан алгоритм обнаружения базисной линии слова арабского языка;
2. Разработан алгоритм и программа распознания арабско-индийских цифр с использованием нескольких методов выделения признаков;
3. Для повышения надежности системы распознавания используются обучаемые матрицы как мажоритарные классификаторы;
4. Локализация и распознавание автомобильного номерного (арабского) знака при наличии помех на изображении и при разных углах съемки;
Положения, выносимые на защиту. На основе проведенной теоретической работы и экспериментальной апробации разработанных методов на защиту выносятся следующие положения:
1. Алгоритм обнаружения базисной линии слов арабского языка.
2. Система распознавания арабско-индийских цифр с использованием
комбинаций векторов и интеграции различных классификаторов.
3. Алгоритм локализации номерного знака с использованием нейро-сетевого
классификатора и маркировка значимых (черных) пикселов.
Теоретическая значимость работы заключается в разработке системы распознавания арабско-индийских цифр и символов арабского языка, алгоритма обнаружения базисной линии слов арабского языка, и алгоритма локализации и распознавания номерного знака.
Практическая ценность. Заключается в создании системы автоматизированного ввода и обработки текстов на арабском языке, что позволяет реализовать: распознавание и идентификацию номерного знака, считывающие устройства для банковских чеков, почтовые системы считывания, автоматизацию делопроизводства, распознавание и аутентификацию подписи.
Апробация работы. Научные результаты и основные положения работы представлялись на конференции: II Иорданская международная конференция по вычислительной технике "JICCSE-2006 " (Амман, Иордания, 2006), X Санкт-Петербургская международная конференция «Региональная информатика-2006» (Санкт-Петербург, Россия, 2006).
Реализация и внедрение. Полученные результаты реализованы в виде ряда программных систем на различных языках программирования (Java, Matlab). Данные программные системы используются для тестирования и в качестве системы локализации и распознавания номерного знака.
Публикации. Основные теоретические и практические результаты диссертации опубликованы в 5 работах, среди которых публикации в ведущих рецензируемых изданиях, рекомендованных в действующем перечне ВАК 2 работы, а также материалы научно-технических и всероссийских конференций в количестве трех.
Структура и объем диссертационной работы. Диссертация состоит из введения, 4 глав, заключения, излагается на 131 странице, включая перечень используемой литературы из 75 наименований, 40 рисунков и 4 таблицы. Кроме того, в диссертации имеется приложение на 28 листах, содержащие в себе примеры работы разработанных программ, реализующих алгоритмы, описанные в диссертации.
СОДЕРЖАНИЕ РАБОТЫ
Во введении содержится обоснование актуальности темы диссертационной работы, сформулированы основные научные результаты, выносимые автором на защиту, а также практическая ценность полученных результатов.
В первой главе обсуждается и исследуется специфика написания символов арабского языка с целью их предварительной обработки для эффективного распознавания с использованием компьютерных технологий. Проводится общий анализ предметной области.
Анализируются основные теоретические подходы к решению задачи обнаружения и распознавания объектов и символов. Приводится обоснование проблемы исследования и формулировки цели и задачи распознавания объектов и символов. Исследуется типовая модель системы распознавания образов, состав системы. Рассмотрены стандартные методы, используемые на каждом этапе обработки изображения.
Во второй главе описываются методы представления и обработки распознавания символов в рамках арабского языка, описываются области применения систем распознавания символов. Внимание заостряется на таком важном этапе работы системы распознавания, как предварительная обработка. Описан и реализован скелетный алгоритм и разработан алгоритм для определения базисной линии арабских слов. Эти алгоритмы протестированы с использованием базы данных рукописных названий Тунисских городов
гем/Ежг.
В третьей главе описывается разработанная система распознавания арабско-индийских цифр (рис. 1) с использованием интеграции различных классификаторов и комбинаций векторов. Исследованы индивидуальные классификаторы, полученные с помощью различных методов выделения признаков. Исследуется эффективность применения методов выделения признаков в различных комбинациях к распознаванию арабско-индийских цифр от одного до девяти. Представлено влияние интеграции различных классификаторов на точность распознавания цифр. Эти методы включают: зонирование (средние расстояния, метод среднего значения, кольцевое), гистограммы проекций, радон-преобразование и метод геометрических моментов. Кроме того, разработанная система может работать с различными типами источников ввода данных, например, напечатанные цифры, рукописные цифры и цифры, полученные из изображений автомобильных номерных знаков.
Чтобы улучшить качество распознавания и увеличить надежность разрабатываемой системы, производится поиск оптимальных комбинаций векторов и интеграция различных классификаторов.
При разработке программ выделения признаков используются различные независимые методы. В целях повышения эффективности системы применяется рейтинговое упорядочение комбинаций векторов для построения классификаторов.
Цр — Интеграция результатов нескольких классификаторов Р1 —Вектор признаков метода 1 Р* — Составные векторы признаков НС 1 —Нейронная сеть с использованием Р1
НС * —Нейронные сети спроектирован для исследования комбинаций векторов от различных методов выделения признаков
Р1 — РезультатНСТ1 = [>',(Л),у2(Л),---,л((-'?1)] Р* — Результат НС* Рис. 1. Общая схема системы распознавания
Методы выделения признаков включают зонирование, построение гистограмм проекций, радон-преобразование, и геометрические моменты.
Краткое описание используемых методов выделения признаков: ]. Зонирование (методы декомпозиции областей): • Средние расстояния зонирования (рис. 2): изображение цифры 60x40 пикселей разделено на 24 области, расстояния между белыми
пикселями в данной области и верхнем левом углу (0,0) вычислены, среднее значение расстояния вычислено. Расстояние белого пикселя (/, у), вычисляется по формуле:
(П
Среднее значение расстояния области, вычисляется по формуле:
2Х
р . =-
гврап
(2)
где п - количество белых пикселей в области. Метод среднего значения зонирования (рис. 3): в этом методе изображение цифры 60x40 делится на 24 области, для каждой области вычисляются отношения между суммированием значения пикселей, разделенного на размер блока, признак каждого блока вычисляется по формуле:
1
Л,
схг^Ъ
(3)
где г - количество строк в области, с - количество столбцов в области.
Рис.2. Средние Рис. 3. Метод среднего расстояния зонирования значения зонирования
Рис.4. Кольцевое зонирование
Вертикальная гистограмма
иьЛЛ
Рис. 5. Построение гистограмм проекций
• Кольцевое зонирование (рис. 4): позволяет выделить 30 признаков. Изображение разделено на 5 колец с радиусом 5, 10, 20, 30, и 40 соответственно. Каждое кольцо (круг) содержит 4 сектора. Признак есть отношение числа пикселей сегмента на число пикселей в секторе. Первое, второе и третье кольцо обеспечивают каждое по 8 признаков, а последние два кольца обеспечивают 4 и 2 признака соответственно.
2. Построение гистограмм проекций (рис. 5): метод позволяет построить гистограммы вертикальной, горизонтальной проекций и проекций главной и второй диагоналей. Этот метод позволяет извлекать глобальные признаки: изображение 60x40 делится на 4 сегмента по вертикали, 6 сегментов по горизонтали, 10 сегментов для главной диагонали, и 10 сегментов для второй диагонали. Для каждого сегмента вычисляется сумма значений пикселей, разделенная на размер сегмента.
3. Дискретное радон-преобразование: преобразование выполняется под углами 30°, 60°, 90°, 120°, 150°, и 180° соответственно, и затем коэффициенты преобразования объединяются в одном векторе. Размер вектора признаков является большим, поэтому чтобы удалить избыточные признаки и уменьшить размер вектора, применяется анализ основного компонента.
4. Геометрические моменты: признаки извлекаются с помощью геометрических инвариантных моментов, используемых как описание формы цифры. Метод предложен М. К. Ху, чаще всего его рассматривают как глобальное описание формы объекта. Двумерный момент порядка Гр, q) для изображения I в дискретной форме определяется выражением:
(4)
X у
Момент нулевого порядка mm определяет полную область формы, а моменты первого уровня m¡o, moi дают координаты центра объекта.
Центральные моменты являются инвариантными к преобразованиям изображений и определяются как:
Ррч=1^(х-хУЬ-У)Ч1(Х>У\ (5)
_ "íifj _ /Ял,
где х = —!i-, у = —ü
Центральные нормализованные моменты записываются в следующем
виде:
(6)
m
Р + Я , где у = +
Из формулы (6) получены семь основных соотношений, которые являются инвариантными к повороту и переносу двухмерного объекта на изображении и определяются выражениями:
М! =1120 +Т102' Щ — (л 20-Лог)+4П21Ь Щ = (лзо -Зтг)2 +(ЗП21 -Поз)2' м4 = (Л30 +Лп)2 +(Л21 +Т1оз)2>
М5 =(пзо -ЗгцгХлзо + Л12)Х[(Л30 -Пзо)2 -3(1121 + Лзо)21 (7)
+ (31121 ~ЛозХл21 +Л0з)х[з(т130+Т112)2 -(П21 + ЛОз)2] М6 =(^20 -Лог^Пзо + Л12)2 -(лоз +Л2|)2]+4Ли(язо +112X1103 +П21Х
м7 =(3т)21 "ЛОзХлзО +П12)Х[(П30 +Л12)2 — 3(^)21 +1103 )21
-(лзо -ЗЛ12ХП21 +лоз)х[3(лзо +Л12)2 -(Л21 + лоз)2]
Коэффициент М?, введенный как инвариант для наклонного объекта, позволяет определять зеркальные формы.
В данной работе признаки, получаемые с использованием описанных выше методов, представляются в виде векторов-столбцов размером их 1, и имеют следующий вид:
х,
X =
х„
где п — общее количество признаков. Например, в методе геометрических моментов элементам вектора-столбца ^ соответствуют значения коэффициентов МЬМ2,-,М7 из (?)■
Так как признаки имеют большой разброс значений, они нормализуются путем линейного сдвига интервала значений признаков в интервал [-1,1].
Для того чтобы распознавать цифры, используются полносвязанные нейронные сети (НС), имеющие три слоя: входной, скрытый и выходной. Размерность входного слоя равна размеру вектора признаков. Выходной слой содержит 9 нейронов. Размерность скрытого слоя равна сумме нейронов входного и выходного слоев.
Нормировка классификаторов на выходе производится по формуле:
ПА) (8)
>1
где М — количество классов и а = а^тах {(} (Р1)}.
Для оценки используемых методов выделения признаков используется шесть нейронных сетей (HCl, НС2,..., НС6). Все сети имеют одинаковую архитектуру и отличаются по размерам входного и скрытого слоев.
Другой набор нейронных сетей ({НС*}) спроектирован для исследования комбинаций векторов (F*), полученных различными методами выделения
признаков. Используется описанная выше архитектура нейронной сети, размерность входного слоя равна новому размеру вектора признаков, размерность скрытого слоя приблизительно равна сумме размерностей входного и выходного слоев.
Модель, по которой производится интеграция классификаторов, зависит от типа принятия решения классификатором. Мягкие классификаторы дают на выходе несколько решений (результатов), каждое с определенной степенью вероятности. Жесткие классификаторы на выходе дают одно решение (результат). Использование НС с количеством выходов, равным количеству классов, дает возможность исследовать два направления интеграции результатов нескольких классификаторов.
Для интеграции результатов жестких классификаторов используется модель мажоритарного голосования. Для интеграции результатов мягких классификаторов используется модель вероятностных интеграторов.
Рис. 6. Архитектура интеграции классификаторов
1) Модель ранжированного голосования (ранговые классификаторы) описывается следующим образом (рис. 6). Для N классификаторов ищется (ЛГ + 1)/2 классификаторов, которые дают одинаковые решения. Если такие классификаторы найдены, то принимается их решение, иначе ищем N12 одинаковых решений, если они существуют, выбирается результат группы классификаторов с максимальным рангом. В случае (.V > 4) может возникнуть несколько групп классификаторов, имеющих одинаковые решения. В таком
случае на выходе принимается решение той группы классификаторов, которая имеет максимальный ранг (ранг группы равен сумме рангов всех классификаторов из этой группы). Если все классификаторы имеют разные решения, то выбирается решение классификатора с максимальным рангом.
2) Модель вероятностных интеграторов
Вероятностный интегратор — это некоторый вероятностный классификатор, который получает на входе результаты интегрируемых классификаторов (Р/.-.Р^) и выдает на выходе оценки апостериорных вероятностей классов (Р).
На примере байесовского интегратора:
р(шк\ц,...,Р„) =—тгг-—-—,
ЯгГ^М)]
н
(9)
где 1\— результаты классификатора г, Р, = [/?с(ю, ,рс{а>и
!\(а>, 1 Хс) — апостериорная вероятность класса сок классификатора с; Хс — вектор признаков классификатора с; N — количество классификаторов; М —
м
количество классов и 1 Хс) = 1;
м
С целью проверки методов выделения признаков проведен ряд испытаний. База данных образцов цифр содержит 4176 символов, которые используются для обучения и тестирования системы. В первом эксперименте каждый вектор признаков подавался на вход НС. Из таблицы 1 видно, что метод геометрических моментов дает наилучший уровень распознавания (96,88%), а метод среднего расстояния зонирования имеет худший результат (92,21%).
Таблица 1.
Метод выделения признаков Вид вектор Размерность слоя нейронов Уровень ранг
признаков Входной слой скрытый слой распознавания
Р1 Средние расстояния зонирования X 24 35 92,21 1
¥2 Метод среднего значения зонирования X ■>*24]Г 24 35 94,50 3
РЗ Гистограммы проекций X •>*зоГ 30 40 95,90 5
Р4 Дискретное радон-преобразование X 40 50 95,33 4
Р5 Кольцевое зонирование X 30 40 94,55 2
?6 Геометрические моменты X 18 30 96,88 6
Во втором эксперименте (рис. 7) все комбинации векторов признаков подавались на вход соответствующего классификатора. В случае комбинирования векторов наблюдалось повышение уровня распознавания. Так, например, комбинирование векторов признаков метода гистограмм проекций и
метода геометрических моментов дает уровень распознавания 99,27%, а при комбинировании векторов методов геометрических моментов и среднего значения зонирования уровень распознавания составил 99,53%.
100%
I 98%
X
аз
| 97%
со О
0 96% со
а.
1 95%
94%
93%
92%
Р1 Р2 Р5 Р4 РЗ Р6 М Р1 Р2 Р2 Р1 Р2 РЗ Р4 Р5 Р7 Р? Р2 РЗ Р4 РЗ Р2 РЗ Р5 РЗ Р5 Р4 Р4 Р5 Р6 Р4 Р6 Р6 Р5 Р6 Р6 Комбинирование векторов признаков
Рис. 7. Результаты комбинации двух векторов признаков
I
; В третьем эксперименте исследовалась интеграция результатов
нескольких классификаторов при использовании моделей вероятностных ) интеграторов и моделей мажоритарного голосования. Результаты говорят об увеличении уровня распознавания (рис.8).
100
1 2 3 4 5
Количество классификаторов
Рис.8. Интеграция результатов различных классификаторов
В четвертой главе проводится анализ прикладных возможностей разработанных алгоритмов в системе локализации и распознавания на изображении номерного знака, содержащего арабско-индийские цифры.
Приводится описание программной системы, реализующей применение разработанных алгоритмов.
(Начало)
Извлечение видеокадра из видеокамеры
Предварительная обработка
Локализация номерного
Коррекция наклона номерного знака
Сегментаци знака на ч номерного символы
Распознавание символов
^Конец^
Рис. 9. Диаграмма предложенной системы распознавания номерного знака
Предполагается, что система локализации и распознавания номерного знака включена в сенсорную систему обнаружения объекта (например, датчик транспортного средства или система применения правил уличного движения). На рис. 9 представлена предложенная система локализации и распознавания номерного знака. Как только сенсорная система обнаруживает искомый объект, активизируется видеокамера. Изображение, зафиксированное видеокамерой, посылается системе локализации и распознавания номерного знака, в которой потенциальные номерные знаки извлекаются из изображения. Если номерной знак не найден, система возвращается в состояние ожидания изображения. Если найдено потенциальное местонахождение номерных знаков, то производится коррекция наклона номерного знака.
Затем в системе активизируется этап сегментации номерного знака на символы, на данном этапе номерной знак разделяется на символы и слова. После завершения процесса сегментации система переходит к этапу распознавания символов. Эти два этапа повторяются до достижения оптимальных результатов и для сегментации и для распознавания. Символы,
распознанные на данном этапе как элементы номерного знака, затем проверяются на этапе проверки номерного знака.
вариантов возможных значений этого элемента. Данная процедура повторяется для всех потенциальных местоположений номерного знака на исходном изображении.
Предварительная обработка изображения осуществляется с целью устранения различного рода помех, неоднородностей фона на изображении номерного знака, подлежащего распознаванию.
Рис. 10. Блок-схема подсистемы локализации номерного знака
Входной информацией для подсистемы локализации номерного знака является оцифрованное изображение автомобиля, получаемое с видеокамеры.
Цель первого шага обработки этого изображения состоит в том, чтобы выделить информацию о номерном знаке, отделив ее от остальной части изображения, а затем очистить выделенные потенциальные местоположения номерного знака от шума и других объектов.
Проблема локализации номерного знака усложняется низким качеством изображений, получаемых с видеокамеры. В связи с этим часто трудно отличить символы номерного знака от фоновых изображений или от шума, возникающего из-за различных условий освещения.
В общем случае конечной целью алгоритма локализации номерного знака является принятие решения о принадлежности каждого пиксела изображения к одному из двух классов: символу номерного знака или фону, сравниваются с базой данных. Если какой-либо из элементов номерного знака пропущен или не может быть распознан, система предлагает несколько
Группа предполагаемых элементов номерного знака сравнивается с эталонами форм номерных знаков, затем элементы распознаются и
Блок-схема подсистемы локализации номерного знака показана на (рис. 10). Основными этапами обработки изображения и локализации номерного знака являются следующие:
1. Изображение преобразуется в двухуровневое изображение с использованием глобального и локального методов.
2. Для каждого метода преобразования в двухуровневое изображение производится объединение всех черных пикселов изображения в непересекающиеся группы.
3. Классификация выделенных связных компонентов на символ и фон.
4. Объединение и проверка результатов классификации.
На первом шаге осуществляется маркировка всех связных компонентов. Для каждого связного компонента запоминается его площадь, периметр, а также координаты левой, правой, верхней и нижней границ.
На втором шаге для каждого связного компонента используется следующие методы выделения признаков (метод среднего значения зонирования, построение гистограмм проекций, и геометрические моменты).
Для принятия решения о принадлежности связного компонента, значения его признаков поступают на нейронную сеть. Используется описанная выше архитектура нейронной сети, имеющая 3 слоя, размерность входного слоя равна размеру вектора признаков, размерность выходного слоя содержит два нейрона( символ, фон).
Тестирование разработанной системы производилось на 500 различных изображениях автомобилей, полученных в различных условиях (освещенность, яркость, угол наклона) с камер, установленных на дорогах Иордании. На рис. 11 показан пример результата локализации номерного знака.
В заключении содержится перечень задач, которые были решены в результате диссертационного исследования, а также сведения об апробации и внедрении результатов работы.
-•-"790523
Рис. 11. Пример локализаций номерного знака
ОСНОВНЫЕ НАУЧНЫЕ И ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ
1. Разработан алгоритм для обнаружения базисной линии слова арабского языка.
2. Разработан метод распознавания арабско-индийских цифр с использованием различных методов выделения признаков.
3. Предложен метод оценки качества признаков для распознавания арабско-индийских цифр.
4. Разработан метод повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов.
5. Предложен метод выявления характерных признаков для эффективного выделения и распознавания автомобильного номерного знака при наличии помех и при различных углах обзора.
6. Разработаны программы локализации и идентификации автомобильных номерных знаков,
7. Экспериментальная апробация показала эффективность разработанных алгоритмов и программ.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ:
В рецензируемых журналах из списка ВАК:
1. Аль-Рашайдех, X. Метод распознавания арабско-индийских цифр / X. Аль-Рашайдех, С. В. Кулешов.// Изв. вузов. Приборостроение. -2007. -Т. 50, №12.-С. 8-12.
2. Аль-Рашайда, Хасан. X. Предварительная обработка для представления символов арабского языка // Изв. СПбГЭТУ «ЛЭТИ» (Известия государственного электротехнического университета), «Сер. Информатика, управление и компьютерные технологии». - 2006. - Вып. 3. — С. 75-81.
В других изданиях:
3. Al-Rashaideh, Hasan. Preprocessing phase for Arabic word handwritten Recognition (Предварительная обработка для распознавания рукописных слов арабского языка) // Информационные процессы, - 2006. - Т. 6, № 1, -С. 11-19.
4. Аль-Рашайда, Хасан. Выявление несанкционированных вставок в видеопотоке методом ранговых распределений / С. В. Кулешов, А. А. Зайцева, Хасан Аль-Рашайда // Труды СПИИРАН. - СПб.: Наука. - 2006. -Т. 2, Вып. З.-С 96- 101.
5. Al-Rashaideh, Hasan. Arabic-Indic number recognition using combining multiple classifiers and multiple feature vectors (Распознавание арабско-индийских чисел с использованием составных классификаторов и комбинирования векторов признаков) // In: 2nd Jordan International Conference on Computer Science & Engineering (JICCSE). Jordan, Amman, Dec 2006, - pp. 67-73.
Подписано в печать 13.10.08. Формат 60*84 1/16. Бумага офсетная. Печать офсетная. Печ. л. 1,0. Тираж 100 экз. Заказ 66.
Отпечатано с готового оригинал-макета в типографии Издательства СПбГЭТУ "ЛЭТИ"
Издательство СПбГЭТУ "ЛЭТИ" 197376, С.-Петербург, ул. Проф. Попова, 5
Оглавление автор диссертации — кандидата технических наук Аль-Рашайда Хасан Хусейн
СОЕРЖАНИЕ.1.
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ.
1.1. Исторический обзор.
1.2. Арабские символы.
1.2.1. Характеристики сгшвоюв арабского языка.
1.3. Арабско-индийские цифры.
1.4. Краткий обзор распознавания символов.
1.4.1. Распознавание символов в режиме on-line.
1.4.2. Распознавание символов в режиме off-line.
1.5. Типовая модель системы распознавания символов.
1.5.1. Стадия предварительной обработки.
1.5.2. Стадия сегментации.
1.5.3. Стадия выделения признаков.
1.5.4. Стадия обучения и распознавания.
1.5.5. Стадия постобработки.
1.6. Выводы по первой главе.
ГЛАВА 2. ПРЕДОБРАБОТКА ДЛЯ ПРЕДСТАВЛЕНИЯ СИМВОЛОВ АРАБСКОГО ЯЗЫКА
2.1. Введение.
2.2. Система распознавания.
2.3. Набор данных.
2.4. Фаза предварительной обработки.
2.4.1. Обнаружение скелета посредством утончения.
2.4.2. Базисная линия идентифицирования.
2.5. Выводы по второй главе.
ГЛАВА 3. МЕТОД РАСПОЗНАВАНИЯ АРАБСКО-ИНДИЙСКИХ ЦИФР.
3.1. Введение.
3.2. Набор данных.
3.3. Система Распознавания.
3.3.1. Предварительная обработка.
3.3.1.1. Коррекция наклона цифры.
3.3.2. Выделение признаков.
3.3.3. Классификация и распознавание.
3.3.4. Критерии качества распознавания.
3.3.5. Интеграция результатов нескольких классификаторов.
3.3.5.1. Модель принципа мажоритарного голосования.
3.3.5.1.1. Простое мажоритарное голосование. ' 3.3.5.1.2. ранжированное голосование (раш овые классификаторы).
3.3.5.2. Модель вероятностных интеграторов.
3.3.5.2.1. Байесовский интегратор.
3.4. Оценка полученных результатов.
3.5. Выводы по третье главе.
ГЛАВА 4. ЛОКАЛИЗАЦИЯ И РАСПОЗНАВАНИЕ НОМЕРНОГО ЗНАКА.
Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Аль-Рашайда Хасан Хусейн
4.2. Подходы к решению задачи.87
4.3. разработанный подход к решению задачи.90
4.4. Стадия предварительная обработка изображения.91
4.5. Стадия локализации номерного знака.92
4.5.1. преобразования в черно-белое изображение.94
4.5.1Л. Глобальные методы.95
4.5.1.2. Локальный метод (адаптивный метод).97
4.5.2. маркировка связных компонентов.100
4.5.3. Классификация выделенных связных компонентов.101
4.6. Выводы по четвертой главе.106
ЗАКЛЮЧЕНИЕ.108
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ.109
ПРИЛОЖЕНИЕ 1.116
ПРИЛОЖЕНИЕ 2.118
ПРИЛОЖЕНИЕ 3.124
ВВЕДЕНИЕ
Развитие компьютерных технологий обеспечивает их применение в широком диапазоне областей, в том числе в области автоматического распознавания символов. Известны автоматизированные системы распознавания символов английского, японского и китайского языков, в то время как для внедрения подобных систем на других языках, например, на арабском, необходимы дополнительные исследования. Простое применение уже разработанных алгоритмов во многих случаях невозможно из-за наличия в каждом языке своих специфических символов, знаков и лингвистики построения текстов.
Проблема автоматизированного ввода в компьютер текстовой информации также не потеряла своей актуальности. Более того, она приобретает все большую остроту в связи с массовой информатизацией всех сторон жизни.
Вследствие доступности и относительной дешевизны мощных микропроцессоров, в настоящее время появляется возможность реализации современных специализированных систем, например видео контроль автомобильного движения. Это комплексная проблема поиска, локализации и идентификации номерного знака в реальном масштабе времени при движении объектов.
В данной диссертационной работе рассматривается разработка автоматизированной системы распознавания арабско-индийских цифр и символов арабского языка, что важно для многих предметных областей, в том числе и в области локализации и распознавания номерных знаков, в которых содержатся арабско-индийские цифры и символы арабского и английского языков. Это связано с тем, что в последнее время возросла интенсивность движения и количество автомобильных аварий.
Разрабатываемая система автоматически отслеживает нарушителей дорожного движения и записывает автомобильные номера нарушителей в базу данных. Такой автоматический контроль позволяет ощутимо снизить количество нарушений и аварийность на дорогах Иордании.
Анализ известных систем показал, что они, во-первых, дают неудовлетворительные результаты на изображениях низкого качества (которые обычно как раз и получают с видеокамер), во-вторых, не работают на сложных (разноплановых) изображениях, так как на них трудно локализовать требуемую область распознавания, а в-третьих, все они ориентированы на строго определенные условия (освещенность, угол поворота камеры, яркость и т.д.).
Поиск эффективного решения описанной задачи локализации и распознавания номерного знака (арабского) составляет суть диссертационной работы.
Объектом исследования являются компьютерные методы обработки изображений, иерархические и статистические методы классификации, а также ранговые оценки семантического содержания.
Предметом исследования являются инструментально-технические средства обработки изображений: видеокамера, процессор и программы экспериментальной оценки качества распознавания арабско-индийских цифр, слов и номерных знаков.
Целью работы является исследование и разработка метода, алгоритма и программ распознавания знаков, символов, цифр и букв арабского языка, обеспечивающих анализ и обработку информации на изображении с целью обнаружения, локализации и идентификации автомобильного номерного знака. Для достижения поставленной цели в диссертационной работе решаются следующие задачи:
1. Выделение специфических особенностей символов, знаков, букв и цифр арабского языка;
2. Исследование основных подходов к системам распознавания символов арабского языка и арабско-индийских цифр;
3. Разработка алгоритма выделения специфических признаков арабского языка (выделение скелета слов, обнаружение базисной линии слов);
4. Разработка метода оценки качества признаков для распознавания арабско-индийских цифр;
5. Разработка метода повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов;
6. Разработка программы локализации и идентификации автомобильных номерных знаков и ее экспериментальная апробация;
7. Исследование надежности распознавания автомобильных номерных знаков, снятых видеокамерой под разными углами.
Основные методы исследования. В качестве методов исследования использовались цифровые методы обработки изображений, корреляционные и нейронные классификаторы, морфологические методы селекции элементов изображения.
Научная новизна. В диссертации предложены и решены следующие задачи:
1. Разработан алгоритм обнаружения базисной линии слова арабского языка;
2. Разработан алгоритм и программа распознания арабско-индийских цифр с использованием нескольких методов выделения признаков;
3. Для повышения надежности системы распознавания используются обучаемые матрицы как мажоритарные классификаторы;
4. Локализация и распознавание автомобильного номерного (арабского) знака при наличии помех на изображении и при разных углах съемки.
Положения, выносимые на защиту. На основе проведенной теоретической работы и экспериментальной апробации разработанных методов на защиту выносятся следующие положения:
5. Алгоритм обнаружения базисной линии слов арабского языка.
6. Система распознавания арабско-индийских цифр с использованием комбинаций векторов и интеграции различных классификаторов.
7. Алгоритм локализации номерного знака с использованием нейро-сетевого классификатора и маркировка значимых (черных) пикселов.
Теоретическая значимость работы заключается в разработке системы распознавания арабско-индийских цифр и символов арабского языка, алгоритма обнаружения базисной линии слов арабского языка, и алгоритма локализации и распознавания номерного знака. :
Практическая ценность. Заключается в создании системы автоматизированного ввода и обработки текстов на арабском языке, что позволяет реализовать: распознавание и идентификацию номерного знака, считывающие устройства для банковских чеков, почтовые системы считывания, автоматизацию делопроизводства, распознавание и аутентификацию подписи.
Апробация работы. Научные результаты и основные положения работы представлялись на конференции: II Иорданская международная конференция по вычислительной технике "JICCSE-2006 " (Амман, Иордания, 2006), X Санкт-Петербургская международная конференция «Региональная информатика-2006» (Санкт-Петербург, Россия, 2006).
Реализация и внедрение. Полученные результаты реализованы в виде ряда программных систем на различных языках программирования (Java, Matlab). Данные программные системы используются для тестирования и в качестве системы локализации и распознавания номерного знака.
Публикации. Основные теоретические и практические результаты диссертации опубликованы в 5 работах [1],[2],[3],[4],[5], среди которых публикации в ведущих рецензируемых изданиях, рекомендованных в действующем перечне ВАК 2 работы, а также материалы научно-технических и всероссийских конференций в количестве трех.
Структура и объем диссертационной работы. Диссертация состоит из введения, 4 глав, заключения, излагается на 131 странице, включая перечень используемой литературы из 71 наименований, 40 рисунков и 4 таблицы. Кроме того, в диссертации имеется приложение на 16 листах, содержащие в себе примеры работы разработанных программ, реализующих алгоритмы, описанные в диссертации.
Заключение диссертация на тему "Исследование и разработка методов локализации, идентификации и распознавания арабских символов"
4.6. ВЫВОДЫ ПО ЧЕТВЕРТОЙ ГЛАВЕ
Результаты экспериментальных исследований успешно подтвердили выдвинутые ранее теоретические положения. Тестирование программной реализации разработанного метода и алгоритмов показало высокую точность распознавания номерного знака автомобиля .
В отличие от других рассмотренных системах и методов [55 - 66], разработанная система иметь дела с различными видами номерными знаками автомобилей , в которых содержатся арабско-индийские цифры и символы арабского и английского языков. Также данный метод дают хорошие результаты на изображениях низкого качества, работают на сложных (разноплановых) изображениях, и работает хорошо при различных условиях (освещенность, угол поворота камеры, яркость и т.д.).
Следует также отметить следующие результаты:
1. Локализация области номерного знака производится через символы на знаке при помощи связных компонентов , нейронной сети , комбинации различных методов выделения признаков и интеграции результатов различных классификаторов.
2. Автоматически производится коррекция условий освещенности. Метод адаптивно выбирает пороги отличия символа от фона, что делает его малочувствительным к освещению и условиям экспозиции.
3. Данный метод не требует дополнительного обучения при добавлении новых видов номерных знаков, когда символы на знаке уже известно для нейронной сети.
108
ЗАКЛЮЧЕНИЕ
В представленной работе для достижения поставленных задач решены следующие вопросы.
1. Разработан алгоритм для обнаружения базисной линии слова арабского языка.
2. Разработан метод распознавания арабско-индийских цифр с использованием различных методов выделения признаков.
3. Предложен метод оценки качества признаков для распознавания арабско-индийских цифр.
4. Разработан метод повышения надежности распознавания арабско-индийских цифр на основе использования комплексного вектора идентификационных признаков и интеграции различных классификаторов.
5. Предложен метод выявления характерных признаков для эффективного выделения и распознавания автомобильного номерного знака при наличии помех и при различных углах обзора.
6. Разработаны программы локализации и идентификации автомобильных номерных знаков.
7. Экспериментальная апробация показала эффективность разработанных алгоритмов и программ.
Основные положения и отдельные результаты работы докладывались и обсуждались на следующих конференциях и семинарах:
1. II Иорданская международная конференция по вычислительной технике "JICCSE-2006 " (Амман, Иордания, 2006),
2. X Санкт-Петербургская международная конференция «Региональная информатика-2006» (Санкт-Петербург, Россия, 2006).
Библиография Аль-Рашайда Хасан Хусейн, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Al-Rashaidch, Н. Preprocessing phase for Arabic word handwritten Recognition (Предварительная обработка для распознавания рукописных слов арабского языка) Информационные процессы, 2006. - Т. 6, № 1,-С. 11-19.
2. Кулешов, С.В., Зайцева, А.А., and Аль-Рашайда, X. Выявление несанкционированных вставок в видеопотоке методом ранговых распределений // Труды СПИИРАН. СПб.: Наука. - 2006. - Т. 2, Вып. 3. -С96- 101.
3. Аль-Рашайдех, X. and Кулешов, C.B. Метод распознавания арабско-индийских цифр // Изв. вузов. Приборостроение. -2007. -Т. 50, № 12.- С. 8 12.
4. Plamondon, R., Srihari, S.N., Polytech, Е., and Montreal, Q. Online and off-line handwriting recognition: a comprehensive survey // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2000. -vol. 22, №. l.-pp. 63-84.
5. Alexandrov, V.V. and Gorsky, N.D. Can Computer Vision System Work Like the Human One? // International Journal of Imaging Systems and Technology. 1991.-vol. 3,№. -pp. 269-277.
6. Alexandrov, V.V. and Gorsky, N.D. Image representation and processing: a recursive approach. Dordrecht; Boston: Kluwer Academic Publishers 1993.-е. 191.
7. Aleksandrov, V.V. and Gorskii, N.D. From Humans to Computers: Cognition Through Visual Perception. SINGAPORE: World Scientific, 1991.-c. 203.
8. El-Wakil, M.S. and Shoukry, A. On-line recognition of handwritten isolated Arabic characters // Pattern Recognition. 1989. — vol. 22, №. 2.-pp. 97-105.
9. El-Sheikh, T.S. and El-Taweel, S.G. Real-time Arabic handwritten character recognition // Image Processing and its Applications, 1989., Third International Conference on. 1989. - pp. 212-216.
10. Al-Emami, S. and Usher, M. On-line recognition of handwritten Arabic characters // Pattern Analysis and Machine Intelligence, IEEE Transactions on. 1990. - vol. 12, №. 7. - pp. 704-710.
11. Belaid, A. and Haton, J.P. A Syntactic approach for handwritten mathematical formula recognition // Ieee Trans. Pattern Anal. Mach. Intellig. 1984.-vol. 6, №. l.-pp. 105-110.
12. Alimi, A.M. and Ghorbel, O.A. The Analysis of Error in an OnLine Recognition System of Arabic Handwritten Characters // Proceedings oflCDAR.- 1995.
13. Abuhaiba, I.S.I., Holt, M.J.J., and Datta, S. Recognition of OffLine Cursive Handwriting // Computer Vision and Image Understanding. -1998.-vol. 71, №. l.-pp. 19-38.
14. Zeki, A.M. The Segmentation Problem in Arabic Character Recognition The State Of The Art // Information and Communication Technologies, 2005. ICICT 2005. First International Conference on. 2005.
15. Maddouri, S.S. and Amiri, H. Combination of local and global vision modelling for Arabic handwritten words recognition // Frontiers in Handwriting Recognition, 2002. Proceedings. Eighth International Workshop on. 2002. -pp. 128-135.
16. Parhami, B. and Taraghi, M. Automatic recognition of printed Farsi texts // Pattern Recognition. 1981. - vol. 14, №. 1-6. - pp. 395-403.
17. Amin, A. and Masini, G. Machine recognition of cursive Arabic words // SPIE. 1982. - vol. 359. - pp. 1127-1135.
18. Goraine, H., Usher, M., and Al-Emami, S. Off-line Arabic character recognition // Computer. 1992. — vol. 25, №. 7. — pp. 71-74.
19. Amin, A. Segmentation of Printed Arabic Text // Proceedings of the Second International Conference on Advances in Pattern Recognition. -2001.-, №. -pp. 115-126.
20. Freeman, H. Computer Processing of Line-Drawing Images // ACM Computing Surveys. 1974. - vol. 6, №. I. - pp. 57 - 97.
21. Bushofa, B.M.F. and Spann, M. Segmentation of Arabic characters using their contour information // Digital Signal Processing Proceedings, 1997. DSP 97., 1997 13th International Conference on. 1997*. - vol. 2, №.
22. Wedyan, F.E. Skeletonization and Segmentation Using Neural Networks of Handwritten Arabic Text. Mafraq Jordan A1 albyt University, 1999.
23. Zhang, D. and Lu, G. A comparative study on shape retrieval using Fourier descriptors with different shape signatures // Proc. of International Conference on Intelligent Multimedia and Distance Education (ICIMADEO1). 2001.
24. Duda, R.O., Hart, P.E., and Stork, D.G. Pattern Classification. -NY: Wiley-Interscience, 2000. c. 654
25. Amin, A. Prototyping Structural Description Using Decision Tree Learning Techniques // 16th Int. Conf. on Pattern Recognition. 2002. -.
26. Amin, A. Structural Description to Recognising Arabic Characters Using Decision Tree Learning Techniques // Machine Learning. 2002. -vol. 4. -pp. 5.
27. Amin, A., Al-Sadoun, H., and Fischer, S. Hand-printed arabic character recognition system using an artificial network // Pattern Recognition. 1996. - vol. 29, №. 4. - pp. 663-675.
28. Simon, J.C. and Lafori, P. Off-line cursive word recognition // Proceedings of the IEEE. 1992. - vol. 80, №. 7. - pp. 1150-1161.
29. Gorsky, N.D. Experiments with handwriting recognition using holographic representation of line images // Pattern Recognition Letters. — 1994. vol. 15, №. 9. - pp. 853-859.
30. Горский, H., Анисимов, В., and Горская, JI. Распознавание рукописного текста: от теории к практике. СПБ: Политехника, 1997. — с. 126.
31. Steinherz, Т., Rivlin, Е., and Intrator, N. Offline cursive script word recognition a survey // Intern. Journ. on Documents Analysis and Recognition IJDAR -1999. -№. 9. - pp. 90 - 110.
32. Al-Taani, A.T. An Efficient Feature Extraction Algorithm for the Recognition of Handwritten Arabic Digits // Intern. Journ. of Computational Intelligence. 2005. - vol. 2.
33. Pechwitz, M., Maddouri, S.S., and Maergner, V. 1FN/EN1T database of handwritten Arabic words // Proc. of CIFED02. Hammamet, Tunisia. - 2002. - pp. 129- 136.
34. Maragos, P.A. and Schafer, R.W. Morphological Skeleton Representation and Coding of Binary Images // IEEE Transactions on Acoustics, Speech and Signal Processing. 1986. -№. 5. - pp. 1228 - 1244.
35. Gorski, N., Anisimov, V., Augustin, E., Baret, O., Price, D., and Simon, J.C. A2iA Check Reader: A Family of Bank Check Recognition Systems // 5th International Conference on Document Analysis and Recognition. Bangalore, India. — 1999. pp. 523-526.
36. Chang, S.L., Chen, L.S., Chung, Y.C., and Chen, S.W. Automatic license plate recognition // IEEE Transactions on Intelligent Transportation Systems. -2004. vol. 5, №. 1. - pp. 42-53.
37. Lorigo, L.M. and Govindaraju, V. Offline Arabic Handwriting Recognition: A Survey // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2006. - vol. 28, №. 5. - pp. 712-724.
38. Khorsheed, M.S. Off-Line Arabic Character Recognition-A Review // Pattern Analysis & Applications. 2002. - vol. 5, №. 1. - pp. 31-45.
39. Arica, N. and Yarman-Vural, F.T. An Overview of Character Recognition Focused on Off-Line Handwriting // IEEE Transaction on Systems, Man, and Cybernetics-Part C: Applications and Reviews. 2001. -vol. 31, №.2.-pp. 217.
40. Trier, O.D., Jain, A.K., and Taxt, T. Feature extraction methods for character recognition-a survey // Pattern Recognition. — 1996. — vol. 29, Ж 4.-pp. 641-662.
41. Al-Omari, F.A. and Al-Jarrah, O. Handwritten Indian numerals recognition system using probabilistic neural networks // Advanced Engineering Informatics. 2004. - vol. 18, №. 1. — pp. 9-16.
42. Mowlaei, A., Faez, K., and Haghighat, A.T. Feature extraction with wavelet transform for recognition of isolated handwritten Farsi/Arabic characters and numerals // 14th International Conference on Digital Signal Processing. 2002.
43. Harifi, A. and Aghagolzadeh, A. A New Pattern for Handwritten Persian/Arabic Digit Recognition // International Journal of Information Technology. 2004. - vol. 1, №. 4. - pp. 293-296.
44. Shirali-Shahreza, M.H., Faez, K., and Khotanzad, A. Recognition of handwritten Persian/Arabic numerals by shadow coding and an edited probabilistic neural network // Proceedings of the 1995 International Conference on Image Processing —1995. — vol. 3.
45. Kharma, N., Ahmed, M., and Ward, R. A new comprehensive database of handwritten Arabic words, numbers, and signatures used for OCR testing // IEEE Canadian Conference on Electrical and Computer Engineering.- 1999.
46. Ни, M.K. Visual pattern recognition by moments invariants // Information Theory, IEEE Transactions on. 1962. - vol. 8, №. 1. — pp. 179187.
47. Lippmann, R.P. Pattern classification using neural networks // Communications Magazine, IEEE. 1989. - vol. 27, №.11.- pp. 47-50.
48. Lippmann, R. An Introduction to Computing with Neural Nets // ASSP Magazine, IEEE see also IEEE Signal Processing Magazine]. 1987. - vol. 4, №. 2 Part 1. - pp. 4-22.
49. Дуда and Харт Распознавание образов и анализ сцен. — М.: Мир, 1976.-с.
50. Kittler, J., Hatef, М., Duin, R.P.W., and Matas, J. On combining classifiers // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1998. - vol. 20, №. 3. - pp. 226-239.
51. Lam, L. and Suen, S.Y. Application of majority voting to pattern recognition: an analysis of its behavior and performance // IEEE Transactions on Systems, Man and Cybernetics, Part A. 1997. - vol. 27, №. 5. -pp. 553-568.
52. Parker, J.R. and Federl, P. An approach to licence plate recognition // Computer Science Technical reports. 1996. - pp. 591-11.
53. Hsieh, J.W., Yu, S.H., and Chen, Y.S. Morphology-based License Plate Detection from Complex Scenes // 16th International Conference on Pattern Recognition (ICPR'02) Vol. 2002. - vol. 3.
54. Duan, T.D., Du, T.L.H., Phuoc, T.V., and Hoang, N.V. Building an Automatic Vehicle License-Plate Recognition System II International Conference in Computer Science. Can Tho, Vietnam. 2005
55. Hongliang, B. and Changping, L. A hybrid license plate extraction method based on edge statistics and morphology // Proceedings of the 17th International Conference on Pattern Recognition(ICPR04). 2004. -vol. 2.
56. Wang, S.Z. and Lee, H.M. Detection and Recognition of License Plate Characters with Different Appearances // Proceedings of IEEE Intelligent Transportation Systems -2003. pp. 979 - 984.
57. Kahraman, F. and Kurt, B. License Plate Character Segmentation Based on the Gabor Transform and Vector Quantization // Lecture Notes in Computer Science. 2003. - pp. 381-388.
58. Abdullah, S., Khalid, M., Yusof, R., and Omar, K. License Plate Recognition using Multi-cluster and Multilayer Neural Networks // Information and Communication Technologies, 2006. ICTTA'06. 2nd. 2006.
59. Chang, S.L., Chen, L.S., Chung, Y.C., and Chen, S.W. Automatic license plate recognition // Intelligent Transportation Systems, IEEE Transactions on. 2004. - vol. 5, №. 1. - pp. 42-53.
60. Kim, K.I., Jung, К., and Kim, J.H. Color Texture-Based Object Detection: An Application to License Plate Localization // Proceedings of the First International Workshop on Pattern Recognition with Support Vector Machines. 2002. - pp. 293-309.
61. Hsieh, C.T., Juan, Y.S., and Hung, K.M. Multiple License Plate Detection for Complex Background // Advanced Information Networking and Applications, 2005. AINA 2005. 19th International Conference on. -2005. vol. 2.
62. Zunino, R. and Rovetta, S. Vector quantization for license-plate location and image coding // Industrial Electronics, IEEE Transactions on. -2000. vol. 47, №. l.-pp. 159-167.
63. Wang, S.Z. and Lee, H.M. Detection and Recognition of License Plate Characters with Different Appearances // Intelligent Transportation Systems, 2003. Proceedings. 2003 IEEE. 2003. - pp. 979 - 984.
64. Sahoo, P.K., Soltani, S., Wong, A.K.C., and Chen, Y.C. A survey of thresholding techniques // Computer Vision, Graphics, and Image Processing. 1988. - vol. 41, №. 2. - pp. 233-260.
65. Sezgin, M. and Sankur, B. Survey over image thresholding techniques and quantitative performance evaluation // Journal of Electronic Imaging. 2004. - vol. 13. -pp. 146.
66. Otsu, N. A threshold selection method from gray level // IEEE Transactions on Systems, Man, and Cybernetics. 1979. - vol. 9, №. l.-pp. 62-66.
67. Niblack, W. An introduction to digital image processing. NJ: Prentice Hall, 1986. - c. 215
-
Похожие работы
- Компьютерная идентификация символов арабской графики
- Параметрическая и структурная адаптация систем распознавания текстовых меток на видеоизображениях
- Математические модели и программные средства распознавания структурированных символов
- Система идентификации структуры печатных документов
- Модель и методы распознавания объектов на изображениях в виде скалярных полей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность