автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Разработка и исследование методов обработки и распознавания объектов на последовательности изображений

кандидата физико-математических наук
Михайлов, Иван Александрович
город
Ярославль
год
2011
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование методов обработки и распознавания объектов на последовательности изображений»

Автореферат диссертации по теме "Разработка и исследование методов обработки и распознавания объектов на последовательности изображений"

На правах рукописи

005001678

Михайлов Иван Александрович

РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДОВ ОБРАБОТКИ И РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ПОСЛЕДОВАТЕЛЬНОСТИ ИЗОБРАЖЕНИЙ

Специальность 05.13.18 Математическое моделирование, численные методы и комплексы программ

Автореферат на соискание учёной степени кандидата физико-математических наук

1 О НОЯ 2011

Ярославль — 2011

005001678

Работа выполнена на кафедре теоретической информатики Ярославского государственного университета им. П.Г. Демидова.

доктор физико-математических наук, профессор

Тимофеев Евгений Александрович

доктор физико-математических наук, профессор

Дольников Владимир Леонидович

доктор физико-математических наук, профессор

Дмитриев Михаил Геннадиевич

Ярославский государственный технический университет

Защита состоится «25» ноября 2011 г., в_часов на заседании диссертационного совета Д 212.002.05 при Ярославском государственном университете им. П.Г. Демидова по адресу: 150000, Ярославль, ул. Советская, 14.

С диссертацией можно ознакомиться в библиотеке Ярославского государственного университета им. П.Г. Демидова.

Автореферат разослан «_» октября 2011 г.

Научный руководитель —

Официальные оппоненты:

Ведущая организация —

Учёный секретарь диссертационного совета

С.Д. Глызин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования

К настоящему моменту область обработки изображений уже прошла длинный путь развития. Важным шагом на этом пути явилось изобретение фотографии, которая позволила наглядно документировать результаты научных исследований. Следующим шагом послужило появление вычислительных машин, достаточно мощных, чтобы работать с изображениями — это позволило автоматизировать и ускорить их обработку. Сегодня обработка изображений представляет собой активно развивающуюся область знания, методы которой используются во многих естественных науках и технических дисциплинах.

Действительно, изображение является объектом исследования или его результатом в таких областях человеческой деятельности, как космонавтика, астрономия, биология, медицина, физика, геология, криминалистика, дефектоскопия и других. Изображения получают не только в диапазоне частот электромагнитного излучения, отвечающего видимому свету, но и в диапазоне частот акустическом, инфракрасном, ультразвуковом, ультрафиолетовом, рентгеновских и гамма-лучей. Большой объём видеоинформации ведёт к необходимости автоматизации процессов её обработки. Среди направлений исследований в данной области, приведённых в работе [1, стр. 5—6}, выделим следующие два.

• Восстановление искажённых изображений, а также улучшение их визуального качества заключается в его преобразовании, обратном преобразованию, вызвавшему искажение. Соответствующие алгоритмы восстановления позволяют скомпенсировать искажения, обусловленные рефракцией или турбулентностью атмосферы, недостатками оптических приборов, взаимным расположением устройства съёмки и объектов наблюдения, деформацией фотоматериала, помехами и т. д. Улучшение визуального качества изображений облегчает их восприятие и анализ человеком.

• Автоматическое чтение текста, дешифрование аэрокосмических снимков, диагностика заболеваний — примеры задач, относящихся к проблеме распознавания образов. Интерес, проявляемый к её разработке в настоящее время, связан с открывающимися возможностями лучшего понимания процессов обработки информации в живых системах, создания более эффективных систем «человек-машина», а также автоматических систем, позволяющих быстрее, точнее, надёж-

нее или экономичнее человека решать различные задачи обработки визуальной информации.

Выделим отдельно задачу обнаружения на видеопоследовательности движущихся объектов и отслеживание их траектории. Для решения данной задачи (точнее, подзадачи обнаружения) оказываются полезными методы распознавания образов. Алгоритмы, разрабатываемые в процессе решения задачи обнаружения и отслеживания, предназначены для использования во всевозможных системах наблюдения и контроля.

Дели исследования

Целями диссертационной работы являются:

1) разработка методов распознавания чёрно-белых растровых изображений алфавитно-цифровых символов малого размера;

2) разработка алгоритма восстановления изображений, искажённых перспективным преобразованием;

3) разработка алгоритма разбиения железнодорожного состава на отдельные вагоны.

Результаты, выносимые на защиту

1. Разработаны три метода распознавания чёрно-белых растровых изображений алфавитно-цифровых символов малого размера; произведена оценка их трудоёмкости; изучены некоторые свойства расстояний между изображениями, лежащих в основе предложенных методов; предложено четыре модели искажения чёрно-белых растровых

■ алфавитно-цифровых символов; разработана программная реализация методов; проведён ряд экспериментов для проверки эффективности предложенных методов с использованием искусственно построенных и реальных тестовых изображений, в ходе которых выполнено сравнение данных методов с аналогичным.

2. Разработан алгоритм восстановления изображений, искажённых перспективным преобразованием; приведено теоретическое обоснование данного алгоритма; разработана программная реализация алгоритма; выполнено тестирование алгоритма с использованием набора изображений.

3. Разработан алгоритм разбиения железнодорожного состава на отдельные вагоны; разработана программная реализация данного алгоритма; проведено тестирование алгоритма с использованием набора • видеопоследовательностей.

Методы исследования

В диссертационной работе использованы методы обработки изображений, распознавания образов (в том числе обнаружения объектов), проективной геометрии, математического анализа.

Научная новизна работы

1. В проведённых экспериментах с использованием реальных зашум-лённьгх цифровых символов, а также цифровых символов с искажениями каркаса результаты предложенных методов распознавания оказались близкими к результатам корреляционного алгоритма или лучшими по сравнению с ними.

2. Преимущество алгоритма восстановления изображений, искажённых перспективным преобразованием, над аналогичными состоит в том, что он не использует каких-либо параметров оптической системы, с помощью которой было получено изображение. В некоторых случаях восстановление изображений может быть полностью автоматизировано.

3. Преимущества алгоритма разбиения железнодорожного состава на отдельные вагоны ко сравнению с аналогичными состоят в 1-ом, что он в одном случае является более автоматизированным, а в другом — не требует наличия вспомогательных технических средств.

Практическая значимость работы

Методы и алгоритмы, разработанные в ходе работы над диссертацией, могут быть использованы для создания систем наблюдения за. движением автомобильного или железнодорожного транспорта (в том числе для решения задачи идентификации); предложенные методы распознавания могут найти применение также и в системах автоматического чтения текста.

Апробация работы

Основные положения работы докладывались и обсуждались на перечисленных ниже научных конференциях и семинарах.

1. Шестьдесят вторая региональная научно-техническая конференция студентов, магистрантов и аспирантов высших учебных заведений с международным участием «Молодёжь. Наука. Инновации — 2009», 2009, г. Ярославль.

2. IV Международная научно-практическая конференция «Современные информационные технологий и ИТ-образование», 2009, г. Москва.

3. Х1ЛШ1 Международная научная студенческая конференция «Студент и научно-технический прогресс»: Информационные технологии, 2010, г. Новосибирск.

4. XV Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов, 2010, г. Рязань.

5. II Международная молодёжная научно-практическая конференция,

2010, г. Елабуга.

5. Шестьдесят четвёртая региональная научно-техническая конференция студентов, магистрантов и аспирантов с международным участием,

2011, г. Ярославль.

6. Семинар института программных систем им. А.К. Айламазяна РАН, 2011, г. Переславль-Залесский.

7. Семинар «Моделирование и анализ информационных систем», 2011, г. Ярославль.

8. Семинар «Нелинейная динамика и синергетика», 2011, г. Ярославль.

Публикации

По теме диссертационной работы опубликовано 15 печатных работ (в том числе 5 публикаций в ведущих рецензируемых научных изданиях, рекомендованных Высшей аттестационной комиссией), а также получено свидетельство о государственной регистрации программы для ЭВМ. Из пяти статей три написаны без соавторов, две — тремя авторами (Малков А.Н., Штерн Г.П., Михайлов И.А.). Все совместные работы написаны в нераздельном соавторстве. Список работ приведён в конце автореферата.

Структура и объём работы

Диссертация состоит из введения, трёх разделов, заключения, списка литературы и приложения. Работа, изложена на 112 страницах, содержит 2 таблицы, 6 рисунков, библиография включает 60 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Введение

Во введении обосновывается актуальность тем диссертационной работы и даются постановки решаемых задач.

Первый раздел

В первом разделе приводится краткий обзор методов распознавания символьных изображений, даётся постановка задачи, описывается принятый в работе общий подход к ее решению. Далее последовательно определяются три предложенных метода распознавания. Эксперименты, проведённые для оценки эффективности методов, описываются в конце раз-

дела.

Постановка задачи и общий подход к её решению Рассматривается задача распознавания чёрно-белых растровых изображений цифровых символов. Пусть имеется набор классов, для каждого из которых существует, по крайней мере, одно изображение-эталон. Пусть дано также тестовое изображение (тест). Размеры изображений: как эталонов, так и теста, — могут быть различны. Задача состоит в том, чтобы определить, к какому классу относится тестовое изображение.

Общий подход к решению задачи распознавания состоит в том, чтобы для классификации тестового изображения использовать правило ближайшего соседа: вычислим расстояние между тестом и каждым эталоном, сопоставим тесту класс того эталона, на котором реализуется минимум.

Таким образом, поставленная задача распознавания сводится к выбору меры близости на множестве символьных изображений. Поэтому описание каждого метода будет ограничено определением соответствующего расстояния.

Метод, основанный на модификации метрики Хаусдорфа Метрика Хаусдорфа и её модификации находят своё применение в задаче распознавания изображений в качестве меры близости множеств [3, 4]. При использовании данной метрики изображения рассматриваются как конечные множества точек, причём точки одного изображения привязываются к точкам другого.

1. Расстоянием от множества из одной точки {г'} до конечного множества й будем называть

Теорема 2.3.1 Предложенное кт,—расстояние обладает свойствами неотрицательности, эквивалентности и симметричности.

Теорема 2.3.2 Нт—расстояние не является метрикой, так как для него не выполняется свойство р{С1,Сз) ^ /З^ьСг) + р(С2, С?з).

где Цг/ — г|| — расстояние между точками г' и г.

2. Отклонением множества от Сч будем называть

Для того чтобы применить описанный подход к чёрно-белым изображениям, каждому чёрному (принадлежащему символу) пикселю с координатами (х,у) сопоставим одну точку с теми же координатами. Алгоритм сравнения изображений с помощью /да—расстояния, используемый нами в экспериментах, устроен следующим образом.

1. Привести тест к размеру эталона, используя алгоритм масштабирования.

2. Вычислить /да—расстояние между эталоном и тестом для двух взаимных расположений: в первом случае совмещаются края изображений, во втором — их центры тяжести.

3. Минимум из двух вычисленных расстояний возвратить в качестве результата.

Теорема 2.3.3 Сравнение изображений с использованием кт-расстояния может быть выполнено за время 0(тп) (тп,п — ширина и высота изображений соответственно), если в качестве расстояния между точками па плоскости применяется величина ах\г'х —г"\+ау\г'у — гдеах,ау — константы.

Метод срезов

Под бесконечным вектором V будем понимать вектор бесконочной длины, обладающий свойством: 3п : (Уг ^ п и* ^ 0) Л (\/г > п г^ = 0).

Пусть V', V" — бесконечные векторы. Расстоянием на множестве бесконечных векторов будем называть р(У, V") = 1ир — ?;р'1-

Теорема 2.4.1 Предложенное расстояние на множестве бесконечных векторов р(У, V") обладает свойствами метрики.

- Пусть имеется матрица изображения А = (ау) размера пхтп (п строк, т столбцов).

Для каждого г : 1 г ^ п определим множество чисел £>(Л,г):

Будем считать, что < вг < ... < яь

Вектором разности для тройки (А,г,ТУ), где 1 ^ г < п, N — натуральное, будем называть бесконечный вектор действительных чисел, построенный следующим образом:

Таким образом, вектор разности Ур{А,г,Ы) содержит в себе расстояния между соседними переходами с белого на чёрный на высоте г, а

{Зр+1{А, г) - вр(А,»)) • N/171, 1 < р < |5'(А, г)| - 1; 0, |5(Л,«)|^Р<оо.

также расстояния от крайних переходов до границ изображения (первая и последняя компоненты). Параметр N играет роль коэффициента масштабирования.

Линейным образом матрицы изображения А — (a¡j) размера п х т с частотой сечения N, где N — натуральное, будем называть упорядоченное мультимножество векторов разности для этой матрицы

- L{A,N) = {1Р : 1Р = У(Л, [п • p/N], N), 1 < р < N}.

Таким образом, линей[1ый образ содержит векторы разности (срезы) для всех п строк матрицы изображения (a¿j). При этом для масштабирования каждой строке сопоставляется несколько одинаковых срезов в зависимости от параметра N.

Пусть L(Ai, N), 2, N) — линейные образы матриц изображений Ai и A¿ с частотой сечения, равной N.

Расстоянием на множестве линейных образов матриц изображений с частотой сечения N будем называть

p(L(AbN),L(A2,N))= Y, p(k(AbN),h(A2,N)).

Теорема 2.4.2 Расстояние на множестве линейных образов p(L(A',N),L(A",N)) обладает свойствами метрики.

Алгоритм сравнения изображений с применением предложенного расстояния на множестве линейных образов, используемый нами в экспериментах, устроен следующим образом: на первом этапе происходит построение линейных образов теста и эталона, на втором вычисление значения расстояния между ними; полученное значение возвращается в качестве результата.

Теорема 2.4.3 Сравнение изображений с использованием предложенного расстояния на множестве линейных образов может быть выполнено за время 0(mN), где т. — ширина изображений эталона и теста (в пикселях), N — частота сечения.

Метод радиальных окрестностей

Пусть имеется изображение А, заданное матрицей (a¿j) размера п х т. Под радиальной окрестностью точки с координатами (i,j) и коэффициентом нормирования s будем понимать упорядоченный набор из четырех бинарных векторов (v1, vr, v',vb), построенных следующим образом:

s-(j-0,5)

• vi = o«j'./ :

Jfc-1

т-- ,2 ^ к <

s

-+1

• V* = Oij'.j =

• vk = «i'J.1 =

• «4 = a»',j,*' =

S-fc+l

ТП ■

s • (то - j + 0,5)

m

+ 1

Jfc-1

ra •

,2

s • (i - 0,5)

+ 1

,2 ^ Jb ^

s • (n — г + 0,5)

+ 1

При этом = = = г)' = 1. Каждый из этих секторов соответствует одному из четырёх основных направлений от границы окаймляющего прямоугольника к центру окрестности (элементу с координатами (г,_/)): V1 — слева направо, иг — справа налево, V1 — сверху вниз, г>6 — снизу вверх. Каждый вектор включает в себя масштабированную (с помощью параметра в) часть строки или столбца вдоль соответствующего направления от границы изображения до центра окрестности. Исключением являются первые компоненты векторов — они всегда равны 1 независимо от цвета пикселей.

Под радиальным образом изображения А будем понимать множество радиальных окрестностей, построенных для каждого элемента соответствующей матрицы (ау).

Ьт—расстоянием на множестве бинарных векторов будем называть

Pbm(a, b) = а(а, Ь) + а(Ь, а), где а(а, b) = Y] min ¡г - j\.

Oi —1 Oi=1 1

Введём расстояние на множестве радиальных окрестностей:

где е\, е" — г-е компоненты окрестностей е, е соответственно.

Определим рррасстояпие на множестве радиальных образов:

1 ■

р^А, В) = а{А, В) + а{В, А), где а(А, В) = _ • ^ ттр{Аи В,).

Здесь А{ — 1-я окрестность образа Л, Bj — ]-я окрестность образа В.

Теорема 2.5.1 Ьт-расстояние на множестве бинарных векторов обладает свойствами неотрицательности и симметричности.

Теорема 2.5.2 Ьт-расстояние не является метрикой, так как для него не выполняется свойство неравенства треугольника.

Теорема 2.5.3 Расстояние на множестве радиальных окрестностей р(е', е") обладает свойствами неотрицательности и симметричности; свойство неравенства треугольника не выполняется для указанного расстояния.

Теорема 2.5.4 рр-расстояние на множестве радиальных образов ■изображений обладает свойствами неотрицат,е.пъност,и и симметричности.

Алгоритм сравнения изображений с помощью рр—расстояния, используемый нами в экспериментах, состоит из двух этапов: на первом из них для эталона и геста строятся радиальные образы, на втором — вычисляется расстояние между ними, которое и возвращается в качестве результата.

Теорема 2.5.6 Сравнение изображений с использованием рр-расстояния на множестве радиальных образов может, быть выполнено за время 0(m2n2s), где т, п — ширина и высот,а изображений соответственно, s — коэффициент нормирования.

Описание экспериментов

Изображения-этолоны

В ходе проведённых экспериментов в качестве эталонов использовались два набора изображений. Первый из них включает в себя 10 изображений символов '0' - '9' высотой 14 пикселей, полученных с помощью шрифта Times New Roman. Данный набор будем обозначать CS.

Второй набор (обозначим его ES) содержит изображения символов, вырезанные из бинаризованных фотографий цистерн. Этот набор использовался в работе [5] для тестирования. Средний размер эталонов — 8 х 12. Набор включаем' в себя 55 изображений всех цифр за исключением единицы. На рис. 1 показаны примеры изображений-эталонов, входящих в его состав.

г0 2 I 4 S 6 7 g 9

0 2 1 4 5 6 7 1 $

023456789

Рис. 1. Примеры изображений-эталонов 11

Изображения-тести

В качестве тестов применялись пять наборов изображений. Для построения первых четырёх использовались 4 модели искажения. Первые две модели предназначаются для шумовых искажений изображения, вторые две — для искажения формы символа. Таким образом, тестовые изображения были получены путём применения указанных моделей искажения к изображениям из набора СБ. В результате было построено 4 набора тестов, каждый из которых содержит 5000 изображений (500 для каждого из 10 эталонов). Первые два набора с шумовыми искажениями будем обозначать № и МЪ соответственно, вторые два с искажениями формы - ББ и 8Т.

Наконец, пятый тестовый набор включает в себя изображения цифр, вырезанных с фотографий номеров цистерн после их бинаризации. Он содержит изображения всех цифр. Общее количество изображений в наборе — 1614. Средний размер тестов — 8 х 15 пикселей. Данный набор, некоторые изображения из которого показаны на рис. 2, будем обозначать ЕХР.

1 2 М 5 6 1 i Г. %

0 114 11" f 1 1 f

О I 1 4 1 1 ? 1 !

¡Рис.. 2. Примеры тестовых изображений

Результаты экспериментов

Для сравнения представим также и результаты работы корреляционного алгоритма, описанного в работе [5|. При описании результатов будем использовать следующие обозначения:

1) Сол— корреляционный алгоритм;

2) Slice — метод срезов;

3) MHo.us — метод, основанный на модификации метрики Хаусдорфа;

4) Radial — метод радиальных окрестностей.

Результаты экспериментов приведём в табличной форме: первый столбец содержит обозначения используемых наборов эталонов и тестов соответственно, разделённые косой чертой; в каждой строке приведено соответствующее число верно распознанных тестов для четырёх алгоритмов (в процентах).

Таблица 1. (людные результаты алгоритмов распознавания

Наборы Согг БЦсе МНац;; 11асНа1

СЭ / ИР 99,68 85,42 96,52 91,60

СЭ / № 96,66 89,54 89,88 88,14

СЗ/БЭ 60,40 61,82 80,56 84,96

СЭ / ЭТ 66,72 68,84 72,42 60,94

СБ / ЕХР 54,34 49,81 65,86 78,44

ЕБ / ЕХР 89,27 90,11 91,58 94,25

Второй раздел

Второй раздел начинается кратким обзором методов восстановления изображений, искажённых перспективным преобразованием, затем приводятся постановка задачи восстановления и дополнительные ограничения для её условия и решения. Далее описывается решение поставленной задачи. В конце раздела приведён алгоритм восстановления растровых изображений в оттенках серого, а также ряд изображений, на котором он был протестирован.

Обозначения и определения

1. Пусть в пространстве имеются две различные вертикальные плоскости р и р', имеющие общую прямую.

2. Пусть I есть некоторое изображение в плоскости р и мы проектируем его из точки Су, лежащей вне р и р'. В сечении проектирующих прямых плоскостью р', мы получим новое изображение 1'. Установленное таким образом соответствие между изображениями I и V называется перспективным преобразованием [2].

3. Указанное в предыдущем пункте преобразование будем обозначать Т/, а точку С/ называть фокусом перспективного преобразования 7/.

4. Пусть имеется вертикальная плоскость р", также пересекающая р'.

5. Пусть преобразование 7], с фокусом в точке Сь сопоставляет изображению V в плоскости р' изображение I" в плоскости р".

6. Обозначим = \LjCj\Jf = \Р}С}\,1ь = |ВД,/ь = а} -угол между р' и р, аь — угол между р' и р" (см. рис. 3).

На плоскостях р, р', р" введём систему координат. Для каждой из них ось У будет направлена вверх, ось X — вправо. В плоскости р началом координат будет точка Ь/, в плоскости р" —- точка В плоскости р' — точка /'/, когда будем говорить о прямом преобразовании, и Г), — когда будем говорить об обратном.

На изображениях I, Г, I" также введём систему координат. Началом

Рис. 3. Прямое и обратно« преобразования. Вид сверху

координат для каждого изображения будет левый нижний угол ограничивающего прямоугольника, оси X, У сопаиравлены с осями соответствующих плоскостей.

Таким образом, вычисление преобразования Ть состоит в определений величин щ, /ь, (х'„ ?/'), где {х'3, у'3) — смещение левого нижнего угла изображения /' относительно начала координат р'. Все эти величины в совокупности будем называть также параметрами преобразования Т^.

Формальная постановка задачи

Пусть нам известны

1) преобразованное изображение I', лежащее в плоскости р', его ширина ги' и высота /г';

2) точки А\, А!2, В[, В'2 (их координаты относительно левого нижнего угла изображения /') такие, что если А\, Лг, В\, 1?2 — их соответствующие прообразы, лежащие в /, то.прямые А\А^ и 1^2 параллельны оси X (горизонтальны);

3) заданный размер восстановленного изображения I": ширина ги" и высота к".

Задача состоит в вычислении такого преобразования Ть (в определении его параметров), чтобы выполнялось следующее условие. Если

/"={ (Л у")Т | (*, у)т 6 {Ть О 7»: (х, у)т - (*", Г? } .

то

cd-ftüö'fcK'H «

maxW-xtl = w" Щх'и')T, l£)T G(2) max Wi — У21 = h" v(xly'{f,{x'ly'i)Tei"- (3)

Величины kx > 0, ky > 0, sx, sy в условии (1) — независимые от х, у константы, координаты даны относительно точек Lj и Lj.

Теорема 3.3.1 Для выполнения условия (1) необходимо и достаточно, чтобы выполнялись следующие соотношения

fj ctg а/ = fb ctgab-xd, (4)

Vd = 0, (5)

sinct/-sinab > 0, (6)

где (xd,i/d) = Ff Fb. Первые два соотношения гарантируют сохранение горизонтальности прямых, последнее — отсутствие вертикальной инверсии.

Теорема 3.3.2 Знак cxj противоположен знаку абсциссы точки пересечения прямых, прообразы которых были горизонтальны, в координатах изображения I'.

Теорема 3.3.3 Следующие соотношения являются необходимыми и достаточными для сохранения горизонтальности прямых:

где

t с2 ~ С1 x, + hctgab = k2_kl> (7)

, c2ki-cik2

. Уа - Уи АгУп ~ 'AiVh ,пЧ

1 = X' - ' Cl= xi -Ti-' i9)

и ~ & хШх - 'Aiviz ,1пЛ

ki = х' -д* ' С2 = X' -' (10)

х22 х22 Х21

(х'ь, у'ц) — смещение левого нижнего угла изображения I' относительно начала координат р', а точки ^К^цУи); Л'2{х\21у\^, В[(х\ьу\^),

^г{х221 У22) лежат на прямых в плоскости р', прообразы которых горизонтальны (координаты точек указаны в системе координат изображения V).

Теорема 3.3.4 Пусть изображение I' имеет размеры (и/, Н'), а изображение I" — (и/1, Н"). Тогда всякое преобразование Ть такое, что угол аь удовлетворяет соотношению

{аь е (0, 7г/2), если тп > 0; аь 6 (—7г/2,0), еслит<~ы';

где

. тп = г——р- (в обозначениях (9) - (10)),

к2-кг

параметр у[ находится из соотношения (8), параметры х'я, /ь, 1ь определяются следующими соотношениями:

, Ли/' cos аь .. w"m(w' + т) sin2 qj ^ = W--УЛ*-' /"=(m-xs)tga6, lb =---—-

где

А = <

тН - у1,™', если (т > 0 Л j/s € (-с», -h')) V (т < -и/ Л y's е [0, +оо));

h'(m f w'), если т > 0 Л j/t в [-//, 0);

h'm, если т < —и/ Л т/я е \—Ь!, 0);

t/>' +7г'(и/ + т), если (т > 0 Л xf, е [0, +00)) V (т < -и/ Л t/^ е (-00, -Л'));

— удовлетворяет условиям (1), (2) и (3).

Третий раздел

В начале третьего раздела приведён краткий обзор методов решения задачи обнаружения объектов на видеопоследовательности и отслеживания их траекторий, а также двух методов решения задачи разбиения железнодорожного состава на отдельные вагоны, которую можно рассматривать как особый случай задачи обнаружения и отслеживания. Затем даётся постановка задачи и описывается специфика исходных данных. Основную часть раздела занимает подробное изложение предложенного алгоритма решения задачи разбиения состава. Раздел заканчивается описанием экспериментов, проведённых для тестирования алгоритма.

Входные данные алгоритма

• Фильм, представляющий собой последовательность полутоновых кадров. Каждая цистерна представлена на нескольких кадрах (примерно от 10 до 100). Кадр имеет размер 288 х 352 пикселя.

• Четыре точки на кадре, задающие горизонтальные прямые в его (кадра) нормальном прообразе, то есть изображении, которое было бы получено, если бы горизонтальный поворот видеокамеры относительно состава был равен нулю.

Выходные данные: для тех кадров, на которых запёчатлён край некоторого вагона, — абсцисса вертикальной линии, отделяющей данный вагон от соседнего вагона (вертикальная линия должна попадать в просвет, если он виден на кадре) или от фона, если вагон является первым или последним; для иных кадров выходные данные отсутствуют.

Специфика задачи

1. Интенсивности объектов (т.е. цистерн и локомотива) и фона считаются неизвестными; фон может быть неоднородным. Поверхность цистерн может быть значительно загрязнена (например, нефтяными потёками).

2. Скорость движения состава в пределах одного фильма может изменяться; длина и высота цистерн, запечатленных в одном и том же фильме, не одинакова.

3. Расстояние между видеокамерой и составом, горизонтальный поворот между ними, а также высота видеокамеры относительно состава могут быть различны для разных фильмов.

Краткое описание алгоритма

Задача разбиения состава решается путём обнаружения просветов между вагонами. Можно выделить следующие основные этапы алгоритма.

1. Выделение пометок на кадре. Пометки — это прямоугольные области, предположительно соответствующие просветам. Для выделения пометок используется следующее эвристическое правило: средняя яркость просвета несколько больше яркости областей на кадре, лежащих слева и справа от данного просвета.

2. Определение истинных пометок. Не все пометки, выделенные на первом этапе, соответствуют просветам (т.е. не лежат в области просвета и не располагаются в непосредственной близости от неё). Для того чтобы отсеять такие пометки, выполняются следующие шаги.

(a) Обнаруженные пометки группируются в серии таким образом, чтобы все те пометки на разных кадрах, которые соответствуют одной и той же области на поверхности вагона (или просвету), оказались в одной серии.

(b) Серии объединяются в последовательности таким образом, чтобы любые две соседние в некоторой последовательности серии могли ограничивать собой некоторый вагон (для этого расстояние между областями на поверхности вагонов, которым соответствуют эти серии, должно лежать в определённых пределах). Серия может являться элементом одной или нескольких различных последовательностей.

(c) Каждой серии сопоставляется вес тем больший, чем:

1) больше области пометок данной серии сходны с фоном;

2) больше пометок она содержит;

3) в большей степени изменяется ширина пометок, составляющих эту серию.

((1) Среди различных последовательностей выбирается та, которая предположительно в большей степени, чем другие удовлетворяет следующим критериям.

1. Серии, составляющие данную последовательность, обладают большим весом.

2. Расстояния между соседними сериями в этой последовательности примерно одинаковы.

После того, как выбрана искомая последовательность, считается, что составляющие ее серии (и только они) соответствуют просветам (первая и последняя соответствуют началу и кошу всего ж/д состава), а промежутки между ними — вагонам.

3. Вычисление позиции разделяющей вертикальной линии для всех кадров, на которых виден некоторый просвет или край всего состава. Для расчёта координаты вертикали используются координаты пометок той серии, которая соответствует текущему просвету, а также приблизительная величина скорости состава в данный период времени.

Результаты экспериментов

Предложенный алгоритм был протестирован с использованием 16 фильмов, в каждом из которых изображено движение состава, в среднем состоящего из 26,5 вагонов. Среднее количество кадров в фильмах —

1960. Во рремя обработки данных фильмов алгоритм не допустил ошибок типа пропуска и ложного обнаружения края, однако на части кадров позиция отделяющей вертикальной линии была определена неточно.

Заключение

В заключении перечислены разработанные методы и алгоритмы, отмечены некоторые их достоинства и недостатки и указаны возможные области применения.

Список цитируемой литературы

[1] Анисимов, Б. В. Распознавание и цифровая обработка изображений: Учеб. пособие для студентов вузов / Б. В. Анисимов, В. Д. Курганов, В. К. Злобин. - М.: Высш. шк., 1983. - 295 с.

[2] Юнг, Дж. В. Проективная геометрия / Дж. В. Юнг. Перевод с английского под редакцией проф. В. Ф. Кагана. - М.: ИЛ, 1949. - 184 с.

[3] Kara, L. В. Sketch Understanding for Engineering Software / L. B. Kara // Ph.D. Thesis Proposal. - 2003. - 68 p.

[4] Хмелев, P. В. Совместное использование структурного анализа и метрики Хаусдорфа при сравнении объекта и эталона / Р. В, Хмелев // Компьютерная оптика. - 2005. - В. 27. - С. 174-176.

[5] Распознавание номеров железнодорожных цистерн с использованием корреляционного алгоритма / А. К. Карлин, А. Н. Малков, Е. А. Тимофеев, Г. П. Штерн // Математика, кибернетика, информатика. Труды международной научной конференции, посвященной памяти профессора А. Ю- Левина (Ярославль, 25 - 26 июня, 2008) / Яросл. гос. ун-т. - Ярославль: ЯрГУ, 2008. - С. 103-110.

Работы автора по теме диссертации

Публикации в изданиях, рекомендованных ВАК РФ

1. Михайлов, И. А. Об одном методе распознавания изображений / И. А. Михайлов // Моделирование и анализ информационных систем.

- 2007. - Т. 14, № 4. - С. 7-12.

2. Михайлов, И. А. Некоторые методы распознавания изображений / И. А. Михайлов // Моделирование и анализ информационных систем.

- 2008. - Т. 15, № 4. - С. 56-64.

3. Малков, А. Н- Восстановление изображений, искажённых перспективным преобразованием / А. Н. Малков, Г. П. Штерн, И. А. Михайлов // Моделирование и анализ информационных систем. - 2009. - Т. 16, № 2.

- С. 88-102.

4. Михайлов, И. А. Распознавание изображений с помощью метода радиальных окрестностей / И. А. Михайлов // Компьютерная оптика. -

2010. -Т. 34, № 3. - С. 399-407.

5. Малков, А. Н. Разбиение железнодорожного состава на отдельные вагоны / А. Н. Малков, Г. П. Штерн, И. А. Михайлов // Моделирование и анализ информационных систем. - 2011. - Т. 18, № 2. - С. 77-112.

Другие публикации

6. Михайлов, И. A. Train Decomposition — научно-исследовательская программа для разбиения железнодорожного состава на отдельные вагоны // Свидетельство о государственной регистрации программы для ЭВМ. М.: РОСПАТЕНТ. - 2011. № 2011616542.

7. Михайлов, И. А. Об одном подходе к распознаванию изображений / И. А. Михайлов // Студенческие заметки по информатике и математике. Вып. 1. - Ярославль: Изд-во Яросл. гос. ун-та им. П. Г. Демидова, 2007. - С. 42-43.

8. Михайлов, И. А. Восстановление изображений, искажённых перспективным преобразованием / И. А. Михайлов // Шестьдесят вторая региональная научно-техническая конференция студентов, магистрантов и аспирантов высших учебных заведений с международным участием «Молодёжь. Наука. Инновации — 2009». 15 апреля 2009 г., Ярославль: Тезисы докладов. - Ярославль: Изд-во ЯГТУ, 2009. - С. 179.

9. Михайлов, И. А. Некоторые методы распознавания изображений [Электронный ресурс] // Материалы IV Международной научно-практической конференции «Современные информационные технологии и ИТ-образование» : [тез. докл.] / Моск. гос. ун-т им. М. В. Ломоносова, фак-т ВМиК. - Режим доступа: http://2009.it-edu.ru/docs/Sekzii_4-5/4_Mihaylov_ImgRec2.doo.

10. Михайлов, И. А. Некоторые методы распознавания изображений / И. А. Михайлов // Материалы XLVIII Международной научной студенческой конференции «Студент и научно-технический прогресс»: Информационные технологии / Новосиб. гос. ун-т. Новосибирск, 2010. С. 235.

11. Михайлов, И. А. Восстановление изображений, искажённых перспективным преобразованием / И. А. Михайлов // Новые информационные технологии в научных исследованиях и образовании: материалы XV Всероссийской научно-технической конференции студентов, молодых ученых и специалистов. Рязанский государственный радиотехнический университет, 2010. С. 347-348.

12. Михайлов, И. А. Распознавание изображений с помощью метода радиальных окрестностей / И. А. Михайлов // Новые информационные технологии в научных исследованиях и образовании: материалы XV Всероссийской научно-технической конференции студентов, молодых ученых

и специалистов. Рязанский государственный радиотехнический университет, 2010. С. 305-306.

13. Михайлов, И. А. Распознавание изображений с помощью метода, основанного на модификации метрики Хаусдорфа / И. А. Михайлов // Научно-практические исследования и проблемы современной молодежи: Труды II Международной молодёжной научно-практической конференции. Т. 1. Елабуга, 23 - 24 декабря 2010 г. Казань: Изд-во Казан, гос. техн. ун-та, 2010. С. 131-135.

14. Михайлов, И. А. Распознавание изображений с помощью метода радиальных окрестностей / И. А. Михайлов // Научно-практические исследования и проблемы современной молодежи: Труды II Международной молодёжной научно-практической конференции. Т. 1. Елабуга, 23 -24 декабря 2010 г. Казань: Изд-во Казан, гос. техн. ун-та, 2010. С. 136^-140.

15. Михайлов, И. А. Восстановление изображений, искажённых перспективным преобразованием / И. А. Михайлов // Научно-практические исследования и проблемы современной молодежи: Труды II Международной молодёжной научно-практической конференции. Т. 1. Елабуга, 23 -24 декабря 2010 г. Казань: Изд-во Казан, гос. техн. ун-та, 2010. С. 141-143.

16. Михайлов, И. А. Разбиение железнодорожного состава на отдельные вагоны (цистерны) / И. А. Михайлов // Шестьдесят четвёртая региональная научно-техническая конференция студентов, магистрантов и аспирантов с международным участием. 20 апреля 2011 г., Ярославль. Ч. 2: Тез. докл. - Ярославль: Изд-во ЯГТУ, 2011. - С. 309:

Подписано в печать 19.10.11. Формат 60x84/16. Бумага оф. Отпечатано на ризографе.

Тираж 100 экз. Заказ 29/11. Отдел оперативной полиграфии ЯрГУ 150000, Ярославль, ул. Советская ,14.

Оглавление автор диссертации — кандидата физико-математических наук Михайлов, Иван Александрович

1 Введение

1.1 Обработка изображений в целом.

1.2 Распознавание символьных изображений.

1.2.1 Современное состояние проблемы распознавания образов

1.2.2 Постановка задачи и её практическая значимость.

1.3 Восстановление изображений, искажённых перспективным преобразованием

1.3.1 Реставрация изображений

1.3.2 Постановка задачи и её практическая значимость.

1.4 Разбиение железнодорожного состава на отдельные вагоны.

1.4.1 Обнаружение движущихся объектов и отслеживание траектории их движения.

1.4.2 Постановка задачи и её практическая значимость.

2 Распознавание символьных изображений

2.1 Краткий обзор методов.

2.2 Постановка задачи и общий подход к её решению.

2.3 Метод, основанный на модификации метрики Хаусдорфа.

2.3.1 Определение Ит—расстояния

2.3.2 Свойства кт—расстояния.

2.3.3 Описание алгоритма сравнения.

2.3.4 Оценка трудоёмкости алгоритма сравнения изображений с использованием кт—расстояния.

2.4 Метод срезов.

2.4.1 Определение бесконечного вектора и расстояния на множестве бесконечных векторов.

2.4.2 Определение линейного образа и расстояния на множестве линейных образов

2.4.3 Свойства приведённых расстояний.

2.4.4 Описание алгоритма сравнения.

2.4.5 Оценка трудоёмкости алгоритма сравнения.

2.5 Метод радиальных окрестностей.

2.5.1 Определения.

2.5.2 Используемые расстояния

2.5.3 Свойства приведённых расстояний

2.5.4 Описание алгоритма сравнения.

2.5.5 Оценка трудоёмкости алгоритма сравнения.

2.6 Описание проведённых экспериментов и результатов работы алгоритмов

2.6.1 Эксперимент №1.

2.6.2 Эксперимент №2.

2.6.3 Эксперимент №3.

2.6.4 Результаты работы алгоритмов.

3 Восстановление изображений

3.1 Краткий обзор методов.

3.2 Обозначения, определения и постановка задачи.

3.2.1 Определение перспективного преобразования.

3.2.2 Постановка задачи.

3.2.3 Обозначения и определения

3.2.4 Формальная постановка задачи.

3.2.5 Дополнительные ограничения для условия и решения задачи

3.3 Решение задачи

3.3.1 Необходимые и достаточные свойства Т^

3.3.2 Вычисление Ть.

3.4 Применение найденного решения.

3.4.1 Алгоритм восстановления растровых изображений в оттенках серого.

3.4.2 Примеры изображений.

4 Разбиение ж/д состава на отдельные вагоны

4.1 Краткий обзор методов решения подобных задач.

4.2 Входные и выходные данные.

4.3 Характеристики фильмов.

4.4 Обозначения и определения

4.4.1 Общие обозначения и определения.

4.4.2 Пометки, серии, основной поток, основное течение.

4.4.3 ¿»-пометки, краевой поток, краевое течение

4.5 Структура алгоритма разбиения состава.

4.6 Используемые переменные.

4.7 Вспомогательные процедуры.

4.7.1 Повышение контрастности изображений.

4.7.2 Общая процедура подготовки кадров.

4.8 Выделение активной области кадра.

4.8.1 Накопление суммарной разницы.

4.8.2 Определение границ активной области.

4.9 Обработка кадров на начальном этапе движения.

4.9.1 Основная процедура обработки кадров на этапе начального движения

4.9.2 Обнаружение края вагона.

4.9.3 Отслеживание траектории края вагона.

4.9.4 Оценка скорости с учётом перспективного искажения кадров

4.9.5 Непосредственная оценка скорости.

4.10 Этап основного движения.

4.10.1 Процедура обработки кадров на этапе основного движения

4.10.2 Оценка текущей скорости ж/д состава.

4.10.3 Оценка скорости во время выхода ж/д состава из области видимости

4.10.4 Обнаружение просветов в кадре.

4.10.5 Регистрация новой пометки

4.11 Обработка накопленных данных на заключительном этапе

4.11.1 Основная процедура заключительного этапа.

4.11.2 Определение условного веса течения.

4.11.3 Определение веса серии.

4.11.4 Определение координаты разделяющей вертикали.

4.12 Описание проведённых экспериментов и результатов работы алгоритма

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Михайлов, Иван Александрович

1.1 Обработка изображений в целом

С незапамятных времён человек стремился облегчить свой труд, изобретая и применяя в работе вспомогательные орудия. С течением времени орудия становились всё более совершенными, позволяя эффективно решать те задачи, с которыми ранее люди справиться не могли.

Сегодня, в эпоху всеобщей автоматизации, основным объектом деятельности человека становится информация, а инструментом — компьютер. Значительная часть информации, с которой приходится иметь дело современному человеку, имеет графическое представление. Действительно, изображение является объектом исследования или его результатом в таких областях человеческой деятельности, как космонавтика, астрономия, биология, медицина, физика, геология, криминалистика, дефектоскопия и других. Изображения получают не только в диапазоне частот электромагнитного излучения, отвечающего видимому свету, но и в диапазоне частот акустическом, инфракрасном, ультразвуковом, ультрафиолетовом, рентгеновских и гамма-лучей. При этом средства их формирования и регистрации отличаются большим разнообразием.

Велик также и объём графической информации, нуждающейся в обработке. Например, в США ещё в начале 80-х ежегодно получали более 25 миллиардов снимков и несколько сотен миллиардов единиц бумажной продукции, требующих дальнейшего анализа [3, стр. 4]. При обычном эксперименте по изучению элементарных частиц в ядерной физике обрабатывается несколько сотен тысяч фотографий.

Таким образом, большой объём видеоинформации ведёт к необходимости автоматизации процессов её обработки. Как уже было сказано, основным инструментом для решения этой и многих других задач является электронно-вычислительная машина, компьютер. Перечислим теперь некоторые задачи обработки видеоинформации, решаемые с его помощью [3, стр. 5-6].

• Эффективное кодирование (сжатие) изображений — необходимо для уменьшения минимальной пропускной способности канала связи или объёма памяти, требуемой для хранения информации.

• Восстановление искажённых изображений, а также улучшение их визуального качества заключается в его преобразовании, обратном преобразованию, вызвавшему искажение. Соответствующие алгоритмы восстановления позволяют скомпенсировать искажения, обусловленные рефракцией или турбулентностью атмосферы, недостатками оптических приборов, деформацией фотоматериала, помехами и т. д. Улучшение визуального качества изображений облегчает их восприятие и анализ человеком.

• Моделирование систем передачи изображений проводится с целью исследования различных методов с целью сокращения полосы телевизионного сигнала или передачи видеосигнала по каналу с помехами.

• Автоматизация процесса подготовки производства в машиностроении, изготовление карт по аэрокосмическим снимкам, синтез мультипликационных фильмов и т. д. возможны благодаря развитию методов машинной графики.

• Автоматическое чтение текста, дешифрование аэрокосмических снимков, диагностика заболеваний — примеры задач, относящихся к проблеме распознавания образов. Интерес, проявляемый к её разработке в настоящее время, связан с открывающимися возможностями лучшего понимания процессов обработки информации в живых системах, создания более эффективных систем «человек/ машина», а также автоматических систем, позволяющих быстрее, точнее, надёжнее или экономичнее человека решать различные задачи обработки визуальной информации.

Длительное развитие методов и средств обработки изображений привело к образованию новой отрасли науки и техники, имеющей большую перспективу.

Заключение диссертация на тему "Разработка и исследование методов обработки и распознавания объектов на последовательности изображений"

5 Заключение

1. Разработаны три алгоритма распознавания изображений алфавитно-цифровых символов, для проверки эффективности которых было проведено три эксперимента. Каждый из методов имеет свои преимущества и недостатки. Так, самым быстрым является метод срезов, самым медленным — метод радиальных окрестностей. В то же время эксперимент с реальными изображениями показал, что метод, основанный на модификации метрики Хаусдорфа и метод радиальных окрестностей в отличие от метода срезов дают сравнительно неплохие результаты для небольшого набора эталонов, в случае же расширенного набора изображений-эталонов результаты работы всех трёх алгоритмов близки друг к другу. Таким образом, метод срезов удобен в тех случаях, когда допускается неограниченное увеличение набора эталонов с целью повышения степени распознавания. Два других метода подходят тогда, когда требуется обеспечить приемлемое качество распознавания для небольшого (возможно, фиксированного) набора изображений-эталонов. Как уже было сказано, предложенные методы могут найти своё применение в системах распознавания номеров на железнодорожных цистернах и регистрационных номеров автомобилей, системах автоматического чтения текста и других системах распознавания.

2. Разработан алгоритм восстановления изображений, искажённых перспективным преобразованием. Предложенный метод имеет то преимущество, что не использует каких-либо параметров оптической системы, с помощью которой было получено изображение. Заметим, что возможна полная автоматизация восстановления, если сходящиеся прямые — образы горизонтальных прямых — также будут обнаруживаться автоматически. Алгоритм подходит для применения в тех задачах, где требуется устранить перспективное искажение, в частности, он может быть использован на этапе предобработки для последующего распознавания на изображении символьной информации.

3. Разработан метод разбиения ж/д состава на отдельные вагоны. Преимущества данного метода по сравнению с аналогичными состоят в том, что он в одном случае является более автоматизированным, а в другом — не требует наличия вспомогательных технических средств. Предложенный алгоритм может быть использован для создания систем автоматического распознавания номеров железнодорожных цистерн.

Библиография Михайлов, Иван Александрович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Дуда, Р. Распознавание образов и анализ сцен: Пер. с англ. под ред. В. Л. Сте-фанюка / Р. Дуда, П. Харт. М.: Мир, 1976. - 511 е.: ил.

2. Duda, R. О. Pattern classification / Duda R. О., P. E. Hart, D. G. Stork. 2nd ed.- New York: Wiley Interscience, 1999. 738 p.

3. Анисимов, Б. В. Распознавание и цифровая обработка изображений: Учеб. пособие для студентов вузов / Б. В. Анисимов, В. Д. Курганов, В. К. Злобин. М.: Высш. шк., 1983. - 295 е.: ил.

4. Прэтт, У. Цифровая обработка изображений: Пер. с англ. под ред. Д. С. Лебедева, в 2 кн. Кн. 2 / У. Прэтт. М.: Мир., 1982. - 480 е.: ил.

5. Гонсалес, Р. Цифровая обработка изображений: Пер. с англ. под ред. П. А. Чочиа / Р. Гонсалес, Р. Вудс. М.: Техносфера, 2005. - 1072 с.

6. Файн, В. С. Опознавание изображений (основы непрерывно-групповой теории и её приложения) / В. С. Файн. М.: Наука, 1970. - 299 е.: ил.

7. Юнг, Дж. В. Проективная геометрия / Дж. В. Юнг. Перевод с английского под редакцией проф. В. Ф. Кагана. М.: ИЛ, 1949. - 184 е.: ил.

8. Mann, S. Intelligent Image Processing / S. Mann. New York: Wiley Interscience, 2002. - 359 p.

9. Mori, Shunji. Historical Review of OCR Research and Development / Shunji Mori, Ching Y. Suen, Kazuhiko Yamamoto // Proceedings of the IEEE, Vol. 80, No 7.- July 1992. pp. 1029 - 1058.

10. Chinese character recognition: history, status and prospects / R. Dai, C. Liu, B. Xiao // Frontiers of Computer Science in China. 2007. - Vol. 1, No. 2. - pp. 126-136. -ISSN 1673-7350.

11. Malon, C. Support Vector Machines for Mathematical Symbol Recognition / C. Malon, S. Uchida, M. Suzuki // Structural, Syntactic, and Statistical Pattern Recognition, 2006. Vol. 4109/2006. - pp. 136-144.

12. Offline Chinese handwriting recognition: assessment of current technology / S.N. Srihari, X. Yang, G.R. Ball // Frontiers of Computer Science in China. 2007. -Vol. 1, No. 2. - pp. 137-155. - ISSN 1673-7350.

13. AbdulKader, A. A Two-Tier Arabic Offline Handwriting Recognition Based on Conditional Joining Rules / A. AbdulKader // Arabic and Chinese Handwriting Recognition, 2008. Vol. 4768/2008. - pp. 70-81.

14. Abou-zeid, H.M.R. Computer Recognition of Unconstrained Handwritten Numerals / H.M.R. Abou-zeid, A.S. El-ghazal, A.A. Al-khatib // Circuits and Systems.

15. Proceedings of the 46th IEEE International Midwest Symposium on, 2004. pp. 969-973.

16. Kacalak, W. Selected Problems of Intelligent Handwriting Recognition / W. Kacalak, K.D. Stuart, M. Majewski // Analysis and Design of Intelligent Systems using Soft Computing Techniques, 2007. Vol. 41/2007. - p. 298-305.

17. Song, L. Method for Automatic Image Recognition based on Algorithm Fusion / L. Song, Y. Lin // Proceedings of the Third IEEE International Conference on Natural Computation, 2007. p. 671-675.

18. Ahmed, M.J. License plate recognition system / M.J. Ahmed, M. Sarfraz, A. Zidouri, W.G. Al-Khatib // Proc. IEEE Int. Electronics, Circuits and Systems Conf., 2003.- Vol. 2. p. 898-901.

19. Comelli, P. Optical Recognition of Motor Vehicle License Plates / P. Comelli, P. Ferragina, M.N. Granieri, F. Stabile // IEEE Transactions on Vehicular Technology, 1995. Vol. 44, No. 4. - p. 790-799.

20. Huang, R. License Plate Character Recognition Using Artificial Immune Technique / R. Huang, H. Tawfik, A. Nagar // Computational Science, 2008. Vol. 5101/2008.- p. 823-832.

21. Rapid Door Number Recognition by a Humanoid Mobile Robot / Q. Meng // Journal of Intelligent and Robotic Systems. 2005. - Vol. 43, No. 1. - pp. 33-54. - ISSN 0921-0296.

22. Einsele, F. Recognition of Ultra Low Resolution Word Images Using HMMs / F. Einsele, R. Ingold, J. Hennebert // Computer Recognition Systems 2, 2007. -Vol. 45/2007. pp. 429-436.

23. Assabie, Y. Structural and Syntactic Techniques for Recognition of Ethiopic Characters / Y. Assabie, J. Bigun // Structural, Syntactic, and Statistical Pattern Recognition, 2006. Vol. 4109/2006. - pp. 118-126.

24. Kara, L. В. Sketch Understanding for Engineering Software / L. B. Kara // Ph.D. Thesis Proposal. 2003. - 68 p.

25. Sternby, J. Frame Deformation Energy Matching of On-Line Handwritten Characters / J. Sternby // Progress in Pattern Recognition, Image Analysis and Applications, 2005. Vol. 3773/2005. - pp. 128-137.

26. Computer Recognition of Unconstrained Handwritten Numerals / C. Y. Suen, C. Nadal, R. Legault, T. A. Mai, and L. Lam // Proceedings of the IEEE, Vol. 80, No 7. July 1992. - pp. 1162- 1180.

27. Hu, J. Structural Boundary Feature Extraction for Printed Character Recognition / J. Hu, D. Yu, and H. Yan // Joint IAPR International Workshops SSPR'98 and SPR'98 Sydney, Australia, Proceedings. 1998. - pp. 500 - 507.

28. Хмелев, P. В. Совместное использование структурного анализа и метрики Ха-усдорфа при сравнении объекта и эталона / Р. В. Хмелев // Компьютерная оптика. В. 27. 2005. - сс. 174 - 176.

29. Dual Classifier System for Handprinted Alphanumeric Character Recognition / Y.-C. Chim, A.A. Kassim, Y. Ibrahim // Pattern Analysis & Applications. 1998. - Vol. 1, No. 3. -pp. 155-162. - ISSN 1433-7541.

30. Pal, U. Handwritten Character Recognition of Popular South Indian Scripts / U. Pal, N. Sharma, T. Wakabayashi, F. Kimura // Arabic and Chinese Handwriting Recognition, 2008. Vol. 4768/2008. - pp. 251-264.

31. Yu, K. Skeleton-Based Recognition of Chinese Calligraphic Character Image / K. Yu, J. Wu, Y. Zhuang // Advances in Multimedia Information Processing, 2008. Vol. 5353/2008. - pp. 228-237.

32. Wachenfeld, S. A Multiple Classifier Approach for the Recognition of Screen-Rendered Text / S. Wachenfeld, S. Fleischer, X. Jiang // Computer Analysis of Images and Patterns, 2007. Vol. 4673/2007. - pp. 921-928.

33. Glucksman, H. Classification of mixed-font alphabetics by characteristic loci / H. Glucksman // Digest of 1st Annual IEEE Comp. Conf., 1967. pp. 138-141.

34. Ottlik, A. Initialization of Model-Based Vehicle Tracking in Video Sequences of InnerCity Intersections / A. Ottlik, H.-H. Nagel. // International Journal of Computer Vision, No 80. 2008. - pp. 211- 225.

35. Haag, Michael. Combination of Edge Elementand Optical Flow Estimates for 3D-Model-Based Vehicle Tracking in Traffic Image Sequences / M. Haag, H.-H. Nagel // International Journal of Computer Vision, No 35(3). 1999. - pp. 295- 319.

36. Jung, Y.-K. A Feature-Based Vehicle Tracking System in Congested Traffic Video Sequences / Y.-K. Jung and Y.-S. Ho // Lecture Notes in Computer Science, Vol. 2195, Advances in Multimedia Information Processing — PCM 2001. 2001. - pp. 190- 197.

37. Song, X. Robust Vehicle Blob Tracking with Split / Merge Handling / X. Song and R. Nevatia // Lecture Notes in Computer Science, Vol. 4122, Multimodal Technologies for Perception of Humans. 2007. - pp. 216- 222.

38. Choi, J.-Y. Improved Tracking of Multiple Vehicles Using Invariant Feature-Based Matching / J.-Y. Choi, J.-W. Choi and Y.-K. Yang // Lecture Notes in Computer Science, Vol. 4815, Pattern Recognition and Machine Intelligence. 2007. - pp. 649656.

39. Rodriguez, T. An adaptive, real-time, traffic monitoring system / T. Rodriguez, N. Garcia // Machine Vision and Applications, No 21. 2010. - pp. 555- 576.

40. Landabaso, J.-L. Robust Tracking and Object Classification Towards Automated Video Surveillance / J.-L. Landabaso, L.-Q. Xu, and M. Pardas // Lecture Notes in Computer Science, Vol. 3212, ICIAR. 2004. - pp. 463- 470.

41. Huang, J. Automatic Detection of Object of Interest and Tracking in Active Video / J. Huang, Z.-N. Li // Journal of Signal Processing Systems (2011), No 65. 2011.- pp. 49- 62.

42. Czyzewski, A. Moving Object Detection and Tracking for the Purpose of Multimodal Surveillance System in Urban Areas / A. Czyzewski and P. Dalka // New Direct, in Intel. Interac. Multimedia, SCI 142. 2008. - pp. 75- 84.

43. Poon, H. S. Robust Detection and Tracking of Multiple Moving Objects with 3D Features by an Uncalibrated Monocular Camera / H. S. Poon, F. Mai, Y. S. Hung, and G. Chesi // MIRAGE 2009, LNCS 5496. 2009. - pp. 140- 149.

44. Guo, W. Visual Attention Based Motion Object Detection and Trajectory Tracking / W. Guo, C. Xu, S. Ma, and M. Xu // PCM 2010, Part II, LNCS 6298. 2010.- pp. 462- 470.

45. Lowe, D. Distinctive image features from scale-invariant keypoints / D. Lowe // International Journal of Computer Vision, No. 60 (2). 2004. - pp. 91-110.

46. Fischler, M.A. Random Sample Consensus: A Paradigm for Model Fitting with Applications to Image Analysis and Automated Cartography / M.A. Fischler, R.C. Bolles // Communications of the ACM, No. 24 (6). 1981. - pp. 381-395.

47. Gopalakrishnan, V. Sustained Observability for Salient Motion Detection / V. Gopalakrishnan, Y. Hu, and D. Rajan // ACCV 2010, Part III, LNCS 6494. 2011.- pp. 732-743.

48. Verbeke, N. A PCA-Based Technique to Detect Moving Objects / N. Verbeke and N. Vincent // SCIA 2007, LNCS 4522. 2007. - pp. 641-650.

49. Latecki, L. J. Activity and Motion Detection Based on Measuring Texture Change / L. J. Latecki, R. Miezianko, and D. Pokrajac // MLDM 2005, LNAI 3587. 2005.- pp. 476-486.

50. Hossain, M. J. An Edge-Based Moving Object Detection for Video Surveillance / M. J. Hossain and O. Chae // PReMI 2005, LNCS 3776. 2005. - pp. 485-490.

51. Михайлов, И. А. Об одном методе распознавания изображений / И. А. Михайлов // Моделирование и анализ информационных систем. Т. 14, № 4. / Под ред. В. А. Соколова. Ярославль: Изд-во Яросл. гос. ун-та им. П. Г. Демидова, 2007. - сс. 7 - 12.

52. Михайлов, И. А. Некоторые методы распознавания изображений / И. А. Михайлов // Моделирование и анализ информационных систем. Т. 15, № 4. / Под ред. В. А. Соколова. Ярославль: Изд-во Яросл. гос. ун-та им. П. Г. Демидова, 2008. - сс. 56 - 64.

53. Михайлов, И. А. Распознавание изображений с помощью метода радиальных окрестностей / И. А. Михайлов // Компьютерная оптика. Т. 34, № 3, 2010. -сс. 399 407.