автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование алгоритмов анализа видимого изображения и их применение в задачах управления
Оглавление автор диссертации — кандидата технических наук Бобков, Александр Валентинович
ВВЕДЕНИЕ.
ГЛАВА 1. ПОСТАНОВКА ЗАДАЧИ АНАЛИЗА
ВИДЕОИНФОРМАЦИИ И МЕТОДЫ ЕЕ РЕШЕНИЯ.
1.1 .Постановка задачи.
1 ^.Классификация задач анализа видеоинформации 10 1.3 .Существующие методы анализа видеоинформации.
1.3.1.Дуализм задач локализации и идентификации объекта на изображении.
1.3.2.Прямой метод решения задачи распознавания.
1.3.3.Корреляционный подход.
1.3.4.Использование инвариантных признаков.
1.3.5.Использование геометрических примитивов.
1аобъекты^ используемые для сравнения кадров изображений
ГЛАВА 2. ИЗВЛЕЧЕНИЕ ПРЯМЫХ.
2.1 .Постановка задачи.
2.2.Обзор методов извлечения линий.
2.3.Извлечение линий. Общие соображения.
2.4.Предобработка изображений.
2.5.Выделение контуров. Детекторы границ
2.6.Рбработка границ. Бинаризация уменьшение толщины контура^ фильтр Кенни.
2.7.Извлечение прямых.
2.8.Алгоритм извлечения отрезков.
2.9.выделение информативных областей
2. Ю.Склейка отрезков.
2.11.полное описание алгоритма; анализ быстродействия
2.12.Определение оптимального шага квантования параметров нормали.
2.13.Определение минимального размера фигур^ представимых в виде набора отрезков 7 \ 2.14.3аключение.
ГЛАВА 3. СОПОСТАВЛЕНИЕ КАДРОВ ИЗОБРАЖЕНИЯ.
3.1 .постановка задачи.
3.2.МЕТОДЫ, ОСНОВАННЫЕ НА СОПОСТАВЛЕНИИ ПРЯМЫХ.
3.2.1.Прямое решение.
3.2.2.Способы ускорения алгоритма- основные соображения.
3.2.3.Независимое детектирование угла поворота
3.2.4.Метрд^ основанный на преобразовании Хука.
3.2.5.метод^ основанный на сравнении пар линий.
3.3.МЕТОДЫ НА ОСНОВЕ ИЗВЛЕЧЕНИЯ ВТОРИЧНЫХ ОБЪЕКТОВ.8б
3.3.1 .Метод сопоставления по углам
3.3 .2.Метод сопоставления по полосам.
3.3.3.Метод сопоставления по серединам отрезков
3.4.Сравнение характеристик методов.
Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Бобков, Александр Валентинович
Использование видимого изображения для управления динамическим объектом является важной задачей, интерес к которой в последнее время быстро возрастает. С одной стороны, это связано с возросшими потребностями промышленной робототехники, а с другой - с прорывом в области высоких технологий, позволивших получать вычислительные устройства с достаточно высоким быстродействием. Видимое изображение несет в себе огромное количество информации, пригодной для использования в целях управления - гораздо больше, чем можно почерпнуть из других источников информации - надо только научиться ее своевременно выделять. Система получения изображений обладает достаточной простотой, точностью, надежностью и гибкостью. Для обработки изображений на ЭВМ требуется только видеокамера и плата захвата изображения (фреймграббер). Камера может быть выполнена достаточно миниатюрной, чтобы поместить ее практически в любом месте и в любых условиях. Гибкость видеосистемы позволяет работать с полями различной физической природы (УФ- и ИК-диапазон, распределение температур, высот и глубин, микроскопия и телескопия), и использовать ее в огромном числе практических приложений.
Главный недостаток видеосистемы органически связан с ее главным достоинством. Это огромный объем получаемых данных, которые необходимо обработать для получения полезной информации в реальном масштабе времени. Видеопоследовательность представляет собой последовательность кадров, получаемых с небольшим интервалом времени (обычно - 0,04 секунды). Кадр состоит из набора пикселей - отсчетов значений интенсивности поля в каждой точке. Тогда для очень маленького кадра 200x200 потребуется обрабатывать 1Мб данных в секунду. Для большинства приложений это катастрофически много. Задачи управления требуют получения информации о состоянии объекта в реальном масштабе времени. Любые задержки в получении информации о состоянии снижают запас устойчивости системы, и существует критическая задержка, при превышении которой система выходит из требуемого режима. Для большого числа объектов управления такая задержка очень мала, что фактически не позволяет использовать визуальную информацию и пользоваться теми преимуществами, которые она дает.
В данной работе исследуются пути извлечения информации из видеопоследовательности в реальном масштабе времени, с целью дальнейшего использования этой информации для управления динамическим объектом. Основная идея, позволяющая обрабатывать видеоинформацию в реальном времени, состоит в следующем. Обработка происходит в два этапа. На первом этапе точечное изображение преобразуется в набор геометрических примитивов, аппроксимирующих контуры изображения (такое преобразование называется векторизацией изображения). Это обеспечивает, во-первых, колоссальное сжатие данных (на 2-3 порядка), поскольку набор параметров геометрических примитивов допускает более компактное представление объектов, чем набор точек (геометрическое описание, например, четырехугольника, содержит 8 координат углов, и занимает намного меньше места, чем поточечное представление того же четырехугольника). Во-вторых, сжатие данных здесь - не самоцель, существуют методы более быстрого и сильного сжатия. Важно то, что геометрическое описание позволяет легко обрабатывать большие области изображения - сравнивать, преобразовывать, корректировать - быстрее, чем это возможно для любого другого представления. И, наконец, второй этап предложенного метода - это собственно сам анализ изображения (в терминах геометрических примитивов). В зависимости от специфики конкретной задачи, методы анализа могут различаться, однако, как правило, они могут быть сведены к сравнению изображения и некоторого образца.
Таким образом, целью разрабатываемой системы является анализ изображений в реальном масштабе времени для извлечения информации для управления объектом, с обеспечением достаточной точности и надежности извлекаемой информации.
Заключение диссертация на тему "Разработка и исследование алгоритмов анализа видимого изображения и их применение в задачах управления"
5.3.Выводы
В данной главе рассмотрено использование алгоритма анализа набора отрезков для задачи поиска объекта по образцу для случая одновременного движения объекта и камеры. Было показано, что алгоритм можно использовать для поиска положения объектов на изображении в реальном масштабе времени, Если качество изображения объекта позволяет представить его в виде достаточно полного набора линий.
Для случая, когда такое представление невозможно, был разработан альтернативный путь, заключающийся в совместном использовании алгоритма анализа отрезков и детектора движений.
Высокое быстродействие рассмотренных методов позволяет считать их перспективными для решения таких задач реального времени, как поиск и удержание объекта в поле зрения, преследования объекта, безопасного сближения, уклонения от столкновения и многих других.
ЗАКЛЮЧЕНИЕ
В данной работе была рассмотрена задача анализа видеоизображения с целью извлечения информации о состоянии объекта управления. Был проведен следующий круг работ:
1 .Рассмотрены возможные задачи анализа видеоизображения и проведена классификация этих задач,
2.Проанализированы существующие методы решения этих задач,
3.Разработана схема алгоритма анализа изображения с использованием представления изображения в виде геометрических примитивов и проведено ее обоснование,
4.Пред ставлен оригинальный алгоритм выделения отрезков на изображении, значительно опережающий существующие аналоги по точности, надежности и быстродействию,
5.Разработан универсальный алгоритм сопоставления изображений по набору отрезков, который может быть использован для решения широкого круга задач анализа изображений в реальном масштабе времени,
6.На основе разработанного алгоритма показано решение задачи определения собственного движения по последовательности изображений,
7.Рассмотрена задача автономной навигации ЛА по видимому изображению местности с использованием электронной карты поверхности. Высокие показатели качества алгоритма позволяют рекомендовать предлагаемый подход для практической реализации.
8.Рассмотрена задача поиска объекта на изображении, в том числе и для случая одновременного движения как искомого объекта, так и самой камеры.
Библиография Бобков, Александр Валентинович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1.Пупков К.А, Неусыпин К.А. Вопросы теории и реализации систем управления и навигации.- М. Биоинформ, 1997 - 368 с.
2. Корреляционно-экстремальные видеосенсорные системы для роботов / Ю.А.Андреев, Н.Н.Белоглазов, А.М.Кориков и др.; Под ред. A.M. Корикова, В.П. Тарасенко / Томский ин-т им. В.А. Кузнецова при Томском гос. Ун-те Томск: Изд-во Томского ун-та, 1986 - 238 с.
3. Нейроинформатика / А.Н.Горбань, В.Л.Дунин-Барковский, А.Н.Кир дин и др.; Под ред. А.Н.Горбаня.- Новосибирск: Наука, Сибирское предприятие РАН, 1998,- 472 с.
4. Mundy J., Zisserman A. Geometric Invariance in Computer Vision.-Cambridge: MIT Press, 1992.- 375 p.
5. Davies E.R. A new framework for analysing the properties of the generalized Hough transform // Pattern recogn. Lett-1987 № 6 - P. 1-7
6. Heikkonen J. Recovering 3D-motion parameters from optical flow field using randomized Hough transform // Pattern Recogn. Lett 1995 - № 9- P. 971978
7. Derichle R., Faugeras O. Tracking line segments // Image Vision and Computing.- 1990.- Vol.8, №4,- P. 261-270
8. Pringle K.K. Visual perception by a computer // Automatic Interpretation and Classification of Images / A. Grasselli (ed.).- New York: Academic Press, 1969,-P. 277-284
9. Davies E.R. Machine Vision: Theory, Algorithms, Practicalities.- New York: Academic Press, 1997 751 p.
10. Adbou I.E., Pratt W.K. Quantitative design and evaluation of enhancement/thresholding edge detectors // Proc. IEEE 1979 - Vol.67, №5 - P. 753-763
11. Prewitt J.M.S. Object enhancement and extraction // Picture Processing and Psychopictoric / Lipkin B.S, Rosenfield A. (eds). New York: Academic Press, 1970.-P. 75-149
12. Duba R.O., Hart P.E. Pattern Classification and Scene Annalysis- New York: Wiley, 1973.-361 p.
13. Kirsch, R.A. Computer determination of the constituent structure of biological images // Comput. Biomed. Res.- 1971,- Vol.4.- P. 315-328
14. Robinson G.S. Edge detection by compass gradient masks // Comput. Graph. Image Processing 1977.- Vol.6.- P. 492-501
15. Kittler J., Illingworth J., Fouglein J. Threshold selection based on a simple image statistic // Comput. Vision Graph. Image Process 1985 - Vol.30-P. 125-147.
16. Wu A.Y., Hong T.-H., Rosenfield A. Threshold selection using quadtrees // IEEE Trans. Pattern Anal. Mach. Intell 1982.- Vol.4.- P. 90-94.
17. Wermser D., Haussmann G., Liedtke C.-E. Segmentation of blood smears by hierarchical thresholding // Comput. Vision Graph. Image Process- 1984-Vol.25.-P. 151-168.
18. Canny J. A Computational Approach to Edge Detection // IEEE Transactions on Pattern Analysis and Machine Intelligence 1986 - Vol. 8, №6-P. 679-698.
19. Li H., Lavin M.A, LeMaster R.J. Fast Hough Transform // Workshop on Computer Vision: Representation and Control Be Hair, 1985 - P. 75-83
20. Illingworth J., Kittler J. The Adaptive Hough Transform // IEEE Trans. Pattern Anal. Mach. Intel-1987 Vol.3.- P. 690-698
21. Gerig G., Kleim F. Fast contour identification through efficient Hough Transform and simplified iterpretation strategy // Proc. 8 Int. Conf. On Pattern recogn.-Paris, 1986.-P. 498-500
22. Princen J., Illingworth J., Kittler J. A hierarchical approach to line extraction // Proc. IEEE Computer Vision and Pattern Recognition Conf- San-Diego, 1989.-P. 92-97
23. Horn B.K.P., Schunck B.G. Determining optical flow // Artificial intelligence.- 1981.-Vol. 17 (1-3).-P. 185-203
24. Lei G. Recognition of planar objects in 3D space from single perspective views using cross ratio // IEEE Transactions on Robotics and Automation 1990-Vol.6 - P. 432-437
25. Song В., Yun I., Lee S. A target recognition technique employing geometric invariants // Pattern Recognition 2000 - Vol.33, №3- P. 413-425.
26. Relative motion and pose from arbitrary plane curves / C. Rothwell, A. Zisserman, C. Marinos et al. // Image and Vision Computing 1992 - Vol.10.- P. 250-262.
27. Oberkampf D., DeMenthon D., Davis L. Iterative pose estimation using coplanar feature points // Computer Vision and Image Understanding-1996-Vol.63, №3.-P. 495-511
28. Lourakis M., Halkidis S., Orphanoudakis S. Matching disparate views of planar surfaces using projective invariants // Image and Vision Computing-2000-Vol. 18, №9-P.673-683
29. Murino V., Foresti G.L. 2D into 3D Hough-space mapping for planar object pose estimation // Image and Vision Computing.- 1997.- Vol.15 (6)-p. 435-444
30. J.R.Cozar, J.R., N. Guil, N. and Zapata, E.L. Detection of arbitrary planar shapes with 3D pose // Image and Vision Computing-2001 Vol. 19, № 14.-P. 1057-1070
-
Похожие работы
- Разработка и исследование алгоритмов восстановления изображений методами секвентного анализа
- Алгоритмы фильтрации изображений в квазидвумерных конечных базисах
- Алгоритмы формирования кругового панорамного изображения в системе разнесенных в пространстве видеокамер
- Инвариантное представление изображений для распознавания космических объектов
- Модели и алгоритмы оценивания параметров динамических изображений в бортовых системах видеослежения
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность