автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний

кандидата технических наук
Чжи Я Аунг
город
Москва
год
2010
специальность ВАК РФ
05.13.06
Диссертация по информатике, вычислительной технике и управлению на тему «Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний»

Автореферат диссертации по теме "Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний"

□03492342

На правах рукописи Экз. №

МЕТОДИКИ И АЛГОРИТМЫ АВТОМАТИЗАЦИИ ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ ВИЗУАЛИЗАЦИИ, ОБРАБОТКИ И ПОИСКА ИЗОБРАЖЕНИЙ В ГРАФИЧЕСКИХ БАЗАХ ЗНАНИЙ

Специальность 05.13.06 -"Автоматизация и управление технологическими процессами и производствами" (приборостроение).

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Москва-2010 г.

2 5 ФЕВ ?П1П

003492342

Работа выполнена на кафедре "Информатика и программное обеспечение вычислительных систем" Московского государственного института электронной техники (технический университет)

Научный руководитель : доктор технических наук, профессор

Официальные оппоненты: доктор физико-математических наук,

Ведущая организация: ГУП НПЦ «ЭЛВИС», г. Москва

Защита диссертации состоится " 8 " Опр&уЬ 2010 г. в \Giqq часов на заседании диссертационногосовета Д.212.134.04 при Московском государственном институте электронной техники (техническом университете) по адресу : 124498, Москва, Зеленоград, проезд 4806, д.5, МИЭТ.

С диссертацией можно ознакомиться в библиотеке МИЭТ .

Портнов Е.М.

профессор Рычагов М.Н.

кандидат технических наук Артюшенков С.Н.

Автореферат разослан " I?'

2010 г.

Ученый секретарь

диссертационного совета Д.212.134.0 доктор технических наук, профессор

А.И. Погалов

Общая характеристика работы Актуальность работы.

Автоматизация технологических процессов обработки изображений является одной из центральных и практически важных задач в приборостроении и других отраслях промышленности. Проблема носит комплексный характер и включает ряд основных этапов: восприятие поля зрения, сегментация, нормализация выделенных объектов, распознавание, визуализация и поиск изображений.

Результаты исследований, направленных на создание эффективных методов визуализации и обработки изображений, изложены в работах зарубежных и отечественных ученых: W.K.Pratt, R. Jain, R.W Floyd, J .M.S. Prewitt, J.F. Jarvis, B.E. Bayer, T Pavlidis, В.Ф.Нестерук, И.А.Богуславского, A. Rosenfeld, В.А.Сойфера, Л.ПЛрославского, Ю.И. Журавлева.

Задача автоматизированной обработки изображений продолжает оставаться крайне актуальной на протяжении последних десятилетий. Несмотря на неослабевающий интерес исследователей и большое количество работ в данной области есть еще много открытых вопросов и нерешенных задач. В настоящее время существует и активно развивается целая отрасль автоматизированных систем, предназначенных для поиска, обработки и визушшзации изображений: в v частности системы распознавания образов, системы визуализации изображений, информационно-поисковые системы, системы сжатия и кодирования изображений и др.

Однако ни одну из таких систем нельзя назвать полностью универсальной и обеспечивающей весь необходимый функционал по эффективной обработке изображений, включая задачи поиска, визуализации и распознавания изображений с высокими характеристиками, прежде всего быстродействием и качеством обработки.

Существует ряд проблем, одна из основных состоит в том, что задача построения оптимальной функции преобразования для любого изображения, подлежащего обработке, с учетом способа его воспроизведения в общем случае не решена, её лучше конкретизировать и связать с определёнными выводными устройствами. Разнообразие устройств визуализации требуют разработки эффективных методов и алгоритмов визуализации изображений (ВИ). 1С методам ВИ предъявляются специфические требования: с одной стороны - улучшение качества воспроизведения изображений, с другой стороны- высокая скорость обработки изображений. Ряд устройств визуализации воспроизводят меньшее ко-

личество цветовых оттенков, нежели само изображение. В связи с этим возникает задача имитации недостающих оттенков цветов при формировании выходной информации. Необходимо осуществить преобразование многоуровневого изображения в такое, число оттенков которого соответствует числу оттенков устройства визуализации.

В связи с вышесказанным требуется разработать методы, корректирующие погрешности визуализации, и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Разрабатываемые методы должны осуществлять визуализацию изображений на различных устройствах с качеством и временем визуализации более высоким, чем дают известные методы.

С распространением Internet наблюдается тенденция к накоплению информации, представленной в виде изображений, и к созданию графических баз знаний изобраясений. При этом проблемы эффективного поиска изображений до сих пор полностью не решены. Необходима разработка методов, обеспечивающих высокие показатели быстродействия, точности и полноты поиска изображений.

Таким образом, актуальными являются исследования, направленные на разработку методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.

Цель работы. Целью диссертационного исследования является разработка методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, обеспечивающих повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. Указанная цель достигается созданием методик и алгоритмов управления яркостью изображений; методик компенсации искажений при визуализации изображений; средств для сглаживания границ локальных областей изображений и снижения краевых эффектов; методик эффективного поиска изображений; имитационных моделей автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний. •

Задачи исследования. В соответствии с указанной целью в работе решаются следующие задачи:

® анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изобралсений;

• разработка методики и алгоритма локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений;

• создание методики компенсации искажений при визуализации изображений;

• разработка средств для сглаживания границ локальных областей изображений;

• создание алгоритмов визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;

• имитационное моделирование, программная реализация и экспериментальное исследование эффективности предложенных методик и алгоритмов.

Методы исследования. В диссертационной работе использованы методы системного анализа, теории информационных систем, методы математического и имитационного моделирования, модели и методы теории распознавания образов, теории цифровой обработки сигналов.

Научная новизна работы состоит в создании новых методик и алгоритмов , обеспечивающих автоматизацию технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. При этом получены следующие научные результаты.

1. На основе локальных гистограммных преобразований разработан алгоритм управления уровнем яркости при визуализации изображений, обеспечивающий снижение вычислительных затрат и сохранение ярко-стного баланса визуализированного изображения с высокой точностью.

2. Предложены методика компенсации искажений при визуализации изображений на терминальных устройствах вывода, алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений, снижающих краевые эффекты.

3. Созданы алгоритмы автоматизированной визуализации изображений для полутоновых и цветных изображений с полной й ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при визуализации изображений с большим количеством мелких деталей, а также когда разница между глубиной цветов входных и выходных изображений велика.

4. Разработана модель многомодульной графической базы знаний с динамически конфигурируемой структурой, основанной на вероятности обращения как к отдельным модулям, так и содержащимся в них медиадокументах и изображений.

5. Разработан программный комплекс, созданы и верифицированы имитационные модели для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.

Практическая значимость работы заключается в повышении эффективности средств автоматизированной обработки, визуализации и поиска изображений в графических базах знаний. Гибкость предложенных решений делает возможным их применение в системах технического зрения, системах контроля качества продукции приборостроения, системах распознавания образов, системах компрессии подвижных и неподвижных изображений, системах управления и поиска изображений в мультимедийных и графических базах знаний.

Предложена и программно реализована система автоматизации технологических процессов обработай, визуализации и поиска изображений в графических базах знаний. Система обеспечивает возможность: видоизменения гистограмм полутоновых и цветных изображений, нахождения изображения, отвечающего определенным критериям, навигации по категориям изображений; формирования визуального запроса с полным или частичным перечнем всех возможных свойств; накопления и выдачи оценок результатов поиска.

Создана структура базы знаний для подготовки и обработки минии-зображений в среде Linux. Для снижения вычислительных затрат и простоты наращиваемости системы поиска изображений все признаки, используемые при вычислении меры релевантности, определяются только на основе сохраненных в БЗ миниизображений. Получена и экспериментально обоснована рациональная с точки зрения быстродействия и качества визуализации структура фильтра для рассеяния ошибок визуализации.

Результаты экспериментальных исследований предложенных в работе средств автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний показали, что обеспечивается снижение средней относительной погрешности визуализации изображений в 2 раза, повышение быстродействия поиска изображений на 11,6'%, точности поиска на 2,7 %, при снижении коэффи-

циента полноты поиска всего на 0,8 % по сравнению с традиционными методами.

Достоверность определяется корректным применением строго математического аппарата и подтверждается результатами имитационного моделирования, доказавшими преимущества предложенных в работе методик и алгоритмов, выразившимися в повышении качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышении быстродействия и точности поиска изображений без заметного снижения полноты поиска.

Личный вклад автора. Все основные результаты получены автором лично. Главными из них являются:

• разработка алгоритма управления уровнем яркости при визуализации изображений;

• создание методики компенсации искажений при автоматизированной визуализации изображений на терминальных устройствах вывода;

• разработка алгоритма выявления перепадов контуров в локальных областях изображений и совокупности функций для сглаживания границ локальных областей изображений;

<* создание алгоритмов автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;

• разработка модели многомодульной графической базы знаний с динамически конфигурируемой структурой;

• разработка программного комплекса и имитационных моделей для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний;

• внедрение результатов диссертационной работы в учебный процесс кафедры МИЭТ.

Внедрение результатов работы. Все работы по реализации и внедрению проводились под руководством или при непосредственном участии автора. Результаты диссертационной работы используются в учебном процессе Московского государственного института электронной техники (технический университет). На защиту выносятся:

• алгоритм управления уровнем яркости при визуализации изображений;

• методика компенсации искажений при визуализации изображений на

терминальных устройствах вывода;

• алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений;

• алгоритмы визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов;

• модель многомодульной графической базы знаний с динамически конфигурируемой структурой;

. • программный комплекс для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний;

• результаты экспериментальных исследований эффективности предложенных методик и алгоритмов;

• результаты внедрения и апробации материалов диссертационной работы.

Апробация работы. Основные положения и результаты диссертационной работы были доложены на Всероссийских межвузовских научно-технических конференциях "Микроэлектроника и информатика" (Москва, Зеленоград, МИЭТ, 2007- 2009 г.г.), Научной сессии'МИФИ (Москва, МИФИ, 2008-2009 г.г.), Всероссийской межвузовской научно-практической конференции "Актуальные проблемы информатизации. Развитие информационной инфраструктуры, технологий и систем" (Москва, Зеленоград, МИЭТ, 2007-2008 г.), Всероссийской межвузовской научно-практической конференции «Актуальные проблемы информатизации в науке, образовании и экономике» (Москва, Зеленоград, МИЭТ, 2009 г.)

Публикации. Основное содержание диссертации отражено в 17 опубликованных работах, в том числе 2 статьи в ведущих научных журналах, утвержденных ВАК. Без соавторов опубликовано 10 работ.

Структура и объем работы. Диссертация состоит из введения,, четырех глав, заключения, списка литературы и приложений. Работа содержит 145 страниц основного текста, включая 32 рисунка, 5 таблиц, а также список литературы из 109 наименований и 2 приложения.

Содержание работы Во введении обосновывается актуальность темы диссертации, формулируются общие проблемы, цели и задачи исследования, научное и практическое значение полученных результатов, рассматривается структура диссертации и взаимосвязь отдельных глав.

В первой главе представлен анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изображений. Проведенный обзор существующих методов обработки и визуализации изображений показал, что при обработке изображений, содержание которых существенно различается по своим характеристикам на различных участках целесообразно применить локальные гисто-граммные преобразования, а также необходимо разработать методы, корректирующие погрешности визуализации и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Определены основные требования к автоматизированным системам поиска изображений, а именно, высокая скорость индексирования и вычисления меры релевантности изображения эталону; простота модификации системы поиска; учет особенностей психовизуального восприятия человека. Сформулирована цель диссертационной работы, состоящая в создании эффективных методов и средств для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.

Во второй главе разработаны методики и алгоритмы обработки и визуализации изображений на основе локальных гистограммных преобразований.

Известные методы гистограммных преобразований (сглаживающие, выравнивающие, с понижением количества уровней яркости) не позволяют достичь качественной ВИ в соответствии с современным уровнем развития техники, в связи с чем в диссертации предложен алгоритм локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений (рис.1). Алгоритм основан на сравнении исходной гистограммы с результирующей в процессе ее построения, что ведет к сокращению объема вычислений и обеспечивает сохранение яр-костного баланса с высокой точностью

п т

= (О

п=0 т=О

где Н" и Н™ - значения исходной и построенной гистограмм в точках п и т, соответствующих определенному уровшо яркости п е [0, 255].

Особенностью методов визуализации изображений на печатающих устройствах является то, что они дают искажения в связи с растаскиванием точек при печати или с растеканием краски и перекрытием точек.

Рисунок 1- Алгоритм управления уровнем яркости при визуализации изображений

В результате площадь, занимаемая черными или цветными точками, увеличивается, соответственно, белыми - уменьшается. Для снижения эффекта растаскивания точек в работе предложена методика компенсации искажений при визуализации изображений на терминальных печатающих устройствах. Составим систему параметрических управлений, определяющих функции яркости исходного I и визуализированного ■ изображения 1вш:

\1 = ХГ+^+а

\1вЬ1Х=Г12+& + з'

(2)

Поскольку для белых точек изображения: 1(0)- 0, 1вых(0) = 0, для черных: 7(1) = 1, 1еых( 1) = 1 то а=0, 3=0, /?+;г = 1, г + <9 = 1 .

Решая систему уравнений (2) и полагая

=У(0) для белых вход-

ных точек,

(¡1

IГ.

=У(1) для чёрных входных точек, получаем значения

остальных коэффициентов:

27(0)(1-Г(1))

Р =

7(0)-7(1) г _ (27(0)7(1) -7(0) -7(1))

7(0)-7(1) 2(1-7(1))

(?((})"+?(?)-2) 7(0)-7(1) Решая систему уравнений (3), имеем: 2

^вых

11 2Х2

■+

22

/ +—

X

X X у

X ?-Х 2/

(3)

(4)

Построенная передаточная функция (4) может быть использована для вывода изображений с нерегулярной растровой структурой на терминальные печатающие устройства с возможным эффектом растаскивания точек при визуализации (справедливо для лазерных, струйных, матричных принтеров).

При проведении преобразований в локальной области изображения образуется область, в которой визуально будут видны разрывы, соответствующие первой производной распределения интенсивности, это так называемый эффект полос Маха. Он заключается в том, что глаз усиливает зрительный эффект в местах разрыва первой производной распределения интенсивности и значение перепада интенсивности увеличивается. Для устранения этого эффекта необходимо построить функцию локального преобразования накладываемую на основное преобразование области окна локального преобразования, такую, что в центре локальной области она максимальна, на границе области равна 0.

В диссертации предложен алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений и снижения краевых эффектов. Для изображений, характер которых заранее неизвестен, эффективным является использование функции, представленной на рис.2 и соответствующей формуле (5).

] > X

-а а

Рисунок 2- Графическая интерпретация функции для сглаживания границ локальных областей

б(х + а)2

,х е

-8а-^28-8гаг 28

1~8х2,х е

-8а-^28-82аг 8а+^28-8гаг

28

28

8 [х-а)1 ,хе

8а+^28-82а2

28

-\а

(5)

0,х&[-а;а]

Устройства вывода изображений различаются по количеству воспроизводимых оттенков яркости или цветов. Они обычно позволяют воспро-

изводить количество оттенков цветов заведомо меньшее, чем у обрабатываемого изображения. Поэтому было необходимо разработать методики и алгоритмы, позволяющие адекватно преобразовывать изображения для вывода их на устройства с различным разрешением и глубиной цвета.

В диссертации созданы алгоритмы визуализации изображений' для полутоновых и цветных изображений с полной и. ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при визуализации изображений с большим количеством мелких деталей.

На рисунке 3 представлен алгоритм визуализации цветных изображений. Значения пиксела входного изображения сравниваются с пороговыми значениями, зависящими от количества цветов <2 в палитре выходного изображения. Выбирается ближайшее пороговое значение:

и вычисляется ошибка:

(?)

равная величине отклонения от ближайшего порога.

Выбранное пороговое значение является очередным пикселем выходного изображения и записывается в соответствующий файл формируемого выходного цветоделённого изображения. Значение ошибки Е рассеивается по соседним, ещё не обработанным, точкам входного изображения со значениями весов, определяемыми фильтром Р(п). Чтобы ошибка не усиливалась, значения весов фильтра Р(п) должны быть постоянны и в сумме давать 1. В результате обеспечивается неизменность фадационного содержания изображения. Г (п) - маска рассеивания имеет следующий вид (Рис.4): самый тёмный - обрабатываемый пиксел, немного светлее - пиксели, на которые распределяется ошибка с наибольшими коэффициентами, следующий уровень светлоты - коэффициенты меньше, очередной уровень - коэффициенты ещё меньше и т.д. Пиксели, помеченные пунктиром, в данном цикле обработки не участвуют. Группа разработанных алгоритмов визуализации наиболее эффективна при воспроизведении изображений на устройствах, имеющих ограниченную палитру цветов, высокий эффект достигается для презентаций с большим количеством графики, когда необходимо увеличивать скорость воспроизведения на экране и уменьшать объём презентации.

С начало

ввод изображения

Нормирование изображения в RGB координатах

Цветоделение цветного изображения. Получаем три полутоновых изображения с функциями яркости 7,- (пс, т{), 1=1-3, п„т, е [0,255]

Выбор маски для очередной цветовой составляющей

Вычисление пороговых значений Рк), Ь=<2-1, где <2 - количество цветов в палитре выходного изображения.

Выбор очередного пиксела изображения Pw

Выбирается ближайшее пороговое значение

* ♦ ^ (\ * 1\ 1*1 PWJ-: PWJ- -Рц = min ILPwj - Pkj ). Вычисляется ошибка E= \Pwj - Pц

I

Выбранное пороговое значение является очередным пикселем вы_ходного изображения_

Значение ошибки Е рассеивается по соседним, ещё не обработанным. точкам входного изображения со значениями весов, определяемыми фильтром F(n).

Сведение слоев цветоделённого изображения и вывод на экран

конецJ

Рисунок 3- Схема алгоритма автоматизированной визуализации цветных изображений

о о о о о о © © о

ОС)! @©оо@о

о о-. _ : : : :ю

оооооооо ооооооооо

Рисунок 4- Схема рассеяния ошибки по соседним пикселям.

Разработанные алгоритмы позволяют имитировать с помощью ограниченного количества оттенков цветов, соответствующих устройству, более обширную палитру. При этом размер изображения гораздо меньше размера полноцветного изображения, а чёткость воспроизведения даже мелких деталей высока, следовательно, не теряется информативность изображения.

В третьей главе разработаны структуры графической базы знаний, методики представления и поиска изображений в ней.

Современные тенденции развития интеллектуальных информационных систем делают необходимым представление графических баз знаний в виде многомодульных реконфигурируемых структур, ориентированных на информационные потребности различных групп пользователей. Одним из путей решения данной проблемы является математическое моделирование динамической структуры базы знаний на основе теории графов, использующей вероятностные характеристики.

Графовая модель БЗ строится следующим образом. Вершинам графа соответствуют информационные массивы (блоки знаний). Связи между информационными массивами отображаются ду гами графа. Связи представляют собой ссылки на информацию, к которой возможно обращение. Вершинам графа поставлены в соответствие вероятностные характеристики. Для информационных систем это означает вероятности обращения к конкретным изображениям.

Графически вероятностная структура графовой модели БЗ представлена на рис.5. По диагонали матрицы расположены вероятности обращения к вершинам графовой модели (модулям базы знаний), например: Ри - вероятность обращения к вершине V,- . Недиагональные элементы

отражают вероятности перехода из одной вершины в другую, например: Рщ} - вероятность перехода из вершины V] в вершину , т.е. вероятность последовательного просмотра изображений V] —>

П

vn

<1'2

к

у'1-'к

П

vn vhb

V-

Ч-'к

Р\\ Р\и Л/,

Ри.

П11

РЬ¡¿2

Р1Ы fc+1

рч~'к

J'1

р ■

чч рщ

Р\ 11

PW

Р\

п ц

1111

>1'2

р... JV2

Piri. Pt.i.i.

Pnv2

1...1, т+г

PJUA

A+l /fc+2

A'1'2 ^ 4'2

l+T^ *+2

fc+2

fc+2

2k

р.. . J'l-'k

'l'l-'fc ■^l'i'i-'fc

'V-'i'-l

2k

Р'1-'к>l-'i'

Рисунок 5- Вероятностная структура графовой модели БЗ В модели: vt ... %- вершины первого уровня иерархии; vn...vijj2 -вершины второго уровня иерархии; Vj j.-.v^ ¡к — вершины к-го уровня

иерархии; in - количество вершин л-го уровня иерархии.

Методика представления и поиска изображений в графической базе знаний основана на следующих положениях: выполняется вейвлет-преобразование для каждого цветового канала изображения; создаются миниизображения для быстрого воспроизведения на терминале с целью просмотра и выбора нужных изображений; ведется поиск по миниизоб-ражениям и сравнение с изображением, полученным с цифрующего устройства, для идентификации с объектами из базы знаний.

По умолчанию при добавлении нового изображения в базу знаний оно масштабируется до размера 128 х 128 пикселей. Такой размер выбран в качестве оптимального, при котором происходят небольшие потери данных и преобразование в вейвлет-коэффициенты займет не

слишком много времени. Из полученного массива коэффициентов сохраняются только 60 максимальных коэффициентов для каждого цветового канала, необходимых для оптимального запроса изображения. Для большего количества коэффициентов поиск в БЗ будет осуществляться очень долго. В то же время если коэффициентов взять меньше, то точность поиска окажется слишком низкой.

Для того чтобы уменьшить время работы алгоритма поиска, был выбран принцип, при котором происходит разбиение пространства индексов на подмножества. Разбиение осуществляется таким образом, что близкие вектора попадают в одно подмножество. Следовательно, похожие между собой изображения попадают в один класс.

В четвертой главе представлены программная реализация и результаты экспериментальных исследований эффективности средств автоматизации технологических процессов обработки, визуализации и поиска изображений.

На основе предложенных в работе моделей, методик и алгоритмов создан программный комплекс автоматизированной обработки, визуализации и поиска изображений, представленный на рис.6.

Комплекс обеспечивает возможность: видоизменения гистограмм полутоновых и цветных изображений, нахождения изображения, отвечающего определенным критериям, навигации по категориям изображений; формирования визуального запроса с полным или частичным перечнем всех возможных свойств; накопления и выдачи оценок результатов поиска.

В работе были проведены экспериментальные исследования по оценке эффективности визуализации изображений с использованием денситометрических и фотометрических приборов. Они состояли в следующем. Случайным образом выбирались элементарные площади изображений, одинаковые для исходного и визуализированного изображений, и измерялись оптические плотности или яркости на выбранных площадях, далее считалась функция передачи изображений.

В ходе эксперимента сравнивались яркости исходного (Р1) и визуализированного изображений (Р2).

На рис.7 представлены функции передачи изображений при визуализации на устройства ВИ: тоновой клин; визуализированное изображение с использованием предложенных в работе методик; произвольное изображение с использованием стандартных технологий.

Рисунок 6- Обобщенная схема программного комплекса автоматизированной обработки, визуализации и поиска изображений

Р2

250

200 -150 100 50

Ж

X

208

219

231

Рисунок 7- Функции передачи изображений при визуализации

Анализ данных, представленных на рисунке 7, а также проведенные расчеты, позволили сделать следующие выводы: средняя относительная погрешность визуализации изображения с использованием предложенных в работе методик составляет 4,3%; средняя относительная погрешность визуализации изображения с использованием традиционных методик составляет 8,9%. Таким образом, результаты экспериментальных исследований показали высокую эффективность визуализации изображений с использованием предложенных в работе подходов, а именно, средняя относительная погрешность визуализации изображения с использованием предложенных в работе методик в 2 раза ниже, чем для стандартных способов визуализации.

Для визуальной оценки эффективности предложенной методики на рис. 8 представлены примеры изображений: а) исходное изображение; б) визуализированное изображение по стандартной методике; в) визуализированное изображение по предложенной методике. Прямоугольником выделены проблемные места изображений. Как видно из рис. 8 предложенная методика обеспечивает более высокое качество визуализации изображений.

Рисунок 8- Примеры визуализации изображений

С целью проверки эффективности применения разработанных выше методик, моделей и алгоритмов, а также анализа получаемых с использованием предложенных методов поиска результатов и сравнения этих результатов с аналогами, было проведено имитационное моделирование. Для исследования была выбрана база знаний , содержащая 200 медиадокументов, включающих 3500 экземпляров разнородных цветных изображений.

Общий объем базы знаний составляет порядка 1700 Мб. Размер медиадокументов колеблется от 100 кб до 2 Мб.

Дм моделирования использовался персональный компьютер с процессором Intel Pentium IV 3,4 ГТц, 2 Гб RAM, ОС Windows ХР.

В зависимости от размера БЗ , то есть количества содержащихся в ней изображений, были проведены испытания эффективности поиска информации для смоделированной и традиционной систем поиска изображений (СПИ) и оценены коэффициенты полноты и точности для каждой из систем. Критерием подобия каждого найденного изобраясенйя образцу являлось мнение экспертов, обладающих полной информацией о предметной области поиска.

Коэффициенты эффективности поиска рассчитывались по следующим формулам.

Коэффициент полноты поиска: N

(8)

N

"экс

где N„ - количество подобных изображений, найденных смоделированной СПИ; N3KC - экспертное количество подобных изображений.

Коэффициент точности поиска смоделированной ИПС: N

(9)

Побщ

где Nof>4 - общее количество документов, найденных смоделированной СПИ.

Результаты экспериментальных исследований эффективности поиска смоделированной и традиционной СПИ представлены на рис.9 и 10.

Анализ рассчитанных на основе экспериментальных данных критериев эффективности, отраженных на рисунках 9 и 10, показывает, что смоделированная СПИ обеспечивает повышение коэффициента точности поиска в среднем на 2,7 % при снижении коэффициента полноты всего на 0,8 % по сравнению с традиционной. Необходимо подчеркнуть, что эффективность смоделированной на основе предложенных в

работе методик, моделей и алгоритмов СПИ возрастает по мере увеличения объема поискового пространства.

Другим важным критерием эффективности систем поиска изображений является и показатель быстродействия, то есть среднее время поиска одного изображения в БЗ. Эта проблема особенно актуальна для многомодульных иерархических баз знаний, содержащих значительное количество различных типов изображений.

Рисунок 9- Графическая зависимость коэффициента полноты поиска от количества медиадокументов в базе знаний

■ смоделированная СПИ "^^»традиционная СПИ

Рисунок 10- Графическая зависимость коэффициента точности поиска от количества медиадокументов в базе знаний.

С целью подтверждения высокой эффективности предложенных решений было проведено экспериментальное исследование быстродействия поиска информации для смоделированной и традиционной СПИ.

Критерием эффективности поиска является коэффициент быстродействия К3, определяемый по следующей формуле:

= (10) Ч

где t] - среднее время поиска одного подобного изображения смоделированной СПИ, [мс]; - среднее время поиска одного подобного изображения традиционной СПИ, [мс]. На рис. 11 представлена графическая зависимость коэффициента быстродействия поиска изображений в БЗ.

■ 1 'смоделированная СПИ "^""традиционная СПИ

Рисунок 11- Графическая зависимость коэффициента быстродействия поиска изображений

Анализ результатов экспериментальных исследований показал, что за счет предложенных в работе подходов обеспечивается повышение быстродействия поиска изображений в БЗ в среднем на 11,6 %, причем эффективность смоделированной СПИ растет с увеличением количества медиадокументов в БЗ.

В заключении приведены основные теоретические и практические результаты, полученные в ходе выполнения диссертационной работы .

В приложениях приведены копии акта внедрения результатов диссертационного исследования и фрагмент программной реализации методик визуализации изображений.

Основные результаты работы 1. Разработаны методика и алгоритм локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений,

обеспечивающий снижение вычислительных затрат и сохранение ярко-стного баланса визуализированного изображения с высокой точностью.

2. Предложена и программно реализована методика учета искажений при визуализации изображений на терминальных устройствах с учетом эффекта растаскивания точек. Практически обоснована эффективность применения методики для растровых структур регулярного и нерегулярного характера.

3. Предложены алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений и снижения краевых эффектов.

4. Созданы алгоритмы визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при визуализации изображений с большим количеством мелких деталей.

5. Разработана модель многомодульной графической базы знаний с динамически конфигурируемой структурой, основанной на вероятности обращения как к отдельным модулям, так и содержащимся в них медиа-документах и изображений.

6. Предложена и программно реализована система автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах. Разработана методика поиска изображений, основанная на вейвлетном преобразовании изображений и индексировании поискового пространства.

7. Созданы и верифицированы имитационные модели автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний. В ходе экспериментального исследования показаны преимущества их использования, определяющиеся снижением средней относительной погрешности визуализации изображений в 2 раза, повышением быстродействия поиска изображений на 11,6 %, точности поиска на 2,7 %, при снижении коэффициента полноты поиска всего на 0,8 % по сравнению с традиционными методами.

8. Результаты диссертационной работы внедрены в учебный процесс кафедры ИПОВС Московского государственного института электронной техники.

Результаты диссертации опубликованы в следующих основных работах 1. Морозова Н.В., Смирнов A.B., Чжи Я Аунг. Коррекция изображения при выводе на печатающее устройство //Известия вузов. Элек-троника.-М.:МИЭТ.-№1,20Ю.-С.90-92.

2. Портнов Е.М., Чжи Я Аунг. Использование метода цветовых гистограмм для получения полутоновых изображений. // "Естественные и технические науки". ISSN 1684-2626, № 6(38), 2008. -С. 251-252.

3. Чжи Я Аунг. Гистограммные преобразования в локальных областях неравномерно освещенных изображений. // Микроэлектроника и информатика - 2008. 15-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. -М.:МИЭТ, 2008 г.-С. 217.

4. Чжи Я Аунг. Алгоритм гистограммных преобразований в локальных областях яркостей изображений. // "Аспирант и соискатель". ISSN 1608-9014, №2(50), 2009.-С. 88-91.

5. Чжи Я Аунг. К вопросу управления яркостью изображений на основе гистограммных преобразований. // Актуальные проблемы информатизации в науке, образовании и экономике. 3-я Всероссийская межвузовская научно-практическая конференция: Материалы конференции. - М.: МИЭТ, 2009.

6. Чжи Я Аунг. Метод учета искажений при визуализации полутоновых и цветных изображений. //" Актуальные проблемы современной науки". ISSN 1680-2721, №6,2009. -С.202-204.

7. Чжи Я Аунг. Автоматизация процесса визуализации и рассеяния ошибок при обработке цветных изображений//"Научное обозрение", №1,2010.

8. Морозова Н.В., Чжи Я Аунг. Обработка цветных изображений для устройств с ограниченным количеством тонов. // Актуальные проблемы информатизации. Развитие информационной инфраструктуры, технологий и систем - 2007. Всероссийская межвузовская научно-практическая конференция: Материалы конференции. - М.: МИЭТ, 2007.-С. 174.

9. Морозова Н.В., Чжи Я Аунг. Алгоритм обработки изображений с использованием гистограммы в локальных областях яркостей. // Актуальные проблемы информатизации. Развитие информационной инфраструктуры, технологий и систем - 2008. 2-ая Всероссийская межвузовская научно-практическая конференция: Материалы конференции. - М.: МИЭТ, 2008.-С. 153.

10. Со Тант, Чжи Я Аунг. Моделирование системы базы знаний с большим количеством видеоинфомации. // Микроэлектроника и информатика - 2007. 14-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. - М.: МИЭТ, 2007. -С. 219.

11. Чжи Я Аунг. Методика автоматизированного поиска изображений в базе знаний графических образов// "Актуальные проблемы современной науки", №2,2010.

12. Со Тант, Чжи Я Аунг. Подготовка изображений для графических баз знаний. // НАУЧНАЯ СЕССИЯ МИФИ-2008. XI Московская международная телекоммуникационная конференция студентов и молодых ученых «МОЛОДЕЖЬ И НАУКА»: Тезисы докладов. - М.: МИФИ,

2008.-С. 87.

13. Чжи Я Аунг. Обработка мини-изображений на основе контурного выделения информационно-значимых объектов. // Микроэлектроника и информатика - 2008. 15-я Всероссийская межвузовская научно-техническая конференция студентов и аспирантов: Тезисы докладов. -М.: МИЭТ, 2008 г. -С. 166.

14. Чжи Я Аунг. Построение баз знаний изображений, созданных с использованием миниатюр, отображающих информационные составляющие изображений. // НАУЧНАЯ СЕССИЯ МИФИ-2009. Аннотации докладов. М.: МИФИ, 2009. -С. 143.

15. Чжи Я Аунг. Программный комплекс автоматизированной обработки изображений на основе гистограммных преобразований. // "Аспирант и соискатель". ISSN 1608-9014, №6,2009.-С.102-103.

16. Чжи Я Аунг. Основные подходы к созданию баз знаний графических образов. // "Аспирант и соискатель". ISSN 1608-9014, №5(53),

2009. -С.125-127.

17.Баин A.M., Портнов Е.М., Чжи Я Аунг .Разработка иерархической многомодульной базы знаний с динамически управляемой струк-турой//«Оборонный комплекс - научно-техническому прогрессу Рос-сии».-М.: ВИМИ, 2009,- №4. -С.78-80.

Подписано в печать:

Заказ №_. Тираж_экз . Уч.-изд.л._

Формат 60x84 1/16. Отпечатано в типографии МИЭТ. 124498, Москва, Зеленоград, проезд 4806, д.5, МИЭТ.

Оглавление автор диссертации — кандидата технических наук Чжи Я Аунг

Введение

Глава 1. Анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изображений

1.1 Анализ основных проблем автоматизированной обработки изображений

1.2 Обзор существующих методов обработки и визуализации изображений

1.3 Особенности автоматизированных систем визуализации изображений

1.4 Основные цветовые модели изображений

1.5 Проблемы автоматизированного поиска и анализа изображений

1.6 Постановка целей и задач исследования 46 Выводы по главе

Глава 2. Разработка методик и алгоритмов обработки и визуализации изображений на основе локальных гистограммных преобразований

2.1 Алгоритм гистограммных преобразований в локальных областях яркостей изображений

2.2 Разработка алгоритмов управления яркостью изображений на основе гистограммных преобразований

2.3 Создание методики компенсации искажений при визуализации полутоновых и цветных изображений 58 2.4. Методики и алгоритмы построения граничных функций локальных преобразований изображений

2.4.1. Методика построения функций для сглаживания границ локальных областей

2.4.2. Алгоритм выявления перепадов контуров в локальных областях изображений

2.5. Разработка алгоритмов рассеяния ошибок при автоматизированной визуализации изображений

2.5.1 Проблема рассеяния ошибок при автоматизированной визуализации изображений

2.5.2 Алгоритм рассеяния ошибок при обработке полутоновых изображений

2.5.3 Алгоритм визуализации и рассеяния ошибок при обработке цветных изображений

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Чжи Я Аунг

Актуальность работы.

Автоматизация технологических процессов обработки изображений является одной из центральных и практически важных задач в приборостроении и других отраслях промышленности. Проблема носит комплексный характер и включает ряд основных этапов: восприятие поля зрения, сегментация, нормализация выделенных объектов, распознавание, визуализация и поиск изображений. Для решения возникающих при этом задач необходимо с одной стороны дальнейшее улучшение параметров систем обработки изображения (чувствительности, разрешающей способности и т.д.), с другой стороны - совершенствование методов обработки, визуализации и поиска изображений.

Все это в совокупности определяет необходимость создания эффективных методов и систем автоматизации технологических процессов обработки, визуализации и поиска изображений.

Результаты исследований, направленных на создание эффективных методов визуализации и обработки изображений, изложены в работах зарубежных и отечественных ученых: W.K.Pratt [1,2], R. Jain, [30-32], R.W Floyd [48], J.M.S. Prewitt [16], J.F. Jarvis [57,58] , B.E. Bayer, T Pavlidis [108], В.Ф.Нестерук, И.А.Богуславского [8], A. Rosenfeld [14], В.А.Сойфера [5], Л.ПЛрославского [3,7], Ю.И. Журавлева [4].

Задача автоматизированной обработки изображений продолжает оставаться крайне актуальной на протяжении последних десятилетий. Несмотря на неослабевающий интерес исследователей и большое количество работ в данной области есть еще много открытых вопросов и нерешенных задач. В настоящее время существует и активно развивается целая отрасль автоматизированных систем, предназначенных для поиска, обработки и визуализации изображений: в частности системы распознавания образов, системы визуализации изображений, информационно-поисковые системы, системы сжатия и кодирования изображений и др.

Однако ни одну из таких систем нельзя назвать полностью универсальной и обеспечивающей весь необходимый функционал по эффективной обработке изображений, включая задачи поиска, визуализации и распознавания изображений с высокими характеристиками, прежде всего быстродействием и качеством обработки.

Существует ряд проблем, одна из основных состоит в том, что задача построения оптимальной функции преобразования для любого изображения, подлежащего обработке, с учетом способа его воспроизведения в общем случае не решена, её лучше конкретизировать и связать с определёнными выводными устройствами. Разнообразие устройств визуализации требуют разработки эффективных методов и алгоритмов визуализации изображений (ВИ). К методам ВИ предъявляются специфические требования: с одной стороны - улучшение качества воспроизведения изображений, с другой стороны- высокая скорость обработки изображений. Ряд устройства визуализации воспроизводят меньшее количество цветовых оттенков, нежели само изображение. В связи с этим возникает задача имитации недостающих оттенков цветов при формировании выходной информации. Необходимо осуществить преобразование многоуровневого изображения в такое, число оттенков которого соответствует числу оттенков устройства визуализации.

В связи с вышесказанным требуется разработать методы, корректирующие погрешности визуализации и учесть факторы, зависящие от техники и от характера воспроизводимых изображений. Разрабатываемые методы должны осуществлять визуализацию изображений на различных терминальных устройствах с качеством и временем визуализации более высоким, чем дают известные методы.

Другая проблема состоит в том, что разработка новых технических средств, позволяющих представлять информацию в виде изображений, привела к тому, что работа с графическими данными оказалась в центре внимания многих исследователей. С распространением Internet наблюдается тенденция к накоплению информации, представленной в виде изображений, и к созданию графиче6 ских баз знаний изображений. При этом проблемы эффективного поиска изображений до сих пор полностью не решены. Необходима разработка методов, обеспечивающих высокие показатели быстродействия, точности и полноты поиска изображений.

Таким образом, актуальными являются исследования, направленные на разработку методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний .

Цель работы. Целью диссертационного исследования является разработка, методик и алгоритмов для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, обеспечивающих повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. Указанная цель достигается созданием методик и алгоритмов управления яркостью изображений; методик компенсации искажений при визуализации изображений; средств для сглаживания границ локальных областей изображений и снижения краевых эффектов; методик эффективного поиска изображений, имитационных моделей автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний.

Задачи исследования. В соответствии с указанной целью в работе решаются следующие задачи: анализ современного состояния методов и средств автоматизированной обработки, визуализации и поиска изображений; разработка методики и алгоритма локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений; создание методики компенсации искажений при визуализации изображений; разработка алгоритма выявления перепадов контуров в локальных областях изображений; создание алгоритмов визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов; имитационное моделирование, программная реализация и экспериментальное исследование эффективности предложенных методик и алгоритмов.

Методы исследования. В диссертационной работе использованы методы системного анализа, теории информационных систем, методы математического и имитационного моделирования, модели и методы теории распознавания образов, теории цифровой обработки сигналов.

Научная новизна работы состоит в создании новых методик и алгоритмов , обеспечивающих автоматизацию технологических процессов обработки, визуализации и поиска изображений в графических базах знаний, повышение качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышение быстродействия и точности поиска изображений без заметного снижения полноты поиска. При этом получены следующие научные результаты.

1. На основе локальных гистограммных преобразований разработан алгоритм управления уровнем яркости при визуализации изображений, обеспечивающий снижение вычислительных затрат и сохранение яркостного баланса визуализированного изображения с высокой точностью.

2. Предложены методика компенсации искажений при визуализации изображений на терминальных устройствах вывода, алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений, снижающих краевые эффекты.

3. Созданы алгоритмы автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при ви8 зуализации изображений с большим количеством мелких деталей, а также когда разница между глубиной цветов входных и выходных изображений велика.

4. Разработана модель многомодульной графической базы знаний с динамически конфигурируемой структурой, основанной на вероятности обращения как к отдельным модулям, так и содержащимся в них медиадокументах и изображений.

5. Разработан программный комплекс, созданы и верифицированы имитационные модели для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний.

Практическая значимость работы заключается в повышении эффективности средств автоматизированной обработки, визуализации и поиска изображений в графических базах знаний. Гибкость предложенных решений делает возможным их применение системах технического зрения, системах контроля качества продукции приборостроения, системах распознавания образов, системах компрессии подвижных и неподвижных изображений, системах управления и поиска изображений в мультимедийных и графических базах знаний.

Предложена и программно реализована система автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний. Система обеспечивает возможность: видоизменения гистограмм полутоновых и цветных изображений, нахождения изображения, отвечающего определенным критериям, навигации по категориям изображений; формирования визуального запроса с полным или частичным перечнем всех возможных свойств; накопления и выдачи оценок результатов поиска.

Предложена и программно реализована структура базы знаний для подготовки и обработки миниизображений в среде Linux. Для снижения вычислительных затрат и простоты наращиваемости системы поиска изображений все признаки, используемые при вычислении меры релевантности, определяются только на основе сохраненных в БЗ миниизображений.

Результаты экспериментальных исследований предложенных в работе средств автоматизированной обработки, визуализации и поиска изображений 9 в многомодульных графических базах знаний показали, что обеспечивается снижение средней относительной погрешности визуализации изображений в 2 раза, повышение быстродействия поиска изображений на 11,6 %, точности поиска на 2,7 %, при снижении коэффициента полноты поиска всего на 0,8 % по сравнению с традиционными методами.

Достоверность определяется корректнььм применением строго математического аппарата и подтверждается результатами имитационного моделирования, доказавшими преимущества предложенных в работе методик и алгоритмов, выразившимися в повышении качества визуализации полутоновых и цветных изображений при их воспроизведении на устройствах с полной или ограниченной палитрой, повышении быстродействия и точности поиска изображений без заметного снижения полноты поиска.

Личный вклад автора. Все основные результаты получены автором лично. Главными из них являются: разработка алгоритма управления уровнем яркости при визуализации изображений; создание методики компенсации искажений при автоматизированной визуализации изображений на терминальных устройствах вывода; разработка алгоритма выявления перепадов контуров в локальных областях изображений и совокупности функций для сглаживания границ локальных областей изображений; создание алгоритмов автоматизированной визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов; разработка модели многомодульной графической базы знаний с динамически конфигурируемой струк гурой; разработка программного комплекса и имитационных моделей для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний; внедрение результатов диссертационной работы в учебный процесс

10 кафедры МИЭТ.

Внедрение результатов работы. Все работы по реализации и внедрению проводились под руководством или при непосредственном участии автора. Результаты диссертационной работы используются в учебном процессе кафедры ИПОВС Московского Государственного института электронной техники при чтении лекций по дисциплинам "Операционные системы, среды и оболочки", "Автоматизированные информационные системы", "Компьютерные технологии в науке и образовании".

На защиту выносятся: алгоритм управления уровнем яркости при визуализации изображений; методика компенсации искажений при визуализации изображений на терминальных устройствах вывода; алгоритм выявления перепадов контуров в локальных областях изображений; алгоритмы визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов; модель многомодульной графической базы знаний с динамически конфигурируемой структурой; программный комплекс для автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах знаний; результаты экспериментальных исследований эффективности предложенных методик и алгоритмов; результаты внедрения и апробации материалов диссертационной работы.

Апробация работы. Основные положения и результаты диссертационной работы были доложены на Всероссийских межвузовских научно-технических конференциях "Микроэлектроника и информатика" (Москва, Зеленоград, МИЭТ, 2007- 2009 г.г.), Научной сессии МИФИ (Москва, МИФИ, 2008-2009 г.г.), Всероссийской межвузовской научно-практической конференции "Актуальные проблемы информатизации. Развитие информационной инфраструкту

11 ры, технологий и систем" (Москва, Зеленоград, МИЭТ, 2007-2008 г.), Всероссийской межвузовской научно-практической конференции «Актуальные проблемы информатизации в науке, образовании и экономике» (Москва, Зеленоград, МИЭТ, 2009 г.)

Публикации. Основное содержание диссертации отражено в 17 опубликованных работах, в том числе 2 статьи в ведущих научных журналах, утвержденных ВАК. Без соавторов опубликовано 10 работ.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа содержит 145 страниц основного текста, включая 32 рисунка, 5 таблиц, а также список литературы из 109 наименований и 2 приложения.

Заключение диссертация на тему "Методики и алгоритмы автоматизации технологических процессов визуализации, обработки и поиска изображений в графических базах знаний"

Выводы по главе 4

1. Предложена и программно реализована система автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах. Система обеспечивает возможность: видоизменения гистограмм полутоновых и цветных изображений, нахождения изображения, отвечающего определенным критериям, навигации по категориям изображений; формирования визуального запроса с полным или частичным перечнем всех возможных свойств; накопления и выдачи оценок результатов поиска.

2. Созданы и верифицированы имитационные модели автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний на основе разработанных методик, моделей и алгоритмов.

3. Результаты экспериментальных исследований по оценке эффективности средств визуализации изображений показали, что средняя относительная погрешность визуализации изображения с использованием предложенных в работе методик в 2 раза ниже, чем для стандартных.

4. Получена и экспериментально обоснована рациональная с точки зрения быстродействия и качества визуализации структура фильтра для рассеяния ошибок визуализации.

5. Экспериментально установлено, что смоделированная на основе предложенных в работе методик, моделей и алгоритмов система обеспечивает в среднем повышение быстродействия поиска изображений на 11,6 %, точности поиска на 2,7 %, при снижении коэффициента полноты поиска всего на 0,8 % по сравнению с традиционной.

Заключение

1. Разработаны методика и алгоритм локальных гистограммных преобразований уровней яркости при обработке и визуализации изображений, обеспечивающий снижение вычислительных затрат и сохранение яркостного баланса визуализированного изображения с высокой точностью.

2. Предложена и программно реализована методика учета искажений при визуализации изображений на терминальных устройствах с учетом эффекта растаскивания точек. Практически обоснована эффективность применения методики для растровых структур регулярного и нерегулярного характера.

3. Предложены алгоритм выявления перепадов контуров в локальных областях изображений и совокупность функций для сглаживания границ локальных областей изображений и снижения краевых эффектов.

4. Созданы алгоритмы визуализации изображений для полутоновых и цветных изображений с полной и ограниченной палитрой цветов, обеспечивающие повышение эффективности воспроизведения при визуализации изображений с большим количеством мелких деталей. Получена и экспериментально обоснована рациональная с точки зрения быстродействия и качества визуализации структура фильтра для рассеяния ошибок визуализации.

5. Разработана модель многомодульной графической базы знаний с динамически конфигурируемой структурой, основанной на вероятности обращения как к отдельным модулям, так и содержащимся в них медиадокументах и изображений.

6. Предложена и программно реализована система автоматизации технологических процессов обработки, визуализации и поиска изображений в графических базах. Разработана методика поиска изображений, основанная на вейв-летном преобразовании изображений и индексировании поискового пространства.

7. Созданы и верифицированы имитационные модели автоматизированной обработки, визуализации и поиска изображений в многомодульных графических базах знаний. В ходе экспериментального исследования показаны пре

134 имущества их использования, определяющиеся снижением средней относительной погрешности визуализации изображений в 2 раза, повышением быстродействия поиска изображений на 11,6 %, точности поиска на 2,7 %, при снижении коэффициента полноты поиска всего на 0,8 % по сравнению с традиционными методами.

8. Результаты диссертационной работы внедрены в учебный процесс кафедры ИПОВС Московского государственного института электронной техники.

Библиография Чжи Я Аунг, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)

1. Прэтт У. Цифровая обработка изображений. Пер. с англ./ Под ред. Д.С. Лебедева. Кн. 1, М., 1982. 312 с.

2. Прэтт У. Цифровая обработка изображений. Пер. с англ./ Под ред. Д.С. Лебедева. Кн. 2, М., 1982. 480 с.

3. Ярославский Л.П. Введение в цифровую обработку изображений. М., 1979,- 312 с.

4. Воробель P.A., Журавель И.М. Повышение контраста изображений с помощью модифицированного метода кусочного растяжения // Отбор и обработка информации. -№ 14 (90). 2000. с. 116 - 121.

5. Методы компьютерной обработки изображений/Под ред. В.А.Сойфера.- М.: Физматлит, 2001,- 280с.

6. Бутаков Е.А., Островский В.И., Фадеев И.Л. Обработка изображений на ЭВМ. М.: Радио и связь,1987. 240 с.

7. Ярославский Л.11. Цифровая обработка сигналов в оптике и голографии: Введение в цифровую оптику М.: Радио и связь, 1987. - 296 с.

8. Богуславский И.А. Прикладные задачи фильтрации и управления. — М.: Наука, 1983. -400 с.

9. Горбунов Б.А., Дементьев В.Н., Пяткин В.П. Распознавание изображений в дистанционном зондировании //Автоматизированная обработка изображений природных комплексов Сибири. Новосибирск: Наука, 1988.

10. Левин Б.Р. Теоретические основы статистической радиотехники. Кн.1. -М.: Сов. радио, 1966.

11. Eliott D.F., Rao K.R. Fast transforms: algorithms, analyses, applications. -London: Academic Press inc., 1982. 488 p.

12. Грузман И.С., Киричук B.C. и др. Цифровая обработка изображений в информационных системах. Учебное пособие. Новосибирск, 2001 256 с.

13. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. — М: Машиностроение, 1990. — 320 с.

14. Rosenfeld А., Как A.C., Digital Picture Processing, Vols. 1, 2, Second Edition, Academic Press, New York, 1982.

15. Анисимов Б. В., «Распознавание и цифровая обработка изображений», М., Высшая школа, 1983.- 305с.

16. J. М. S. Prewitt, "Object Enhancement and Extraction," in Picture Processing and Psychopictorics, B. S. Lipkin and A. Rosenfeld, Eds., Academic Press, New York, 1970.

17. Handbook of pattern recognition and computer vision / Chen C.H., Rau L.F. and Wang P.S.P.(eds.). Singapore-New Jersey-London-Hong Kong: World Scientific Publishing Co. Pte. Ltd., 1995. - 984 p.

18. Shalkoff R.J. Digital image processing and computer vision. New York-Chichester-Brisbane-Toronto-Singapore: John Wiley & Sons, Inc., 1989. - 489 p.

19. Гиренко A.B., Ляшенко B.B., Машгалир В.П., Путятин Е.П. Методы корреляционного обнаружения объектов. Харьков: АО '"БизнесИнформ", 1996. 112 с.

20. Вестник Национального Технического Университета "Харьковский политехнический институт" Выпуск 114.- Харьков: НТУ "ХПИ", 2001. 128с. 7. Проблемы бионики. Всеукраинский межведомственный сборник. Выпуск 50.-Харьков: "ХГТУРЭ", 1999. -217с.

21. Бакут П.А., Колмогоров Г.С., Ворновицкий Н.Э. Сегментация изображений: методы пороговой обработки // Зарубежная радиоэлектроника, 1987. №10, с. 6-24.

22. Бакут П.А., Колмогоров Г.С. Сегментация изображений: методы выделения границ областей // Зарубежная радиоэлектроника, 1987. №10, с. 25-47.

23. Васюков В.Н., Грузман И.С., Райфельд М.А., Спектор А.А. Новые подходы к решению задач обработки и распознавания изображений // Наукоемкие технологии. 2002. № 3.

24. Айфичер Э., Джервис Б. Цифровая обработка сигналов. Практический подход. / М., "Вильяме", 2004, 992 с.

25. Мальцев С. В., Богуш Р. П. Корреляционная обработка сигналов и изображений // Вестн. Полоц. гос. ун-та. Серия С, Фундаментальные науки. 2005. -№ 4. с. 45-54. Мальцев С. В., Богуш Р. П.

26. Новиков А.И., Конкин Ю.В., Федорович Я.А. Применение градиентных методов в задачах обработки радиолокационной информации // Математические методы в научных исследованиях: Межвуз. сб. / Рязан. гос. радиотехн. акад. Рязань, 2006.-С. 55-63.

27. Jain, R. and Gupta, A., Computer Vision and Visual Information Retrieval, 1996.-http://vision.ucsd.edu/papers/roscnfeld/

28. Jain, R. and Gupta, A., Visual Information Retrieval,Communications of the ACM, 1997, vol. 40, no. 5.

29. Jain, R., Pentland, A.P., Petkovic, D., Workshop Report: NSF ASPA Workshop on Visual Information Management Systems, 1995.-http://www.virage.com/vim/vimsreport95.html

30. Немного о сканерах.- http://ref.huba.ru/rdsrel7type6/elem7019.html

31. ЗЗ.Чен Ш.-К. Принципы проектирования систем визуальной информации. -М.: Мир, 1994.

32. Yong Rui, Thomas S. Huang. Image Retrieval: Current Techniques, Promising Directions, and Open Issues. Journal of Visual Communication and Image Representation, 1999, №10.

33. Guang-Ho Cha, Chin-Wan Chung. An Indexing and Retrieval Mechanism for Complex Similarity Queries in Image Databases. Journal of Visual Communication and Image Representation, 1999, №10.

34. Переберин Антон Валерьевич. Многомасштабные методы синтеза и анализа изображений. Автореферат диссертации на соискание ученой степени кандидата физико-математических наук. Москва, 2002. - 23 с.

35. Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978.

36. Leonard Brown, Le Gruenwald. Tree-Based Indexes for Image Data. Journal of Visual Communication and Image Representation, 1998, №9.

37. Обработка графической информации на ЭВМ / А.И. Петренко и др.-К: Техника,! 974.-144 с.

38. Гоголь А., Джакония В. Телевидение. Учебник для ВУЗов 2 изд. М.:Радио и связь, 2004.-616с

39. Yang J., Waibel A. A Real-time Face Tracker // IEEE Proc. of the 3rd Workshop on Applications of Computer Vision, Florida, 1996.

40. Content-Based Image Retrieval (CBIR) System: http://www.unn.ac.uk/iidr/CBIR/report.html.

41. Iconclass image classifaction system: http://www.iconclass.nl/texts/info01.htm.

42. Чжи Я Аунг. Алгоритм гистограммных преобразований в локальных областях яркостей изображений. // "Аспирант и соискатель". ISSN 1608-9014, № 2(50), 2009. -С. 88-91.

43. Floyd R.W., Steinberg "Adaptive algorithm for spatial grayscale", in SID Int. Sym. Dig. Tech. Papers, pp. 36-37, 1975. Vol. 6, Apr 22-23, Washington, 1975, 156p.

44. Pirsch P., Netravali A.N. "Transmission of grey level image by multilevel dither technigues", Computer & graphics, V7, vl, pp. 31-44, 1983.139

45. Морозова Н.В., Смирнов А.В., Чжи Я Аунг. Коррекция изображения при выводе на печатающее устройсгво//Известия вузов. Электроника.-М.:МИЭТ. -№1, 2010.-С.90-92.

46. Ratliff F., Milkman N., RennertN. Attenuation of Mach bands by adjacent stimuli // Proc. Natl. Acad. Sci. USA, 1983. Vol.80.

47. Чжи Я Аунг. Автоматизация процесса визуализации и рассеяния ошибок при обработке цветных изображений//"Научное обозрение'"', №1, 2010.

48. Аппроксимация полутонами.- http://stratum.pstu.ac.ru/textbooks/kgrafic /additional/addit 17.html

49. Shiozaki A. "Image Enhancement in a Dithered Picture", CVGIP, V24, vl, pp. 107-113, 1987.

50. Limb, J.O. "Design of Dither Waveforms for Quantized Visual Signals" Bell System Tech. J., 48, 2555-2582, 1969.

51. Jarvis J.F., Roberts C.S. "A New Technigue for Displayind Confinuous Tone Images on a Bilevel Display", IEE Traw, Vol 24(8), pp. 891-898, Aug. 1976.

52. Jarvis J.F. "The Line Drawing Editor Schematic Diagram Editing Using Pattern Recognition Techniques", CGIP, 6(5), pp. 452-484, Okt 1977.140

53. Pirsch P., Netravali A.N. "Transmission of grey level image by multilevel dither technigues", Computer & graphics, V7, vl, pp. 31-44, 1983.

54. Портнов Е.М., Чжи Я Аунг. Использование метода цветовых гистограмм для получения полутоновых изображений. // "Естественные и технические науки". ISSN 1684-2626, № 6(38), 2008. -С. 251-252.

55. Башмаков А.И., Башмаков И.А. Интеллектуальные информационные тех-нологии.-М.: Издагельство МГТУ им. Н.Э. Баумана, 2005.-304 с.

56. Базы знаний интеллектуальных систем / Т. А. Гаврил ова, В.Ф.Хорошевский.СПб.: Питер, 2000. — 384 с.

57. Представление и использование знаний: Пер. с япон. / Под ред. X. Уэно, М. Исидзука. — М.: Мир, 1989. — 220 с.

58. Калиниченко JI. А., Рывкин В. М. Машины баз данных и знаний. М.: Наука, 1990. - 296 с.

59. Чжи Я Аунг. Основные подходы к созданию баз знаний графических образов. // "Аспирант и соискатель". ISSN 1608-9014, №5, 2009. -С.125-127.

60. Нечеткие множества в моделях управления и искусственного интеллекта / Под ред. Д.А. Поспелова. — М.: Наука, 1986. — 312 с.

61. Гайдамакин H.A. Автоматизированные информационные системы, базы и банки данных. Вводный курс. Учебное пособие. М.: Гелиос АРВ, 2002. -368с.

62. Компьютерные технологии в высшем образовании. / Ред. кол.: А.Н.Тихонов, В.А. Садовничий и др.- М.: Изд-во Моск. ун-та., 1994. 272 с.

63. Растригин JI.A., Эренштейн М.Х. Адаптивное обучение с моделью обучае-мого.-Рига: Зинатне, 1988. 160 с.

64. Соловов A.B. Проектирование компьютерных систем учебного назначения: Учебное пособие. Самара: СГАУ, 1995. - 137 с.141

65. Когаловский М. Р. Перспективные технологии информационных систем. -М.: ДМК Пресс; М.: Компания АйТи, 2003. 288 с.

66. Харари Ф. Теория графов. М.: Мир, 1973.-300с.

67. Зыков A.A. Основы теории графов. М.: Наука, Гл. ред. физ.-мат. лиг., 1987.-384 с.

68. Агеев В.Н. Примеры гипертекстовых и гипермедиа систем (обзор) // Компьютерные технологии в высшем образовании: Сб. статей. М.: Изд-во МГУ. 1994. - С.225-229.

69. Хомякова К. Классификация показателей качества цифровой печати //Известия ВУЗов. Проблемы полиграфии и издательского дела. 2005. - №3. -С. 25-32.

70. Шашлов Б.А. Цвет и цветовоспроизведение. М.: Мир книги, 1995.

71. Уарова P.M., Потапова К.В. Тенденции развития цифровых печатных машин // Материалы Международной научно-практической конференции. -М.:МГУП, 2003. С. 12-14.

72. Баин A.M., Портнов Е.М., Чжи Я Аунг .Разработка иерархической многомодульной базы знаний с динамически управляемой структурой//«Оборонный комплекс научно-техническому прогрессу России».№4, 2009. -С.78-80.

73. Со Тант, Чжи Я Аунг. Подготовка изображений для графических баз знаний. // НАУЧНАЯ СЕССИЯ МИФИ-2008. XI Московская международная телекоммуникационная конференция студентов и молодых уче-ных«МОЛОДЕЖЬ И НАУКА»: Тезисы докладов. М.: МИФИ, 2008. - С. 87.

74. А. Ю. Поливанов, М. В. Тарасюк. Современный подход к распознаванию типовых деталей машиностроения в роботизированной сборке// Приложение к журналу "Мехагроника, автоматизация, управление" №6, 2007.-С. 18-21.

75. Хорн Б.К.П. Зрение роботов: Пер. с англ. М.: Мир, 1989. - 487 с.142

76. Шлосснейгл Дж. Профессиональное программирование на PHP: Перевод с английского. -Изд-во "Вильяме'",2006.-610 с.

77. Пентланд А., Чаудхари Т. Распознавание лиц для интеллектуальных сред. Открытые системы, №3. — 2000, с.28 -33.

78. Параллельная обработка информации: В 5 т./ т.5: Проблемно-ориентированные и специализированные средства обработки информации: Под ред. Б.Н.Малиновского и В.В.Грицыка. ■— 1990. — 504 с.

79. John R. Smith and Shih-Fu Chang.Tools and Techniques for Color Image Retrieval. ACM Multimedia 1996: Boston, MA.

80. M. Striker, M.Orengo. Similarity of color images// SPIE. — Vol. 2420, NO. 1, 1995.—pp. 381-392.

81. IBM Almadén Research Center. Query by Image and Video Content: the QBIC System. Computer, September 1995.- P. 23-31.

82. M. Strieker and A. Dimai. Color indexing with weak spatial constraints. In Symposium on Electronic Imaging: Science and Technology Storage & Retrieval for Image and Video Databases IV, volume 2670, pages 29-41. IS&T/SPIE, 1996.

83. V.Vinod, Hiroshi Murase, Object Location Using Complementary Color Features: Histogram and DCT. NTT Basic Research Labs, 3-1 Morinosato Wakamia, Atsugishi, 243-01 Japan.

84. J. Huang. Color Spatial Image Indexing and Application, a Dissertation Presented to the Faculty of the Graduate School of Cornell University to Partial Fulfillment of the Requirements for the Degree of Doctor of Philosophy, 1998.

85. Chen J.Y., Bounman C.A., Dalton J.C. Hierarchical Browsing and Search of Large Image Databases // IEEE Transactions on Image Processing. — 2000. — vol. 9, №3. — P. 442^455.

86. Abdel-Mottaleb M., Krishnamachari S., Mankovich N.J. Performance Evaluation of Clustering Algorithms for Scalable Image Retrieval // IEEE Computer Society Workshop on Empirical Evaluation of Computer Vision Algorithms. — Santa Barbara. — 1998.

87. Чжи Я Аунг. Программный комплекс автоматизированной обработки изображений на основе гистограммных преобразований. // "Аспирант и соискатель". ISSN 1608-9014, №6, 2009.-С. 102-103.

88. Плат, Д.С. Знакомство с Microsoft.NET / Пер. с англ. / Д.С. Платт. М.: Издательско-торговый дом «Русская редакция», 2001. - С. 240.

89. Н. Nyquist. Certain topics in telegraph transmission theory. Trans. AIEE, vol. 47, pp. 617—644, Apr. 1928.

90. С. E. Shannon. Communication in the presence of noise. Proc. Institute of Radio Engineers, vol. 37, no.l, pp. 10—21, Jan. 1949.

91. Скотт Мюллер. Модернизация и ремонт ПК = Upgrading and Repairing PCs. — 17-е изд. — M.: Вильяме, 2007. -С. 889-970. ISBN 0-7897-3404-4.

92. Smeulders A., Worring M., Santini S., Gupta A. and Jain R., Content-Based Image Retrieval at the End of the Early Years. IEEE Transactions on PAMI, vol. 22, P. 1349-1380, 2000.

93. Ватолин Д., Ратушняк А., Смирнов M. Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео// -М. Диалог- МИФИ. -2003. - 384 с.

94. Приоров А. Л., Арляпов С.А., Хрящев В.В. Модифицированный критерий оценки качества восстановленных изображений // Цифровая обработка сигналов. 2006, №2,- С. 27-33.

95. Павлидис Т. Алгоритмы машинной графики и обработки изображений.-М.: Радио и связь, 1986.- 400 с.

96. Чжи Я Аунг. Методика автоматизированного поиска изображений в базе знаний графических образов// "Актуальные проблемы современной науки", №2, 2010.

97. Акт внедрения результатов диссертационной работы1. X'1. УТВЕРЖДАЮ

98. Заведующий кафедрой ИПОВС, доктор технических наук, профессор

99. Ученый секретарь кафедры ИПОВС, доктор технических наук, профессор1. Л.Г. Гагарина1. Е.М. Портнов

100. FatalError( "Unable to allocate memory in ReadBMPQ!");

101. Position the file after header. Header should be 54 bytes long ~ checked above */fseek(ip, (long) bmpOffBits, SEEK SET);

102. Read the image */ for (y = 0; y < imgHeight; y++) { fread(tmp, 1, lineLength, fp);

103. WriteUnsignedShort( (unsigned short int) MYBMP BF TYPK. fp): WriteUnsignedlnt ( (unsigned int) (MYBMPBFOFFBITS + lineLength * height), fp);

104. WriteUnsignedShort( (unsigned short int) 0, fp); WriteUnsignedShort( (unsigned short int) 0, fp); WriteUnsignedlnt ( (unsigned short) MYBMP BF OFF BITS, fp);1. Write info header */

105. WriteUnsignedlnt ( (unsigned short int) MYBMP BI SIZE, fp);

106. Writelnt ( (int) width, fp);

107. Writelnt ( (int) height, fp);

108. WriteUnsignedShort( (unsigned short int) 1, fp);

109. WriteUnsignedShort( (unsigned short int) 24, fp);

110. WriteUnsignedlnt ((unsigned int) MYBMP BI RGB, fp);

111. WriteUnsignedlnt ((unsigned int) (lineLength * (unsigned int) height), fp);

112. Writelnt ((int) 2925, fp);

113. Writelnt ((int) 2925, fp);

114. WriteUnsignedlnt ((int) 0, fp);

115. Padding for 32-bit boundary */while ((nbytes % 4) != 0) {putc(0, fp); nbytes++;return GFXIOOK;

116. Reads an unsigned short from a file in little endian format */static unsigned short int ReadUnsignedShort(FILE *fp) {unsigned short int lsb, msb;lsb = getc(fp); msb getc(fp); return (msb « 8) | lsb;

117. Writes as unsigned short to a file in little endian format */static void WriteUnsignedShort(unsigned short int x. FILE *fp) {unsigned char lsb, msb;lsb = (unsigned char) (x & OxOOFF); msb = (unsigned char) (x » 8); putc(lsb, fp); putc(msb, fp);)

118. Reads as unsigned int word from a file in little endian format */static unsigned int ReadUnsignedInt(FILE *fp) {unsigned int bl, b2, b3, b4;bl = getc(fp); b2 = getc(fp); b3 = getc(fp); b4 = getc(fj));return (b4 « 24) | (b3 « 16) | (b2 « 8) | bl; } ,

119. Reads an int word from a file in little endian format */static int ReadInt(FILE *fp) {intbl,b2, b3, b4;bl = getc(fp); b2 = getc(fp); b3 = getc(fp); b4 = getc(Q>);return (b4 « 24) | (b3 « 16) | (b2 « 8) | bl;

120. Reads a 24-bit uncompressed BMP from the file 'f */

121. NOTE: Not the layout from the file (where its BGR not RGB) */

122. The values stored in *w and *h are the image width & height */ unsigned char *ReadBMP( char *f5 int *width, int * height);

123. Writes an uncompressed 24-bit BMP to the file 'f */

124. Returns: One of the error codes from above or GFXIO OK */

125. Input: 'f, the filename to write to */width, the image width */height, the image height */ptr, a pointer to an unsigned character / unsigned byte array */