автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Повышение эффективности компрессии изображений на основе анализа поля ошибок
Автореферат диссертации по теме "Повышение эффективности компрессии изображений на основе анализа поля ошибок"
На правах рукописи
0046
4400
ТИМБАЙ Елена Ивановна
ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ КОМПРЕССИИ ИЗОБРАЖЕНИЙ НА ОСНОВЕ АНАЛИЗА ПОЛЯ ОШИБОК
Специальность 05.13.17 - Теоретические основы информатики
Автореферат диссертации на соискание ученой степени кандидата технических наук
2 5 НОЯ 7010
САМАРА - 2010
004614400
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Самарский государственный аэрокосмический университет имени академика С.П.Королёва (национальный исследовательский университет)» и учреждении Российской академии наук «Институт систем обработки изображений РАН»
Научный руководитель:
Официальные оппоненты:
Ведущее предприятие:
доктор технических наук, профессор Владислав Викторович Сергеев
доктор технических наук, доцент Александр Григорьевич Храмов
кандидат технических наук, доцент Игорь Вячеславович Григоров
Государственное учреждение «Научно-исследовательский институт прикладной математики и кибернетики Нижегородского государственного университета им. Н.И. Лобачевского Министерства образования Российской Федерации»
Защита состоится 3 декабря 2010 г. в 14 часов на заседании диссертационного совета Д 212.215.07 при Государственном образовательном учреждении высшего профессионального образования «Самарский государственный аэрокосмический университет имени академика С.П.Королёва (национальный исследовательский университет)» по адресу: 443086, Самара, Московское шоссе, 34.
С диссертацией можно ознакомиться в библиотеке ГОУ ВПО «Самарский государственный аэрокосмический университет имени академика С.П.Королёва (национальный исследовательский университет)».
Автореферат разослан 2 ноября 2010 г.
Ученый секретарь диссертационного совета
И.В. Белоконов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Цифровые изображения, получаемые современными средствами регистрации информации, передаваемые по каналам связи и обрабатываемые на компьютерах, как правило, характеризуются чрезвычайно большими объёмами данных. Это приводит к возникновению ряда серьезных проблем, которые должны решать разработчики и пользователи прикладного программного обеспечения. Возможность работы с изображением, затрудняется из-за недостаточной ёмкости запоминающих устройств, ограниченной пропускной способности каналов передачи данных, недостаточного быстродействия вычислительных машин, т.е. ограничивается техническими характеристиками используемой аппаратуры. Компрессия (сжатие) изображений ориентирована на решение подобных проблем за счёт сокращения объёма данных, требуемого для представления цифрового изображения.
Компрессия изображений может рассматриваться также как «технология расширения возможностей». Она является естественным способом поддержания увеличивающегося разрешения современных устройств ввода изображений, а также возрастающей сложности широковещательных телевизионных стандартов. Компрессия изображений играет существенную роль во многих разнообразных и важных применениях, например, при организации видеоконференций, в системах дистанционного зондирования, при формировании изображений документов, обработке медицинских изображений, при факсимильной передаче графических и текстовых данных.
Таким образом, задача компрессии изображений является актуальной для многих современных приложений информатики. Изучению различных аспектов проблемы компрессии посвящены труды большого числа российских ученых: Д. С. Лебедева, H. Н. Красильникова, Ю. М. Штарькова, В. В. Сергеева, Ю. Г. Васина и др., а также зарубежных: Р. Грехема (R. Graham), Дж. О. Лимба (J. О. Limb), У. Претта (W. Pratt), А. Джайна (A. Jain), M. Кунта (M. Kunt) и др.
Наиболее перспективными методами компрессии, предлагаемыми сегодня на рынке информационных технологий, являются методы, основанные на сжатии с потерями, позволяющие получить значительную степень компрессии при некоторых допустимых искажениях исходных изображений (сжатие на основе предсказания, фрактальное сжатие, вейв-летная компрессия, сжатие на основе дискретных ортогональных преобразований). Однако, судя по продолжающимся разработкам в этой области, известные методы не в полной мере удовлетворяют пользовательским требованиям. В то же время, основная масса пользователей проявляет разумный консерватизм и не торопится отказываться от существующих стандартных форматов сжатия (JPEG, JPEG2000 и т.п.) в угоду, как правило, незначительным преимуществам новых методов. Поэтому, наряду с задачей разработки новых методов компрессии изображений, актуальной является задача «достраивания» известных методов таким образом, чтобы пользователь, продолжая их использование, получал повышенное качество компрессии. В рамках данной диссертации повышение эффективности компрессии предлагается обеспечить за счёт дополнительной обработки поля ошибок, порождаемых на исходном сжимаемом изображении стандартными методами компрессии. Результат такой обработки может быть использован при декомпрессии изображения для улучшения его качества.
Цель и задачи исследования
Целью диссертации является разработка и исследование методов, применяемых совместно с любыми известными методами компрессии изображений с потерями (базовыми методами) с целью повышения качества восстановления изображений после компрессии. Для достижения этой цели в диссертации решаются следующие задачи:
1. Разработка подхода к повышению качества изображений после компрессии, основанного на обработке поля ошибок, возникающих после базовой компрессии. Здесь под об-
работкой поля ошибок понимается формирование его приближенного компактного описания.
2. Разработка метода повышения качества изображений, основанного на независимой обработке поля ошибок. Разработка и исследование входящих в его состав алгоритмов преобразования данных: квантования и статистического кодирования.
3. Разработка и исследование метода повышения качества изображений, основанного на построении оценки поля ошибок восстановления с использованием зависимости между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии. Разработка и исследование входящих в состав данного метода алгоритмов: построение функции, аппроксимирующей поле ошибок восстановления; выбор системы признаков - аргументов аппроксимирующей функции; обработка коэффициентов аппроксимации с целью их компактного представления.
4. Экспериментальное исследование эффективности разработанных методов и входящих в их состав алгоритмов преобразования данных, выработка рекомендаций по использованию результатов диссертации.
Методы исследований
В диссертационной работе используются методы математического анализа и алгебры, теории вероятностей и статистического анализа, теории информации, теории цифровой обработки сигналов и изображений.
Научная новизна работы
Предложен подход к решению задачи повышения качества изображений, восстановленных после компрессии методами сжатия с потерями, основанный на обработке полей ошибок восстановления.
Предложен метод повышения качества изображений, основанный на независимой (от изображения) обработке поля ошибок, заключающийся в квантовании и статистическом кодировании поля ошибок. Благодаря применению равномерной шкалы квантования, данный метод позволяет обеспечить контроль максимальной ошибки восстановления для произвольного метода компрессии с потерями, не обладающего таким свойством. Показана целесообразность применения двухпотокового кодера для кодирования поля квантованных ошибок. Получены результаты исследований, показавшие, что предложенный метод позволяет существенно (в несколько раз) уменьшить максимальную ошибку восстановления при том же коэффициенте компрессии для исходных методов сжатия JPEG и JPEG2000.
Предложен метод повышения качества изображений, восстановленных после компрессии методами сжатия с потерями, использующий зависимость между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии, основанный на построении корректирующего фильтра, аппроксимирующего поле ошибок. Предложен метод построения фильтра с кусочной функцией аппроксимации. Задача уменьшения объёма дополнительной информации, описывающей фильтр-корректор с кусочной аппроксимирующей функцией, решена с помощью равномерного квантования коэффициентов аппроксимации; предложен метод вычисления количества бит, требуемого для представления коэффициентов. Получены результаты исследований, показавшие эффективность применения предложенного метода для повышения качества восстановления изображений по показателю PSNR после базовой компрессии JPEG, HGI и JPEG2000.
Практическая ценность работы
Предложенные в диссертационной работе методы, реализующие новый подход к повышению качества изображений, восстановленных после компрессии произвольным методом сжатия с потерями, могут быть использованы в геоинформационных системах, системах оперативного дистанционного зондирования, базах данных изображений и в других компьютерных системах хранения, обработки и передачи визуальной информации. Разра-
ботанные методы позволяют повысить эффективность известных методов компрессии изображений и расширяют сферу их применения.
Реализация результатов работы
Результаты диссертации использованы при выполнении ряда госбюджетных и хоздоговорных НИР в Институте систем обработки изображений РАН и ОАО «Самара-Информспутник».
Апробация работы
Основные результаты диссертации были представлены на следующих конференциях:
- на Всероссийском семинаре по моделированию, дифракционной оптике и обработке изображений, Самара, 3-7 июля 2006 г;
- на Научно-технической конференции с международным участием «Перспективные информационные технологии в научных исследованиях, проектировании и обучении «ПИТ-2006», Самара, 2006;
- на Всероссийской студенческой научно-технической конференции «Прикладная математика и математическое моделирование», Москва, 2007;
- на 8-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ), Россия, Йошкар-Ола, 2007;
- на 9-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ), Россия, Нижний-Новгород, 2008;
- на Всероссийской молодежной научной конференции с международным участием «X Королевские чтения», Самара, 2009;
- на Всероссийской конференции «Проведение научных исследований в области обработки, хранения, передачи и защиты информации», Ульяновск, 2009;
- на Международной конференции с элементами научной школы для молодежи «Перспективные информационные технологии для авиации и космоса «ПИТ-2010», Самара, 2010.
Публикации
По теме диссертации опубликовано девять работ, из них 2 из перечня ведущих рецензируемых научных журналов и изданий, рекомендованных ВАК РФ.
Структура диссертации
Диссертация состоит из введения, трех глав, заключения, списка литературы и 6 приложений. Она изложена на 122 страницах машинописного текста (без приложений), содержит 43 рисунка, 11 таблиц, список использованных источников из 59 наименований.
На защиту выносятся
1. Подход к решению задачи повышения качества изображений, восстановленных после компрессии методами сжатия с потерями, основанный на обработке полей ошибок восстановления.
2. Метод повышения качества изображений, основанный на независимой (от изображения) обработке поля ошибок, заключающийся в квантовании и статистическом кодировании поля ошибок.
3. Метод повышения качества изображений, основанный на построении оценки поля ошибок с учетом зависимости между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии, заключающийся в построении корректирующего фильтра, аппроксимирующего поле ошибок восстановления.
4. Метод построения фильтра с кусочной функцией аппроксимации.
5. Решение задачи уменьшения объёма дополнительной информации, описывающей фильтр с кусочной аппроксимирующей функцией, за счёт равномерного квантования коэффициентов аппроксимации.
6. Результаты вычислительных экспериментов, подтверждающие эффективность предложенных методов.
КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ В первой главе диссертационной работы изложена общая идея решения задачи повышения качества изображений, восстановленных после компрессии произвольным методом сжатия с потерями, за счёт «достраивания» этого метода таким образом, чтобы пользователь, продолжая его использование, получал повышенное качество компрессии.
Предлагаемая схема обработки данных представлена на рисунке 1. Здесь белый фон имеют блоки, которые реализуют «стандартные» функции компрессии и декомпрессии изображений, а серым фоном выделены дополнительно введенные блоки, связанные с реализацией предлагаемого метода.
А) Стадия компрессии Б) Стадия декомпрессии
Рис. 1 - Общая схема обработки данных при «достраивании» стандартного метода компрессии
Смысл дополнительных преобразований заключается в следующем. Сразу же после компрессии некоторым базовым методом сжатия осуществляется восстановление изображения У и вычисляется поле ошибок восстановления:
Е = Х-У (1)
(здесь и далее все арифметические операции, применяемые к матрицам изображений, имеют смысл поэлементных, то есть выполняемых для каждого отсчёта).
Далее выполняется обработка поля ошибок Е, целью которой является его приближенное компактное описание. Поле ошибок восстановления после обработки может быть описано следующей формулой:
Ё = Е + д, (2)
где Е - поле ошибок восстановления после обработки, 2 - поле ошибок, возникающих при обработке Е.
Результат обработки поля ошибок должен быть сохранен в архив вместе с компрессированными данными исходного изображения.
На стадии восстановления изображения (рис. 16) сначала происходит разделение компрессированных данных на основную и дополнительную части. Из основной части восстанавливается изображение У. Восстановленные из второй части дополнительные данные
используются для получения приближенного описания поля ошибок Ё, компенсации ошибки восстановления и получения окончательно восстановленного изображения X :
X = Y + Ê = Y + (E + Q) = (Y + E) + Q = X + Q. (3)
Эффект от применения описанного метода «достраивания» существующих алгоритмов компрессии с потерями оказывается двояким. С одной стороны, ошибка восстановления изображения гарантированно уменьшается. С другой стороны, объём компрессированных данных возрастает из-за добавления в них дополнительной информации Ig, представляющей собой результат обработки поля ошибок Е, а значит, значение коэффициента компрессии уменьшается.
Коэффициент компрессии (сжатия) является основным показателем эффективности любого метода компрессии:
Kc = l-f, (4)
где /д и / - объёмы данных соответственно до и после компрессии. Если /у - объём данных, получаемый после сжатия изображения базовым методом компрессии, I£ - дополнительный объём данных, возникающий в результате обработки поля ошибок Е. Тогда для базового метода компрессии / = Iy, а для модифицированного метода - I = 1у + 1Е.
Анализ эффективности работы метода «достраивания» предложено проводить путем сопоставления экспериментальных зависимостей показателя качества восстановления изображения от коэффициента компрессии, построенных для базового и модифицированного методов сжатия. Для проведения исследований были выбраны два распространенных показателя качества: максимальная ошибка £max и PSNR (peak signal to noise ratio).
Пусть кривые (ЛТС) и PSNR^ (Кс ) построены для базового метода компрессии,
а и PSNR® (ЛГС) - для метода «достраивания». Вывод об эффективной работе
метода «достраивания» можно сделать при выполнении следующих неравенств. Если в качестве показателя качества восстановления изображения выбрано значение максимальной ошибки, то должны выполняться условия:
при или <к® при ¿0iK)=4iK).
При использовании PSNR в качестве показателя качества в первом неравенстве изменится знак:
PSNRW (Кс ) < PSNR® (Кс ) при = или
при PSNR.W (Кс) = PSNRW ( Кс ).
Для проведения экспериментальных исследований в качестве базовых алгоритмов компрессии рассматривались JPEG, JPEG2000 и HGI. В качестве тестовых изображений были использованы наборы полутоновых и полноцветных изображений из коллекции Waterloo и базы изображений USC-SIPI.
Основой предлагаемого подхода к «достраиванию» стандартных методов компрессии является обработка поля ошибок Е, порождаемых на выходном изображении этими методами сжатия. Для обеспечения эффективной работы метода «достраивания» алгоритм обработки поля Е должен строиться с учетом особенностей распределения его значений.
Проведенный анализ полей ошибок позволил сделать следующие выводы. Во-первых, поля ошибок имеют слабую пространственную корреляцию, поэтому их можно обрабатывать поэлементно. Во-вторых, ошибки, так или иначе, статистически связаны с исходным сжимаемым изображением. Значит, для описания поля ошибок можно использовать зави-
симость его элементов с отсчётами восстановленного изображения Y.
Во второй и третьей главах диссертационной работы рассматриваются два различных независимых метода, реализующие предложенную схему обработки данных, с двумя разными подходами к обработке поля ошибок:
1) метод, основанный на независимой обработке поля Е ;
2) метод, основанный на построении оценки поля использующий зависимость между элементами поля ошибок и отсчётами изображения Y.
Во второй главе диссертационной работы предлагается метод повышения качества изображений, восстановленных после компрессии произвольным методом сжатия с потерями, основанный на независимой обработке поля ошибок восстановления Е.
Ошибки, порождаемые на выходных изображениях рассматриваемыми базовыми методами компрессии, слабокоррелированы, поэтому их можно обрабатывать поэлементно, например, квантовать. В работе предложено применять равномерное квантование, которое, помимо получения компактного описания поля ошибок Е, за счёт допустимой потери точности его представления, позволяет обеспечить контроль максимальной ошибки восстановления для произвольного базового метода компрессии не обладающего таким свойством, например JPEG или JPEG2000.
Равномерное квантование осуществляется таким образом, чтобы все квантованные значения поля ошибок Е не отличались от истинных больше, чем на заданную величину £тах • Тогда в формуле (2) величина Е будет представлять собой поле квантованных ошибок, a Q - поле ошибок квантования, причем
M<*max. (5)
Полученное в результате квантования поле Е подвергается дополнительной компрессии. Разумеется, при этом порождается дополнительный объём данных 1Е, который необходимо объединить с данными IY, полученными основной процедурой компрессии.
Принимая во внимание (5), можно видеть, что при декомпрессии ошибка окончательного восстановления изображения не превысит заданного максимального значения £тах . Таким образом, предлагаемый метод «достраивания», основанный на равномерном квантовании поля ошибок, позволяет обеспечить контроль максимальной ошибки восстановления для произвольного базового метода компрессии.
При реализации метода «достраивания», основанного на независимой обработке поля ошибок, возникает задача выбора алгоритма кодирования (компрессии) поля квантованных ошибок Е, который был бы наиболее эффективен, то есть обеспечивал минимум дополнительных данных ¡е .
Как отмечалось выше, элементы поля ошибок Е слабокоррелированы, поэтому элементы поля квантованных ошибок Е будем считать независимыми и использовать для компрессии любой известный алгоритм статистического кодирования независимых случайных символов (Хаффмена, арифметический и т.д.). Однако перечисленные методы кодирования не учитывают специфику распределения элементов поля квантованных ошибок Е и, вследствие этого, как показывают эксперименты, недостаточно эффективны.
Распределение вероятностей элементов поля Ê имеет ярко выраженный максимум в нуле и симметрично спадает по обе стороны от нуля. Чем большее значение имеет заданная допустимая погрешность ¿~тах, тем больше нулей будет среди значений поля квантованных
ошибок. Для сжатия поля квантованных ошибок Е в диссертационной работе применяется известный двухпотоковый статистический кодер, хорошо приспособленный для распределения вероятностей такого сигнала. Этот кодер представляет собой комбинацию Range
кодера (разновидность адаптивного арифметического кодирования) и кодирования длин серий (КДС). Экспериментальные исследования показали, что при кодировании поля квантованных ошибок двухпотоковый кодер позволяет обеспечить меньший объём данных, чем простое применение Range кодера. На рисунке 2 в качестве примера показаны результаты кодирования поля Е, полученные для изображения «Lena», восстановленного после компрессии методом JPEG с Ксу =15.12 и
PSNRy =35.1078.
При исследовании эффективности работы предложенного в данной главе метода «достраивания», основанного на независимой обработке поля ошибок и обеспечивающего контроль максимальной ошибки восстановления, построение экспериментальных зависимостей ^п'ах (Кс), PSNR.(1\kc) осуществлялось следующим образом.
Тестовое изображение подвергали сжатию базовым методом компрессии с некоторым произвольным значением «качества компрессии» (параметра базового метода). В результате получали объём данных 1у, из которого восстанавливали изображение Y (базовое изображение). Вычисляли поле ошибок и квантовали его с различными значениями fjj^ , получая в результате некоторый объём дополнительных данных 1щ, i = О, S -1, где S - количество этапов квантования. Дополнительные данные, сформированные в результате обработки поля ошибок 1Е., объединяли вместе с данными /у, полученными основной процедурой компрессии. Вследствие изменения объёма архива, пересчитывали коэффициент компрессии. Интерполируя множество точек | Кс. ; . j, строили кривую fj^ (Кс ).
Дополнительные данные 1Е использовали на этапе декомпрессии для получения окончательно восстановленного изображения X. Оценив качество восстановления изображения X по показателю PSNR, получали некоторое значение PSNR^. Интерполируя
множество точек ; PSNR^ J, строили кривую PSNR^ (Кс ).
Подвергая тестовое изображение сжатию базовым методом компрессии с различными значениями «качества компрессии», формировали набор из нескольких базовых изображений. Применяя к каждому из них предложенный метод «достраивания», получали серию
кривых 4их(*с) и PSNrM(Kc).
На рисунке 3 представлены графики зависимостей PSNr(°\kc) h серии
кривых построенные для изображения «Lena». Здесь в качестве
базовых были взяты изображения, восстановленные после компрессии методами JPEG, HGI и JPEG2000 с коэффициентами компрессии и PSNR, представленными в таблице 1.
--Range кодер
-Двухпотоковы й кодер
16 Emax
Рис.2 - Зависимость объёма компрессированных данных В (бит/отсчёт) от е1Ш1),
Таблица 1 Характеристики базовых изображений
Изобр. № кривой JPEG HGI JPEG2000
КСу PSNRr КСу PSNRy ксу PSNRy
1 40.22 30.3998 48.17 29.6604 40.04 30.283
Lena 2 15.12 35.1078 14.64 35.3019 22.16 34.7141
3 5.88 39.407 5.94 40.2157 6.78 40.873
Как видно из представленных графиков, которые являются типичными для всех исследованных изображений, применение предлагаемого метода «достраивания» позволяет существенно (в 2 и более раз) уменьшить максимальную ошибку восстановления изображения при том же коэффициенте компрессии для методов JPEG и JPEG2000. Для метода HGI такого эффекта добиться не удается.
а)
г)
Изменение максимальной ошибки и показателя PSNR, получаемых в результате применения метода «достраивания», зависит от уровня ошибки, внесенной в исходное изображение X при базовой компрессии. Чем грубее базовая компрессия (чем меньше значение PSNRy), тем больше получаем выигрыш по значению fmax при применении метода «достраивания». Но при этом сильнее ухудшается качество окончательно восстановленного изображения, оцениваемое по показателю PSNR. При практическом применении предложенного метода в качестве базового изображения целесообразно выбрать изображение со средним качеством компрессии, что соответствует значению PSNRy =35 дБ .
При среднем качестве базовой компрессии ошибка, оцениваемая по показателю PSNR, остается почти неизменной (качество восстановления не ухудшается) для JPEG и заметно ухудшается для JPEG2000. Поэтому если при практическом применении метода «достраивания» недопустимы значительные ухудшения показателя PSNR, то для JPEG2000 предложенный метод контроля максимальной ошибки применять не рекомендуется.
В третье главе диссертационной работы предложен метод повышения качества изображений, восстановленных после компрессии произвольным методом сжатия с потерями, основанный на построении оценки поля ошибок с учетом зависимости между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии.
Рис. 3 - Зависимости е-,, (а, б, в) и PSNR (г, д, е) от Кс для изображения «Lena»
Предлагаемый метод заключается в построении корректирующего фильтра. Такой фильтр настраивается («обучается») по исходному X и восстановленному Y изображениям на этапе компрессии (блок «Обработка поля ошибок» схемы на рисунке 1). Результаты обучения, т.е. параметры фильтра, должны быть сохранены в архив вместе с компрессированными данными исходного изображения. Далее на этапе декомпрессии осуществляется непосредственно коррекция изображения с помощью построенного фильтра (блоки «Восстановление поля ошибок» и «Компенсация ошибки»), в результате получаем окончательно восстановленное изображение X.
Такой подход и методы адаптивной «обработки через распознавание» изображений («processing via recognition»- PR-метод) впервые были предложены в работах В.В. Сергеева. Однако общий PR-метод нуждается в адаптации к конкретной задаче восстановления компрессированных изображений, которая ранее не рассматривалась.
«Обучение» фильтра-корректора, действующего в режиме «скользящего окна», заключается в построении функции <р, аппроксимирующей поле ошибок восстановления Е, зависящей от некоторых выбранных признаков, вычисленных в «скользящем окне» обработки:
E = q>{y0,...,vK^,a0,...,aK), (3.1)
где Е - аппроксимированная ошибка восстановления, {vk{ni->n2)}0 > «1 = — 1,
«2 =0,^2 -1 - локальные признаки, вычисляемые по изображению Y; N\, N2 - размеры изображения; а0,...,ак - коэффициенты аппроксимации (параметры фильтра, полученные при его обучении); <р - функция аппроксимации.
На рисунке 4 приведена общая схема алгоритма построения фильтра-корректора.
Рис. 4 - Общая схема алгоритма построения фильтра-корректора
При создании конкретной реализации предлагаемого алгоритма возникают следующие задачи:
1) выбор системы признаков;
2) выбор способа построения функции аппроксимации;
3) обработка коэффициентов аппроксимации перед записью в архив для уменьшения объёма дополнительной информации.
Наиболее важным этапом при создании конкретной реализации корректирующего фильтра является выбор системы признаков. В отличие от задач распознавания образов, где особо ценятся разделяющие свойства признаков, в предлагаемом методе более важными являются их аппроксимирующие свойства, то есть система признаков, должна хорошо описывать функцию яркости изображения в окне обработки.
В диссертационной работе рассмотрены три системы признаков.
Первую простейшую систему И1' образуют значение центрального отсчёта восстановленного изображения Y в «скользящем окне» обработки W размера 3x3 и значения разностей между центральным отсчётом и соседними с ним отсчётами в этом окне.
Вторая и третья системы признаков были предложены в работах В.В. Сергеева, A.B. Чернова.
Вторая система v'2' состоит из К = 7 признаков, вычисление которых основано на
линейных сглаживающих фильтрах. Нулевой признак - значения пикселей восстановленного изображения У. Признаки с номерами 1-6 - отсчёты восстановленного изображения У, сглаженного прямоугольными окнами 3x3, 1x3, 3x1, 7x7, 5x3, 3x5, из которых вычтено восстановленное изображение У .
Третья система признаков описывает форму изображения в «скользящем окне» обработки IV . Она формируется из коэффициентов аппроксимации восстановленного изображения У полиномиальной поверхностью второго порядка в окне № размера 3x3. Данная система дополняется значением центрального отсчёта изображения У в этом окне и среднеквадратичной ошибкой аппроксимации.
Далее в третьей главе рассматривается вопрос построения оптимальной системы признаков на основе описанных выше систем, которая бы позволила обеспечить наилучшее качество восстановления изображения X по показателю при минимальном объёме дополнительных данных. Для формирования оптимальной системы признаков три ранее рассмотренные системы объединяются в одну у = и И2' Выбор из объединенной системы признаков V наиболее информативной подсистемы V предлагается выполнять с помощью алгоритма, заключающегося в последовательном присоединении наиболее информативных признаков. В данной работе информативность признака (то есть системы из одного признака) или системы нескольких признаков определяется значением показателя Р5Л7?, характеризующего качество изображения X, восстановленного фильтром-корректором, построенным на основе этих признаков. Чем больше значения РЯШ и Кс, полученные после применения фильтра, тем информативнее система признаков.
Следующая задача, возникающая при построении корректирующего фильтра, - выбор способа построения функции (р, аппроксимирующей поле ошибок восстановления Е. В рамках диссертационной работы были рассмотрены три типа аппроксимирующих функций: линейная, кусочно-линейная и кусочно-постоянная.
Аппроксимированная в классе линейных функций ошибка восстановления £' = {¿(«I,«2)] вычисляется по формуле:
К
¿("1>"2)= 2>*Ыи1>"2)> ^=1- (3.2)
к=О
Коэффициенты огд,...,а^ определяются с помощью метода наименьших квадратов из условия минимума среднеквадратичной ошибки аппроксимации.
В процессе построения кусочной аппроксимирующей функции признаковое пространство, представляющее собой К -мерный гиперкуб, последовательно разбивается по осям на подобласти и порождает в памяти ЭВМ древовидную структуру. В каждой из областей, полученных в результате разбиения, выполняется линейная аппроксимация или аппроксимация постоянным значением. Области с малой ошибкой аппроксимации принимаются за терминальные вершины дерева. Те области, в которых ошибка велика, подвергаются дальнейшему разбиению.
При построении кусочной аппроксимирующей функции решаются следующие задачи:
1) выбор оптимального признака для разбиения области гиперкуба;
2) оценка перспективности и деление перспективных областей;
3) проверка условия завершения процесса.
Для решения последней задачи в диссертации предложено правило завершения процесса формирования дерева, позволяющий найти близкое к оптимальному соотношение между качеством восстановления изображения с помощью построенной функции, то есть качеством аппроксимации ошибки Е, и объёмом дополнительных данных I¡?.
Процесс построения кусочной функции аппроксимации описывает дерево, в терми-
нальных вершинах которого хранятся коэффициенты аппроксимации в случае
построения кусочно-линейной функции, или один параметр а для кусочно-постоянной функции. Поэтому основной объём дополнительных данных ¡¡¡, необходимых для коррекции поля ошибок на этапе восстановления изображения, определяется числом терминальных вершин дерева и числом коэффициентов аппроксимации в каждой терминальной вершине. Чем меньше объём данных, необходимый для хранения одного коэффициента, тем меньше объём дополнительной информации, сохраняемой в архиве, и тем эффективней работа метода «достраивания», основанного на построении корректирующего фильтра.
Задачу уменьшения объёма дополнительной информации 1ц, описывающей построение фильтра-корректора с кусочно-линейной аппроксимирующей функцией, предложено решать с помощью равномерного квантования коэффициентов аппроксимации. Количество бит /, отводимое для хранения одного коэффициента, вычисляется по формуле:
1 =
-п I2 К N-1
1 тах г II I у^М
пце к=о;=о(„ь„2)еИ'")
+ 1,
2
где £ - суммарная квадратичная погрешность аппроксимации ошибки восстановления, вычисленная для всего изображения; ¡1«1 - параметр, задающий соотношение между значением дисперсии ошибки, вызванной квантованием коэффициентов аппроксимации, и величиной е ; «щт, сггаах - минимальный и максимальный коэффициенты аппроксимации; И'' - области признакового пространства, соответствующие N терминальным вершинам дерева.
При оценке эффективности работы описанного в данной главе метода «достраивания», основанного на применении фильтра-корректора, построение экспериментальных зависимостей (Кс) осуществлялось следующим образом.
Тестовое изображение X подвергали сжатию базовым методом компрессии с некоторым произвольным значением «качества компрессии» (параметра базового метода). Далее получали восстановленное изображение У, вычисляли поле ошибок Е и строили корректирующий фильтр. Результат обучения фильтра записывали в архив, получая тем самым некоторый объём дополнительных данных Вследствие изменения объёма архива, пересчитывали значение коэффициента компрессии.
На этапе декомпрессии с использованием информации формировали окончательно
восстановленное изображение X. Оценивая качество восстановления изображения X по показателю получали некоторое значение
. В результате в системе координат «коэффициент сжатия - РБИЯ» получали точку
Варьируя параметр «качество компрессии» базового метода сжатия, формировали множество точек |;1 ^¿ = 0,5-1, 5 - количество подходов к компрессии исходного тестового изображения. Интерполируя полученные точки, строили кривую
Исследование эффективности метода «достраивания», основанного на построении корректирующего фильтра, проводилось в несколько этапов. Такой подход к проведению экспериментов вытекает из алгоритма построения фильтра-корректора - каждый этап исследований связан с решением той или иной задачи, возникающей при построении фильт-
ра. В процессе исследования работы фильтра были рассмотрены следующие вопросы:
1) анализ эффективности критерия завершения процесса построения кусочной аппроксимирующей функции;
2) выбор из v<",v(2),V« системы признаков, позволяющей получить наилучшее качество восстановления изображения X ;
3) выбор способа построения функции аппроксимации;
4) формирование оптимальной системы признаков.
Согласно результатам проведенных исследований, наилучшее качество восстановления изображений обеспечивает фильтр с кусочно-линейной функцией аппроксимации, построенный для системы признаков, основанной на линейных сглаживающих фильтрах. Этот вывод справедлив для любого из рассмотренных методов базовой компрессии: JPEG, HGI или JPEG2000 (рис. 5).
PSNR
PSNR
13 23 33 43
Рис. 5 - Зависимости PSNR(KC) для изображения «Lena», восстановленного фильтром-корректором после компрессии методами JPEG, HGI и JPEG2000
В таблице 2 приведены значения среднего приращения PSNR (с учетом изменения Кс ), полученные при использовании для восстановления изображений фильтра-корректора с кусочно-линейной аппроксимирующей функцией, построенного для системы признаков, вычисление которых основано на линейных сглаживающих фильтрах.
Таблица 2 Среднее приращение PSNR (с учетом изменения Кс ) при восстановлении изображе-
Имя изображения Базовый метод компрессии Имя изображения Базовый метод компрессии
JPEG HGI JPEG2000 JPEG HGI JPEG2000
Lena 0.6616 0.6076 0.0868 Washsat 0.693 0.8096 0.3988
Mandrill 0.5523 0.7256 0.0848 Brick wall 1 0.6132 0.7729 0.1243
Peppers 0.549 0.5189 0.0951 Grass 1 0.8522 1.1713 0.2491
Наиболее заметным артефактом, характерным для изображений, сжатых методом JPEG с высоким значением коэффициента компрессии, является «блочность» - изображение рассыпается на блоки размером 8x8 отсчётов. Поскольку предложенный в данной главе метод «достраивания» предназначен для повышения качества восстановления изображений, в том числе после компрессии методом JPEG, целесообразно сравнить результаты его работы с известными алгоритмами деблокинга (устранения «блочности»).
В рамках диссертационной работы качество восстановления изображения с помощью фильтра-корректора сравнивалось с результатами, полученными известными программными средствами Jpeg Enhancer 1.8 и VirtualDub MSU Smart Deblocking Filter 0.8. Обе программы, как и описанный корректирующий фильтр, улучшают качество восстановления изображения по показателю PSNR. Однако фильтр-корректор позволяет получить лучшее качество восстановления изображений по сравнению с методами устранения «блочно-сти», применяемыми в указанных программах (рис. 6).
ЗАКЛЮЧЕНИЕ
В диссертационной работе получены следующие основные результаты:
1. Предложена общая идея решения задачи повышения качества изображений, восстановленных после компрессии произвольными методами сжатия с потерями, основанная на обработке поля ошибок, порождаемых на выходных изображениях этими методами. Представлена соответствующая схема обработки данных. Описана общая методика проведения анализа эффективности предлагаемого метода.
2. Предложен метод повышения качества изображений, восстановленных после компрессии с потерями, основанный на независимой обработке поля ошибок. Метод основан на квантовании и статистическом кодировании поля ошибок. Предлагаемый метод позволяет обеспечить контроль максимальной ошибки восстановления для произвольного метода компрессии с потерями. Для эффективного кодирования поля квантованных ошибок предложено применять двухпотоковый кодер, представляющий собой комбинацию адаптивного арифметического кодера и КДС.
3. Разработана методика проведения исследований эффективности работы предложенного метода. Получены результаты исследования эффективности работы метода на наборах полутоновых и полноцветных изображений по двум критериям: изменение максимальной ошибки и PSNR. Результаты исследования показали, что предложенный метод позволяет существенно (в два и более раз) уменьшить максимальную ошибку восстановления при том же коэффициенте компрессии для исходных методов сжатия JPEQ и JPEG2000.
4. Предложен метод повышения качества изображений, восстановленных после компрессии с потерями, основанный на построении оценки поля ошибок с учетом зависимости между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии, заключающийся в построении корректирующего фильтра, аппроксимирующего поле ошибок восстановления. Рассмотрены три типа функций аппроксимации, применяемых при построении фильтра: линейные, кусочно-линейные и кусочно-постоянные функции. Предложен метод построения фильтра с кусочной функцией аппроксимации. Решена задача уменьшения объёма дополнительных данных с помощью равномерного квантования коэффициентов аппроксимации, получено аналитическое выражение для вычисления количества бит, требуемого для представления одного коэффициента. Рассмотрены три системы признаков, используемые для построения фильтра. Описан алгоритм формирования на основе этих систем оптимальной системы признаков.
5. Разработана методика проведения исследований эффективности работы предложенного метода. Получены результаты исследования эффективности работы корректирующего фильтра. Наилучший результат восстановления изображений обеспечивает
PSNR
_Lena
—•— JPEG -й— JPEG + MSU Smart Deblocking -Ж— JPEG + JpegEnhancer
—»-- JPEG + Фильтр-корректор
Рис. 6 - Зависимости PSNR(KC ), построенные для изображения «Lena», восстановленного после JPEG
фильтр с кусочно-линейной функцией аппроксимации, построенный для системы признаков, основанной на линейных сглаживающих фильтрах, для любого из рассмотренных методов базовой компрессии (JPEG, HGI или JPEG2000). Также проведено сравнение результатов работы корректирующего фильтра с процедурами устранения «блочности» при восстановлении изображений после базовой компрессии JPEG. Фильтр-корректор позволяет получить лучшее качество восстановления изображений по показателю PSNR по сравнению с известными методами деблокинга.
Основные положения диссертации опубликованы в изданиях, рекомендованных БАК:
1. Сергеев В.В., Тимбай Е.И. Метод контроля максимальной ошибки компрессии //Компьютерная оптика, Том 31, №3, 2007, стр.83-85.
2. Sergeev V.V., Timbay E.I. Universal method for controlling maximum errors in image compression //Pattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications, 2008, Vol. 18, No. 4, pp. 691-693.
В прочих изданиях:
1. Сергеев В. В., Тимбай Е. И., Чернов А. В. Разработка адаптивных методов повышения качества изображений после компрессии // Труды научно-технической конференции с международным участием «Перспективные информационные технологии в научных исследованиях, проектировании и обучении «ПИТ-2006», Самара, 29-30 июня 2006, том. 2, с. 123-127.
2. Сергеев В. В., Тимбай Е. И., Чернов А. В. Адаптивные методы повышения качества изображения после компрессии // Сборник трудов всероссийского семинара по моделированию, дифракционной оптике и обработке изображений, Самара, 3-7 июля 2006, с. 38-41.
3. Sergeev V.V., Timbai E.I. Universal Method of a Maximum Restoration Error Control at Image Compression // Proceedings of 8-th International Conference on Pattern Recognition at Image Analysis: New Information Technologies. Yoshkar-Ola, October, 8-13, 2007. Vol.2. Pp. 151—153.
4. Sergeev V.V., Timbay E.I. The investigation of image local feature sets in a problem of image enhancement after compression // Proceedings of 9-th International Conference on Pattern Recognition and Image Analysis: New Information Technologies, Russian Federation, Nizhni Novgorod, September 15—19, 2008, Vol.2, pp. 155-158.
5. Тимбай Е.И. Адаптивное повышение качества изображения при восстановлении после компрессии // Всероссийская молодежная научная конференция с международным участием «X Королевские чтения», 6-8 октября 2009 г., с. 321.
6. Тимбай Е.И. Адаптивное повышение качества изображений после компрессии // Всероссийская конференция «Проведение научных исследований в области обработки, хранения, передачи и защиты информации». Ульяновск, 2009, с. 401-409.
7. Тимбай Е.И. Применение локального корректирующего фильтра для устранения «блочности» на изображениях, сжатых методом JPEG // Труды международной конференция с элементами научной школы для молодежи «Перспективные информационные технологии для авиации и космоса «ПИТ-2010», Самара, 29 сентября - 1 октября 2010, с. 824828.
Подписано в печать 01.11.2010 Усл. печ. л. 1,00. Тираж 100 экз.
Отпечатано с готового оригинал-макета в ГОУ ВПО «Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский университет)» 443086, Самара, Московское шоссе, 34
Оглавление автор диссертации — кандидата технических наук Тимбай, Елена Ивановна
ВВЕДЕНИЕ.
1 Решение задачи повышения эффективности компрессии изображений на основе анализа поля ошибок.
1.1 Постановка задачи.
1.2 Показатели качества методов компрессии.
1.2.1 Показатели качества.
1.2.2 Коэффициент компрессии.
1.3. Методика проведения анализа эффективности метода «достраивания»
1.4 Анализ полей ошибок базовых методов компрессии.
1.5 Выводы и результаты.
2 Метод повышения качества изображений, основанный на независимой обработке поля ошибок.
2.1 Описание метода.
2.2 Эффективное кодирование квантованного поля ошибок.
2.3 Исследование метода.
2.3.1 Методика построения экспериментальных зависимостей максимальной ошибки и Р81\[Е1 от коэффициента компрессии.
2.3.2 Исследование качества восстановления полутоновых изображений при применении метода «достраивания», основанного на независимой обработке поля ошибок.
2.3.3 Исследование качества восстановления полноцветных изображений при применении метода «достраивания», основанного на независимой обработке поля ошибок.
2.4 Выводы и результаты.
3 Метод повышения качества изображений, основанный на применении корректирующего фильтра.
3.1 Описание метода.
3.2 Аппроксимация ошибки восстановления изображения.
3.2.1 Линейная аппроксимация.
3.2.2 Аппроксимация постоянным значением.
3.2.3 Кусочная аппроксимация.
3.2.4 Структура дополнительных данных.
3.2.5 Применение корректирующего фильтра с кусочной аппроксимирующей функцией.
3.2.6 Правило завершения процесса построения кусочной аппроксимирующей функции.
3.2.7 Квантование коэффициентов аппроксимации.
3.3 Формирование признаков на изображении.
3.3.1 Система признаков, формируемая из отсчетов восстановленного изображения.
3.3.2 Система признаков, основанная на линейных сглаживающих фильтрах.
3.3.3 Система признаков, описывающая форму изображения в окне обработки.
3.3.4 Выбор оптимальной системы признаков.
3.4 Исследование метода.
3.4.1 Методика построения экспериментальных зависимостей ТУТ? от коэффициента компрессии.
3.4.2 Исследование качества восстановления полутоновых изображений при применении метода «достраивания», основанного на построении фильтра-корректора.
3.4.3 Исследование качества восстановления полноцветных изображений при применении метода «достраивания», основанного на построении фильтра-корректора.
3.4.4 Сравнение результатов работы корректирующего фильтра с процедурами деблокинга при восстановлении изображений после базовой компрессии JPEG.
3.5 Выводы и результаты.
Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Тимбай, Елена Ивановна
Актуальность темы
Цифровые изображения, получаемые современными средствами регистрации информации, передаваемые по каналам связи и обрабатываемые на компьютерах, как правило, характеризуются чрезвычайно большими объёмами данных. Это приводит к возникновению ряда серьезных проблем, которые должны решать разработчики и пользователи прикладного программного обеспечения. Возможность работы с изображением, затрудняется из-за недостаточной ёмкости запоминающих устройств, ограниченной пропускной способности каналов передачи данных, недостаточного быстродействия вычислительных машин, т.е. ограничивается техническими характеристиками используемой аппаратуры. Компрессия (сжатие) изображений ориентирована на решение подобных проблем за счёт сокращения объёма данных, требуемого для представления цифрового изображения.
Компрессия изображений может рассматриваться также как «технология расширения возможностей». Она является естественным способом поддержания увеличивающегося разрешения современных устройств ввода изображений, а также возрастающей сложности широковещательных телевизионных стандартов. Компрессия изображений играет существенную роль во многих разнообразных и важных применениях, например, при организации видеоконференций, в системах дистанционного зондирования, при формировании изображений документов, обработке медицинских изображений, при факсимильной передаче графических и текстовых данных.
Таким образом, задача компрессии изображений является актуальной для многих современных приложений информатики. Изучению различных аспектов проблемы компрессии посвящены труды большого числа российских ученых: Д. С. Лебедева, H. Н. Красильникова, Ю. М. Штарькова, В. В. Сергеева, Ю. Г. Васина и др., а также зарубежных: Р. Грехема (R. Graham), Дж. О. Лимба (J. О. Limb), У. Претта (W. Pratt), А. Джайна (A. Jain), M. Кунта (M. Kunt) и др.
Наиболее перспективными методами компрессии, предлагаемыми сегодня на рынке информационных технологий, являются методы, основанные на сжатии с потерями, позволяющие получить значительную степень компрессии при некоторых допустимых искажениях исходных изображений (сжатие на основе предсказания [4, 8, 29], фрактальное сжатие [55], вейвлетная компрессия [43], сжатие на основе дискретных ортогональных преобразований [56]). Однако, судя по продолжающимся разработкам в этой области, известные методы не в полной мере удовлетворяют пользовательским требованиям. В то же время, основная масса пользователей проявляет разумный консерватизм и не торопится отказываться от существующих стандартных форматов сжатия (JPEG, JPEG2000 и т.п.) в угоду, как правило, незначительным преимуществам новых методов. Поэтому, наряду с задачей разработки новых методов компрессии изображений, актуальной является задача «достраивания» известных методов таким образом, чтобы пользователь, продолжая их использование, получал повышенное качество компрессии. В рамках данной диссертации повышение эффективности компрессии предлагается обеспечить за счёт дополнительной обработки поля ошибок, порождаемых на исходном сжимаемом изображении стандартными методами компрессии. Результат такой обработки может быть использован при декомпрессии изображения для улучшения его качества.
Цель и задачи исследований
Целью диссертации является разработка и исследование методов, применяемых совместно с любыми известными методами компрессии изображений с потерями (базовыми методами) с целью повышения качества восстановления изображений после компрессии. Для достижения этой цели в диссертации решаются следующие задачи:
1) Разработка подхода к повышению качества изображений после компрессии, основанного на обработке поля ошибок, возникающих после базовой компрессии. Здесь под обработкой поля ошибок понимается формирование его приближенного компактного описания.
2) Разработка метода повышения качества изображений, основанного на независимой обработке поля ошибок. Разработка и исследование входящих в его состав алгоритмов преобразования данных: квантования и статистического кодирования.
3) Разработка и исследование метода повышения качества изображений, основанного на построении оценки поля ошибок восстановления с использованием зависимости между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии. Разработка и исследование входящих в состав данного метода алгоритмов: построение функции, аппроксимирующей поле ошибок восстановления; выбор системы признаков — аргументов аппроксимирующей функции; обработка коэффициентов аппроксимации с целью их компактного представления.
4) Экспериментальное исследование эффективности разработанных методов и входящих в их состав алгоритмов преобразования данных, выработка рекомендаций по использованию результатов диссертации.
Методы исследований
В диссертационной работе используются методы математического анализа и алгебры, теории вероятностей и статистического анализа, теории информации, теории цифровой обработки сигналов и изображений.
Научная новизна работы
Предложен подход к решению задачи повышения качества изображений, восстановленных после компрессии методами сжатия с потерями, основанный на обработке полей ошибок восстановления.
Предложен метод повышения качества изображений, основанный на независимой (от изображения) обработке поля ошибок, заключающийся в квантовании и статистическом кодировании поля ошибок. Благодаря применению равномерной шкалы квантования, данный метод позволяет обеспечить контроль максимальной ошибки восстановления для любого метода компрессии с потерями, не обладающего таким свойством. Показана целесообразность применения двухпотокового кодера для кодирования поля квантованных ошибок. Получены результаты исследований, показавшие, что предложенный метод позволяет существенно (в несколько раз) уменьшить максимальную ошибку восстановления при том же коэффициенте компрессии для исходных методов сжатия JPEG и JPEG2000.
Предложен метод повышения качества изображений, восстановленных после компрессии методами сжатия с потерями, использующий зависимость между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии, основанный на построении корректирующего фильтра, аппроксимирующего поле ошибок. Предложен метод построения фильтра с кусочной функцией аппроксимации. Задача уменьшения объёма дополнительной информации, описывающей фильтр-корректор с кусочной аппроксимирующей функцией, решена с помощью равномерного квантования коэффициентов аппроксимации; предложен метод вычисления количества бит, требуемого для представления коэффициентов. Получены результаты исследований, показавшие эффективность применения предложенного метода для повышения качества восстановления изображений по показателю PSNR после базовой компрессии JPEG, HGI и JPEG2000.
Практическая ценность работы
Предложенные в диссертационной работе методы, реализующиеловый подход к повышению качества изображений, восстановленных после компрессии произвольным методом сжатия с потерями, могут быть использованы в геоинформационных системах, системах оперативного дистанционного зондирования, базах данных изображений и в других компьютерных системах хранения, обработки и передачи визуальной информации. Разработанные методы позволяют повысить эффективность известных методов компрессии изображений и расширяют сферу их применения.
Реализация результатов работы
Результаты диссертации использованы при выполнении ряда госбюджетных и хоздоговорных НИР в Институте систем обработки изображений РАН и ОАО «Самара-Информспутник».
Апробация работы
Основные результаты диссертации были представлены на следующих конференциях:
- на Всероссийском семинаре по моделированию, дифракционной оптике и обработке изображений, Самара, 3-7 июля 2006 г;
- на Научно-технической конференции с международным участием "Перспективные информационные технологии в научных исследованиях, проектировании и обучении «ПИТ-2006», Самара, 2006;
- на Всероссийской студенческой научно-технической конференции «Прикладная математика и математическое моделирование», Москва, 2007;
- на 8-ой международной конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ), Россия, Йошкар-Ола, 2007;
- на 9-ой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (РОАИ), Россия, Нижний-Новгород, 2008;
- на Всероссийской молодежной научной конференции с международным участием «X Королевские чтения», Самара, 2009;
- на Всероссийской конференции «Проведение научных исследований в области обработки, хранения, передачи и защиты информации», Ульяновск, 2009;
- на Международной конференции с элементами научной школы для молодежи «Перспективные информационные технологии для авиации и космоса «ПИТ-2010», Самара, 2010.
Публикации
По теме диссертации опубликовано девять работ, из них 2 из перечня ведущих рецензируемых научных журналов и изданий ВАК РФ. Работы [18, 19, 20] выполнены автором единолично. В работах [13, 51, 52] автору принадлежит формальное описание общего подхода к повышению качества изображений после компрессии произвольным методом сжатия с потерями и описание основанного на этом подходе метода, позволяющего контролировать максимальную ошибку компрессии. В работе [15] автору принадлежит описание метода, обеспечивающего контроль максимальной ошибки компрессии. В работах [14, 50] автором выполнено описание метода повышения качества изображений, основанного на построении адаптивного локального корректирующего фильтра. Во всех работах автору принадлежат программная реализация и экспериментальные исследования методов и входящих в их состав алгоритмов.
Ниже в тексте диссертации ссылки на работы автора помечены звездочками (*).
Структура диссертации
Диссертация состоит из введения, трех глав, заключения, списка литературы и 6 приложений. Она изложена на 122 страницах машинописного текста (без приложений), содержит 43 рисунка, 11 таблиц, список использованных источников из 59 наименований.
Заключение диссертация на тему "Повышение эффективности компрессии изображений на основе анализа поля ошибок"
Основные результаты диссертационной работы
1. Предложена общая идея решения задачи повышения качества изображений, восстановленных после компрессии произвольными методами сжатия с потерями, основанная на обработке поля ошибок, порождаемых на выходных изображениях этими методами. Представлена соответствующая схема обработки данных. Описана общая методика проведения анализа эффективности предлагаемого метода.
2. Предложен метод повышения качества изображений, восстановленных после компрессии с потерями, основанный на независимой обработке поля ошибок. Метод основан на квантовании и статистическом кодировании поля ошибок. Предлагаемый метод позволяет обеспечить контроль максимальной ошибки восстановления для произвольного метода компрессии с потерями. Для эффективного кодирования поля квантованных ошибок предложено применять двухпотоковый кодер, представляющий собой комбинацию адаптивного арифметического кодера и КДС.
3. Разработана методика проведения исследований эффективности работы предложенного метода. Получены результаты исследования эффективности работы метода на наборах полутоновых и полноцветных изображений по двум критериям: изменение максимальной ошибки и PSNR. Результаты исследования показали, что предложенный метод позволяет существенно (в два и более раз) уменьшить максимальную ошибку восстановления при том же коэффициенте компрессии для исходных методов сжатия JPEG и JPEG2000.
4. Предложен метод повышения качества изображений, восстановленных после компрессии с потерями, основанный на построении оценки поля ошибок с учетом зависимости между элементами поля ошибок и отсчётами изображения, восстановленного после базовой компрессии, заключающийся в построении корректирующего фильтра, аппроксимирующего поле ошибок восстановления. Рассмотрены три типа функций аппроксимации, применяемых при построении фильтра: линейные, кусочно-линейные и кусочно-постоянные функции. Предложен метод построения фильтра с кусочной функцией аппроксимации. Решена задача уменьшения объёма дополнительных данных с помощью равномерного квантования коэффициентов аппроксимации, получено аналитическое выражение для вычисления количества бит, требуемого для представления одного коэффициента. Рассмотрены три системы признаков, используемые для построения фильтра. Описан алгоритм формирования на основе этих систем оптимальной системы признаков.
5. Разработана методика проведения исследований эффективности работы предложенного метода. Получены результаты исследования эффективности работы корректирующего фильтра. Наилучший результат восстановления изображений обеспечивает фильтр с кусочно-линейной функцией аппроксимации, построенный для системы признаков, основанной на линейных сглаживающих фильтрах, для любого из рассмотренных методов базовой компрессии (JPEG, HGI или JPEG2000). Также проведено сравнение результатов работы корректирующего фильтра с процедурами устранения блочности» при восстановлении изображений после базовой компрессии JPEG. Фильтр-корректор позволяет получить лучшее качество восстановления изображений по показателю PSNR по сравнению с известными методами деблокинга.
ЗАКЛЮЧЕНИЕ
Предложена общая идея решения задачи повышения качества изображений, восстановленных после компрессии произвольными методами сжатия с потерями, основанная на обработке поля ошибок, порождаемых на выходных изображениях этими методами. Предложены два варианта реализации общего подхода:
1) метод, основанный на независимой обработке поля ошибок;
2) метод, основанный на построении оценки поля ошибок с учетом зависимости между элементами этого поля и отсчетами изображения, восстановленного после базовой компрессии.
Библиография Тимбай, Елена Ивановна, диссертация по теме Теоретические основы информатики
1. БлохЭ.Л. О передаче бинарной последовательности равномерным кодом //Проблемы передачи информации, № 5, 1960, с. 12-22.
2. Ватолин, Д. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео/Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин -М.: ДИАЛОГ-МИФИ, 2003. -384 с.
3. Ватолин Д., Обухов А., Гришин С. VirtualDub MSU Smart Deblocking Filter //http://www.compression.ru/video/deblocking/smartdeblocking.html
4. Гашников M. В., Глумов Н. И., Сергеев В. В. Информационная технология компрессии изображений в системах оперативного дистанционного зондирования //Известия Самарского научного центра РАН, № 1, 1999, с.99-107.
5. Загоруйко Н.Г. Методы распознавания и их применение. М.: Сов. радио, 1972., 208 с.
6. Лоусон, Ч. Численное решение задач метода наименьших квадратов/Ч. Лоусон, Р. Хенсон. М.: Наука, 1986.
7. Методы компьютерной обработки изображений/Под ред. В.А. Сойфера. — М.: ФИЗМАТЛИТ, 2003.-784 с.
8. Нетравали А., Лимб Дж. Кодирование изображений. Обзор.—ТИИЭР, 1980, т. 68, №3
9. Прэтт У.К., Сакрисон Д.Д., Мусманн Х.Г.Д. и др. Методы передачи изображений. Сокращение избыточности М.: Радио и связь, 1983, 264 с.
10. Прет У. Цифровая обработка изображений: Пер. с англ. М.: Мир, 1982. -Кн.1 - 312 с.
11. Сергеев В.В., Копенков В.Н., Чернов A.B. Сравнительный анализ методов нейронных сетей и иерархической аппроксимации в задачах фильтрации изображений // Автометрия, 2006, том 42, № 2, стр 100-106
12. Сергеев В.В. Применение методологии распознавания образов в задачах цифровой обработки изображений // Автометрия, 1998, № 2
13. Сергеев В.В., Тимбай Е.И. Метод контроля максимальной ошибки компрессии //Компьютерная оптика, Том 31, №3, 2007, стр.83-85.
14. Сергеев В. В., Тимбай Е. И., Чернов А. В. Адаптивные методы повышения качества изображения после компрессии // Сборник трудов всероссийского семинара по моделированию, дифракционной оптике и обработке изображений, Самара, 3-7 июля 2006, с. 38-41.
15. Субботин Д., http://www.compression.ru/sh/aridemo6.rar.
16. Сэломон, Д. Сжатие данных, изображений, звука/Д. Сэломон. М.: Техносфера, 2004. -368 с.
17. Тимбай Е.И. Адаптивное повышение качества изображения при восстановлении после компрессии // Всероссийская молодежная научная конференция с международным участием «X Королевские чтения», 6-8 октября 2009 г., с. 321.
18. Тимбай Е.И. Адаптивное повышение качества изображений после компрессии // Всероссийская конференция «Проведение научных исследований в области обработки, хранения, передачи и защиты информации». Ульяновск, 2009, с. 401-409.
19. Хаффмен Д.А. Метод построения кодов с минимальной избыточностью // Кибернетический сборник, Москва, 1961, вып. 3.
20. Чернов А.В. Информационная технология восстановления изображений, . основанная на принципах распознавания образов // Диссертация насоискание ученой степени кандидата наук. — Самара. -2004.
21. Шеннон К. Работы по теории информации и кибернетике. М.: Изд-во иностр. лит-ры, 1963.
22. Штарьков Ю.М., Бабкин В.Ф. Кодирование длин серии в условиях априорной неизвестности // Аппаратура для космических исследований. Кодирование, сжатие данных, М.: Наука, 1973, с.3-9.
23. ACDSee. Supported File Formats // http://files.acdsystems.com/english/support/fileformats.pdf
24. Adobe PhotoShop // http://www.adobe.com/products/photoshop/photoshop/
25. Advanced JPEG Compressor// http://www.winsoftmagic.com/ajc.html
26. Cutler C. Chapin Differential Quantization of Communication Signals // U.S. patent 2605361, July 29, 1952
27. Farrelle P., Jain A. Recursive blocking-coding-A new approach to transform coding // IEEE Trans Commun (1986), 161-179.
28. Freeware. JPEG2000 Compressor // http://www.anything3d.eom/product/software/freeware.php3#convert
29. Gashnikov M. V. Algorithm for Constructing Optimal Quantization Scale in the Problem of Digital Signal Compression //Pattern Recognition and Image Analysis, Vol.11, No. 1, pp. 161-163, 2001
30. Gashnikov M. V., Glumov N. I., Sergeyev V. V. Compression Method for RealTime Systems of Remote Sensing //Proceedings of 15th International Conference on Pattern Recognition, Barcelona, Vol.3, pp. 232-235, 2000
31. Gray, Karen L. "The JPEG2000 Standard", Paper, Technische Universität München, Feb. 18, 2003
32. Gopinath R.A., Lang M., Guo H., Odegam J.E. Wavelet-Based Post-processing of Low Bitrate Transform Coded Images // In Proc. of Intl. Conf. in Image Processing, Aus-tin, TX, November 1994.
33. Information technology Digital compression and coding of continuous tone still images - Requirements and guidelines // ISO/IEC 10918-1, ITU T.81, Sept. 1993.
34. IrfanWiew //http://www.irfanview.com
35. ISO/IEC 15444-1:2000, Information technology JPEG 2000 image coding system - Part 1: Code coding system, July 31, 2002
36. Jpeg Enhancer — Overview. Improve the quality of your images // http://www.vicman.net/jpegenhancer/index.htm
37. LuraTech. Additional Imaging Solutions. // https://www.luratech.com/en/products/imaging-solutions/additional-imaging-solutions.html
38. Lynch W.E., Reibman A.R., Liu B. Edge compensated transform coding // Proc IEEE ICIP Image Process (1994), 105-109.
39. Malvar H.S., Staelin D.H. The LOT: Transform coding without blocking effects // IEEE Trans Acoust Speech Signal Process (1989), 553-559.
40. Marcellin M.W., Gormish M.J., Bilgin A., Boliek M.P. An Overview of JPEG-2000 // Proceedings of the 2000 IEEE Data Compression Conference, pp. 523541, Snowbird, Utah, March 2000
41. Martin G.N. Range encoding: an algorithm for removing redundancy from a digitised message // Video & Data Recording Conference, Southampton, 1979, pp. 24-27.
42. Max J. Quantizing for Minimum Distortion //IRE Transactions on Information Theory, Vol. 6, pp. 7-12, 1960
43. Moffat A., Neal R., Witten I.H, Arithmetic coding revisited // ACM Transactions on Information Systems, July 1998, 16 (3), pp. 256-294.
44. Pearson D., Whybray M. Transform coding of images using interleaved blocks // Proc IEEE Radar Signal Process (1984), 466-472.
45. Rissanen J.J., Langdon G.G. Arithmetic coding // IBM Journal of Research, Development 23: 146-162.
46. Sergeyev V.V., Chernov A.V. Image Reconstruction Methods Based in the Principles of Pattern Recognition Theory // Pattern Recognition and Image Analysis, 1997, № 4
47. Sergeev V.V., Timbay E.I. Universal method for controlling maximum errors in image compression IIPattern Recognition and Image Analysis. Advances in Mathematical Theory and Applications, 2008, Vol. 18, No. 4, pp. 691-693.
48. The Waterloo Fractal Coding and Analysis Group. Image Repository. Greyscale Set 2 // http://links.uwaterloo.ca/Repository.html
49. University of Southern California. Signal and Image Processing Institute. Electrical Engineering Department. The USC-SIPI Image Database // http://sipi.usc.edu/database/
50. U.S. Patent 5065447, Barnsley Michael F., Sloan Alan D. Method and apparatus for processing digital data //, November 12, 1991
51. Wallace G. The JPEG Still Picture Compression Standard // Communications of the ACM, 1991, Volume 34, Issue 4, pp. 30 44
52. Witten I.H., Neal R.M., Cleary J.G. Arithmetic coding for data compression // Communications of the ACM, vol. 30, № 6, 1987, pp. 520-540.
53. Xiong Z., Orchard M. T., Zhang Y. Q. A Deblocking Algorithm for JPEG Compressed Images Us-ing Overcomplete Wavelet Representation //. IEEE Trans-actions on Circuits and Systems for Video Technology, 7, 433-437.
54. Yang Y., Galatsanos N., Katsaggelos A. Projection-Based Spatially-Adaptive Reconstraction of Block-Transform Compressed Image // IEEE Trans, on Image Processing, Vol. 4, No. 7, pp. 896-908, July 1995.
-
Похожие работы
- Повышение эффективности компрессии статичных изображений
- Разработка быстродействующих алгоритмов компрессии видеоданных с использованием дельта-преобразований второго порядка
- Повышение эффективности компрессии статичных изображений
- Метод компрессии картографических изображений на основе иерархической переиндексации
- Повышение эффективности передачи мультимедийной информации методом чирплет-преобразования
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность