автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Эффективные алгоритмы обработки и сжатия цифровых изображений и видеоданных на основе вейвлет-пакетного разложения
Автореферат диссертации по теме "Эффективные алгоритмы обработки и сжатия цифровых изображений и видеоданных на основе вейвлет-пакетного разложения"
На правах рукописи
Косткин Иван Вячеславович
ЭФФЕКТИВНЫЕ АЛГОРИТМЫ ОБРАБОТКИ И СЖАТИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ И ВИДЕОДАННЫХ НА ОСНОВЕ ВЕЙВЛЕТ-ПАКЕТНОГО
РАЗЛОЖЕНИЯ
Специальность: 05.12.04 -«Радиотехника, в том числе системы и устройства телевидения»
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
; 3 ОЕЗ ¿ии
005011543
Рязань-2012
005011543
Работа выполнена в ФГБОУ ВПО «Рязанский государственный радиотехнический университет»
Научный руководитель
заслуженный работник ВШ РФ, доктор технических наук, профессор Кириллов Сергей Николаевич
Официальные оппоненты
доктор технических наук, профессор Бехтин Юрий Станиславович
кандидат технических наук Горкин Владимир Николаевич
Ведущая организация
ОАО «Российские космические системы» ■
(г. Москва)
Защита состоится «2»марта 2012 г. в 12 часов на заседании диссертационного совета Д 212.211.04 в ФГБОУ ВПО «Рязанский государственный радиотехнический университет» по адресу: 390005, г. Рязань, ул. Гагарина, д. 59/1.
С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Рязанский государственный радиотехнический университет».
Автореферат разослан «31 » января 2012 г.
Ученый секретарь диссертационного совета кандидат технических наук А.Г.Борисов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В настоящее время наблюдается большой интерес к различным методам обработки и сжатия цифровых изображений и видеоданных. Это связано с развитием таких отраслей науки и техники, как исследование дальнего и ближнего космоса, компьютерная графика, правоохранительная деятельность, цифровое телевидение и др., где информация имеет характер подвижных и неподвижных изображений. При этом различные видеопотоки необходимо хранить и передавать по каналам передачи информации с ограниченной пропускной способностью. Поэтому необходимо применять различные эффективные алгоритмы сжатия данных, с целью экономии места на физических носителях информации и снижения требований к используемым каналам передачи информации. Кроме этого, с развитием цифрового телевидения растет интерес к стандартам сжатия, работающим в реальном масштабе времени, для передачи видеоданных в прямом эфире. Большой вклад в развитие теории обработки и сжатия цифровых изображений и видеоданных внесли отечественные и зарубежные ученые Грузман И.С., Киричук B.C., Претт У., Гонсалес Р., Вудс Р., Фриден Б., Сикорский Д.А., Воробьев В.И., Грибунин В.Г., Добеши И., Ярославский Л.П., Хуанг Т.С., Эклунд Дж.-О., Красильников H.H. и др.
Однако современные алгоритмы обработки цифровых изображений носят в большинстве случаев эмпирический характер и не опираются на адекватную статистическую модель амплитуды яркости точек цифровых снимков. Основное преимущество использования статистических моделей состоит в возможности синтеза различных оптимальных алгоритмов обработки цифровых изображений, а также модернизации существующих алгоритмов гистограммных преобразований, направленных на улучшение визуального качества снимков, получаемых с помощью различных систем регистрации. При этом исследования, посвященные статистической обработке цифровых изображений, в интересах разработки адекватных моделей цифровых изображений до настоящего времени проводились в ограниченном объеме. В связи с этим актуальной является задача разработки адекватной статистической модели амплитуд яркости точек цифровых изображений.
В свою очередь, любая система формирования создает изображение, в котором содержится шум. Шум является неизбежным негативным фактором при решении задач обработки изображений, поэтому для борьбы с ним разработано большое количество методов и алгоритмов. Однако применение тех или иных подходов для борьбы с шумами существенно зависит от их природы и математической модели. Таким образом, необходимо построить их математическую модель, которая позволит синтезировать оптимальные алгоритмы фильтрации различного рода шумов на цифровом изображении.
В настоящее время для сжатия цифровых изображений получил широкое распространение аппарат вейвлет-пакетного разложения (ВПР). Известно, что зрительная система человека воспринимает искажения, вносимые ВПР; в меньшей степени, чем искажения от дискретного косинусного преобразования (ДКП). Декоррелирующие свойства ВПР в основном зависят от выбора базисной функции разложения. В настоящее время известна концепция кратномасштабного анализа, а также алгоритмы сжатия изображений и видеоинформации. Однако в общем случае отсутствуют практические рекомендации по выбору базисной системы для обработки заданного сигнала, а все разрабатываемые алгоритмы основаны на эмпирическом выборе системы разложения. Таким образом, актуальна задача разработки алгоритма сжатия цифро-
вых изображений на основе ВПР с оптимальной базисной системой на каждом уровне разложения. Известные вейвлет-базисы были получены без учета априорной информации об обрабатываемом сигнале, а значит, они не могут обеспечивать минимум среднеквадратической ошибки (СКО) восстановления для конкретного класса сигналов. К тому же базисные функции не позволяют путем параметрического синтеза изменять свои свойства и тем самым повышать качественные характеристики устройств обработки изображений. Исходя из этого, необходимо синтезировать оптимальную базисную систему по критерию минимума СКО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе разработанной статистической модели.
При аппаратно-программной реализации алгоритмов обработки и сжатия цифровых изображений достигнутые характеристики могут значительно отличаться от полученных в ходе экспериментальных исследований. Поэтому большое значение имеет исследование эффективности предложенных алгоритмов обработки и сжатия цифровых изображений при использовании различных форматов представления данных, применяемых в современных процессорах. Кроме того, необходим анализ возможности программной реализации разработанных алгоритмов на современной элементной базе в реальном масштабе времени.
Цель работы. Основной целью данной работы является разработка эффективных алгоритмов обработки и сжатия цифровых изображений на основе статистической модели амплитуд яркости цифровых снимков, обеспечивающих максимальный коэффициент сжатия при заданной ошибке восстановления.
Поставленная цель работы достигается решением следующих задач:
1 Разработать аналитическую статистическую модель функции плотности вероятности (ФПВ) неподвижных цифровых изображений, получить аналитическую запись пространственных корреляционных функций неподвижных цифровых изображений и проанализировать временные корреляционные функции подвижных цифровых изображений, а также проанализировать модель движения объектов, присутствующих на видеопоследовательности, необходимую для построения кадрового предсказателя.
2 Разработать алгоритм сжатия цифровых изображений с применением оптимальной по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления базисной системы из семейства известных вейвлет-функций на каждом уровне ВПР, а также синтезировать оптимальную базисную систему по критерию минимума СКО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе статистической модели.
3 Обосновать алгоритм одновременной фильтрации и сжатия зашумленных цифровых изображений с использованием ВПР и оптимальной функции трешелдинга вейвлет-коэффициентов.
4 Разработать алгоритм сжатия видеоданных на основе ВПР с оптимальным выбором базиса класса Добеши на каждом уровне разложения и разностного кодирования с предсказанием.
5 Оптимизировать разработанные алгоритмы с целью уменьшения вычислительных затрат и проанализировать возможности аппаратно-программной реализации предложенных алгоритмов сжатия видеоданных на современной элементной базе.
Методы исследования. В работе использовались методы статистической радиотехники, математической статистики, матричного исчисления, численные методы
вычислительной математики. Данные теоретические методы сочетались с экспериментальными исследованиями.
Научная новизна. В рамках диссертационной работы получены следующие новые научные результаты:
1 Показана возможность представления аналитической статистической модели цифровых изображений в виде многокомпонентного бета-распределения. Разработана процедура аппроксимации ФПВ многомодового случайного процесса многокомпонентным бета-распределением, которая обеспечивает оценку статистики хи-квадрат в доверительном интервале 5%, с 95% доверительной вероятностью.
2 Доказана целесообразность применения комбинированного критерия для поиска параметров модели ФПВ и функции распределения (ФР) в виде многокомпонентного распределения, который обеспечивает статистику хи- квадрат в доверительном интервале 5%, с 95% доверительной вероятностью.
3 Предложены различные модели взаимного движения фоторегистрирующего устройства и снимаемой сцены, которые возможны при проведении аэровидеосъемки подстилающей поверхности. Показано, что использование данных моделей по сравнению с известным разностным кодированием без предсказания позволит получить выигрыш порядка 5 раз по энергии разностного кадра.
4 Получен оптимальный базис в классе Добеши на каждом уровне разложения по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления. Показано, что применение данного базиса обеспечивает коэффициент сжатия на 18% выше по сравнению со стандартом JPEG при одинаковом качестве восстановления и не уступает JPEG 2000. Однако за счет использования статистического кодирования по Хаффману в предложенном алгоритме в несколько раз снижаются требования к вычислительным затратам по сравнению с JPEG 2000, который использует арифметическое сжатие.
5 Произведен синтез оптимальной базисной системы на основе пространственной автокорреляционной функции (ПАКФ) изображений, разработанной в первой главе, которая обеспечивает на 24% больший коэффициент сжатия по сравнению с базисом в классе Добеши. Показана целесообразность синтеза оптимальной базисной системы на каждом уровне разложения и предложен алгоритм подобного синтеза на основе оценки ПАКФ коэффициентов аппроксимации ВПР. Использование данного подхода позволило дополнительно повысить коэффициент сжатия на 8...9% по сравнению с оптимальным базисом в классе Добеши на каждом уровне разложения.
6 Разработан алгоритм сжатия видеоданных на основе разностного кодирования и ВПР с синтезированной базисной системой. Произведена оптимизация данного алгоритма но количеству разностных кадров между двумя опорными для достижения максимально возможного коэффициента сжатия при одинаковом визуальном качестве восстановления. Показано, что при количестве разностных кадров равном 21 данный алгоритм обеспечивает коэффициент сжатия 50 раз при хорошем визуальном качестве восстановления.
7 Предложен алгоритм сжатия видеоданных на основе ВПР и математической модели предсказания вектора движения, которая представляет собой совокупность разработанных моделей взаимного перемещения фоторегистрирующего устройства и снимаемой сцены. Показано, что использование кадрового предсказателя позволяет получить коэффициент сжатия 80 раз при хорошем качестве восстановления.
Достоверность. Достоверность полученных в диссертационной работе результатов и выводов обеспечивается качественным и количественным сопоставлением
результатов экспериментальных исследований с известными положениями теории обработки и сжатия цифровых изображений и видеоданных.
Практическая ценность работы. Предложенные в работе алгоритмы обработки и сжатия цифровых подвижных и неподвижных изображений могут быть использованы в различных радиотехнических системах (РТС), в частности в системах передачи информации и телевидения, в системах видеоконференций, охранных системах видеонаблюдения, а также при сжатии высокодинамичных видеоизображений. Реализация результатов исследований позволит снизить требования к пропускной способности линии передачи, а также уменьшить необходимый объем запоминающих устройств, что обеспечит улучшение показателей качества всей РТС.
Результаты диссертационной работы нашли применение в разработках ОАО «Российские космические системы» (ФГУП РНИИ «Космического приборостроения) и в учебном процессе ФГБОУ ВПО «Рязанский государственный радиотехнический университет», что подтверждено соответствующими актами.
Основные положения, выносимые на защиту
1 Алгоритм сжатия цифровых изображений с использованием оптимальных по критерию максимума коэффициента сжатия при заданном качестве восстановления базисов класса Добеши на каждом уровне разложения ВПР, который обеспечивает коэффициент сжатия на 24% больше по сравнению с JPEG.
2 Процедура аппроксимации ФПВ и ФР яркости цифровых изображений многокомпонентным бета-распределением по комбинированному критерию поиска параметров модели ФПВ и ФР, позволяющая при эквапизации обеспечить в 1,57 раз меньшую неравномерность гистограмм анализируемых снимков.
3 Алгоритм сжатия видеоданных, работающий в реальном масштабе времени, использующий ВПР с оптимальным базисом на каждом уровне разложения и математическую модель предсказания вектора движения, обеспечивающий коэффициент сжатия до 80 раз при хорошем качестве восстановления исходной видеопоследовательности.
Апробация работы. Результаты работы докладывались на следующих конференциях:
1) 53-СНТК, Рязань: РГРТУ, 2006г.
2) Всероссийская НТК студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и в образовании», г. Рязань: РГРТУ 2007г.
3) 32-я и 33-я научно-практическая конференция «Сети системы связи и телекоммуникации», г.Рязань: РВВКУС 2007, 2008 г.г.
4) Научная сессия МИФИ-2007, Москва: МИФИ, 2007г.
5) Доклады на 9-й, 10-й и 11-й Международной конференции «Цифровая обработка сигналов и ее применение», Москва, 2007, 2008, 2009 г.г.
6) 15-я, 16-я и 17-я Всероссийская научно-техническая конференция «Современное телевидение» М.: ФГУП МКБ «Электрон», Москва, 2008, 2009, 2010 г.г.
7) 5-я МНТК К.Э Циолковский - 150 лет со дня рождения. Космонавтика. Радиоэлектроника. Геоинформатика. Рязань, 2007.
8) Материалы 15-ой Международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». Рязань: РГРТУ, 13-15 февраля 2008 г.
9) 13-я Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов. НИТ, Рязань, 2008
10) 34-я всероссийская научно-техническая конференция «Информационные и телекоммуникационные технологии. Подготовка специалистов для инфрокоммуника-ционной среды» Рязань. 2009.
11)2 Всероссийская НТК «Актуальные проблемы ракетно-космического приборостроения и информационных технологий», посвященная 100-летию со дня рождения М.С. Рязанского, 2-4 июня 2009г.
Публикации. По теме диссертации опубликована 21 работа, из них-4 статьи в журналах из списка ВАК, 17 тезисов докладов на международных и всероссийских конференциях.
Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения, списка литературы из 126 наименований и 2-х приложений. Дис-' сертация содержит 183 е., в том числе 130 с. основного текста. 7 таблиц и 85 рисунков.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность выбранной темы; определены цели и задачи, рассматриваемые в диссертационной работе. Перечислены новые научные результаты, полученные в данной работе; представлены её практическая ценность и апробация, сформулированы основные положения, выносимые на защиту.
В первой главе рассмотрены вопросы разработки статистической модели амплитуды яркости цифровых изображений, включающей в себя ФПВ, ФР и ПАКФ цифровых изображений, модели взаимного движения фоторегистрирующего устройства и снимаемой сцены, которые возможны при проведении аэровидеосъемки подстилающей поверхности, временной автокорреляционной функции (АКФ), а также математической модели формирования шума на цифровом изображении.
Рассмотрим класс изображений, которые получены с помощью аэрофотосъемки ландшафта земной поверхности и различных застроек в градации серого от 0 до 255. Проведенные в рамках работы экспериментальные исследования ФПВ яркости 400 монохромных неподвижных изображений указанного класса в градации серого [0, 255] показали, что в 96 % случаев число ярко выраженных мод не превышает трех, причем 32 % исследованных изображений имели одну моду, 47 % две моды, 17 % три моды и только 4 % содержали четыре или более мод, но при этом общее количество мод не превышало шести (таблица 1).
Таблица 1 - Доля гистограмм изображений с различным содержанием мод
Количество мод 1 2 3 4 Более 4-х
Доля снимков, % 32% 47% 17% 2,8% 1.2%
Проведенные исследования показали, что существует взаимосвязь между числом ярко выраженных мод и типом неподвижного изображения. Анализируя результаты исследований типов гистограмм изображений можно сделать вывод о том, что ФПВ амплитуд яркости точек необходимо аппроксимировать моделью в виде многокомпонентного распределения:
р(п=Х«,Р,(П, (и
(«I
где /?ДК) - ФПВ отдельной компоненты, а: - вес соответствующей компоненты р,(У), при этом должно выполняться условие нормировки = 1.
Анализ плоскости К. Пирсона (рисунок 1) показал, что коэффициенты Д и /?, одномодовых гистограмм распределений яркости изображений, которые получены с помощью аэрофотосъемки ландшафта земной поверхности и различных застроек в градации серого от 0 до 255, в основном (99%) сосредоточены в области 1-го типа на плоскости К. Пирсона.
о о,1 о.: 0,3 о.4 о/> о.? 0,8 о.9 1.п и 1.: Д Для 1-го типа распределе-
ний характерна унимодальная колоколообразная форма ФПВ (о чем свидетельствует и визуальный анализ гистограмм). В качестве моделей аппроксимации ФПВ были проанализированы по критерию согласия хи-квадрат следующие типы распределений: бета-распределение, нормальное, логнор-мальное и гамма-распределение. Усредненные по 100 опытам результаты сравнения
выбранных моделей по критерию согласия хи-квадрат с доверительным интервалом 5% и 95% доверительной вероятностью представлены в таблице 2.
Таблица 2 - Сравнение моделей аппроксимации по количеству принятых гипотез в соответствии с критерием согласия хи-квадрат__
Распределение Нормальное Логнормальное Бета- распределение Гамма- распределение
Принятые гипотезы 74% 65% 89% 60%
Рисунок 1
Из анализа таблицы 2 можно сделать вывод о том, что одномодовые ФПВ изображений рассматриваемого класса с доверительным интервалом 5% и 95% доверительной вероятностью лучше аппроксимируются бета-распределением. Тем более, что нормальное, логнормальное и гамма-распределение определены на интервале (~оо,оо)
или (0,со), что абсолютно не учитывает специфику ограниченности значений амплитуд яркости точек изображений. В свою очередь, бета-распределение определено на ограниченном полуоткрытом интервале (0, 1] и легко масштабируется путем линейного преобразования к интервалу [0, 255], что в отличие от других рассмотренных распределений согласуется с ограниченностью значений яркости рассматриваемых цифровых изображений. Кроме этого, бета-распределение является более гибким в отношении формы ФПВ, т.е. задания коэффициентов асимметрии и эксцесса. В связи с этим в рамках данной работы предложено для аппроксимации ФПВ ¡-ой компоненты
использовать бета-распределение вида:
^ = (2)
где - бета-функция, ц ,\> - параметры бета-распределения, а }' = )'/ ,
Я. =256.
При синтезе алгоритмов обработки изображений в зависимости от поставленной задачи могут использоваться как ФПВ (например, алгоритмы на основе вычисления отношения правдоподобия), так и ФР (например, алгоритмы выравнивания гистограммы яркости точек).
В связи с этим для оценки параметров статистической модели яркости изображений ¡1. V в виде многокомпонентного бета-распределения и соответствующих им весов сг, могут использоваться различные критерии приближения.
Один из возможных критериев приближения основан только на среднеквадра-тической оценке формы ФПВ изображения:
. о)
) - значения гистограммы амплитуд яркости точек цифрового изображения, Ц - центральное значение уровня яркости к -го интервала гистограммной оценки.
Другим возможным критерием приближения для определения параметров модели в виде многокомпонентного бета-распределения является функционал, основанный только на среднеквадратической оценке формы ФР:
= - . (4)
где Г{) - значение ФР гистограммы изображения, - ФР амплитуд яркости
точек отдельной компоненты.
Результаты экспериментальных исследований показали, что поиск параметров модели по критерию (3) обеспечивает недостаточную точность для представления ФР амплитуд яркости точек (только для 12,4% всех анализируемых изображений значения статистики хи-квадрат ФР лежат в пределах 5% доверительного интервала с 95% доверительной вероятностью). Аналогично, при аппроксимации по критерию (4) только для 10,4% анализируемых изображений значения статистики хи-квадрат ФПВ лежат в пределах 5% доверительного интервала с 95% доверительной вероятностью.
В связи с этим предложено для решения данной задачи использовать комбинированный критерий приближения вида:
Г*я=тт(КЪпЛ,+0-К)Ггт), (5)
к.а.р.г
где К =0,1 - весовой множитель, характеризующий вклад каждого из функционалов Г,П1|П и/*21гш . Коэффициент К в выражении функционала (5) позволяет определить
компромисс между необходимой точностью оценки ФПВ и ФР модели в виде многокомпонентного бета-распределения путем изменения значения веса соответствующего функционала. Анализ 400 снимков аэрофотосъемки подстилающей поверхности показал, что минимизация функционала (5) с дополнительным поиском оптимального значения коэффициента К позволяет достичь необходимой точности по критерию согласия х" ПРИ аппроксимации как ФПВ, так и ФР цифровых изображений, при этом из всех анализируемых изображений для 92% (368 изображений) значения статистики /2 ФПВ и ФР лежат в пределах 95% доверительного интервала..
Для примера, на рисунках 2 и 3 приведен случай аппроксимации гистограммы яркости с использованием модели в виде многокомпонентного бета-распределения с количеством шагов гистограммы равным 25, в данном случае число компонент равно
трем « = [0.1240. 0.3240, 0.5343] v = [9.1403, 9.1403, 49.2189], К =0,85.
итог
ц = [12.2643, 12.2643. 41.0342]
й
Hi
1 я
1
11
03 03 04 05 ОБ 07 08 09 Г, ~0 01 02 ОЭ 04 О.Ь 0 6 0 7 Od Ci! /.
Рисунок 2 Рисунок 3
Кроме ФПВ и ФР статистическая модель цифровых неподвижных изображений должна включать в себя описание ПАКФ, которая играет важную роль в определении статистических связей между пикселями на изображении. На основе описания ПАКФ строятся различные алгоритмы декорреляции цифровых изображений.
Для представления статистических связей между элементами изображения используют ПАКФ, которая определяется следующим образом:
| М X
М • А м=ол=и
где М и N - число строк и столбцов цифрового изображения, - сдвиг в пикселях по ширине и высоте изображения соответственно, а ф1(т,п) = ((р(т,п)-т{<р(т,п)})1а1 {(р(т,п)) есть нормированная к дисперсии центрированная случайная величина <р(т,п). Поскольку изображение является нестационарным СП, то т{р(т,п)} и о1 вычисляется только для перекрывающихся частей изображения при построении ПАКФ.
Однако оценка ПАКФ по формуле (6) требует значительных вычислительных затрат, а также разработки сложных алгоритмов аппроксимации двумерных поверхностей, что затрудняет использование этих поверхностей в радиотехнических задачах. Кроме этого, при разработке различных алгоритмов декорреляции на основе ВПР необходимы отдельные сведения о корреляции элементов строк и столбцов.
В связи с этим предлагается оперировать некоторой усредненной ПАКФ. Методика оценки усредненной ПАКФ состоит в том, что для каждой i -ой строки изображения вычисляется функция вида:
j s _
(г) = —YtVi (.'•")-<Pi (i,n+T), i = 1,M , а г e Z ,
Затем полученные АКФ RlVlll (г) усредняются по столбцам:
М ы и
(7)
(8)
Аналогичные действия могут быть проделаны и для столбцов изображения. Полученные таким образом ПАКФ изображения представляют собой монотонно убы-
вающую кривую от т. что объясняется высокой степенью корреляционных связей между соседними пикселями цифрового изображения.
Для поиска функции, аппроксимирующей полученные ИАКФ. были исследованы степенные, гиперболические и экспоненциальные функции. Рассматриваемые функции имеют характерную нелинейную и монотонно убывающую зависимость, что согласуется с формой полученных ПАКФ, кроме этого, указанные функции являются достаточно «простыми» для вычислений и различных преобразований.
В ходе экспериментальных исследований было выявлено, что наименьшая СКО (менее 5%) соответствует функция вида:
(9)
Функции йих(т) и /?счр(г) обеспечивают СКО порядка 6... 10% и 9... 17% соответственно. Кроме этого анализировалась функция вида:
Дл = Л(г)-Д,-(г), (10)
характеризующая степень отличия функции й, (г) от оцененной по формулам (7), (8) /?ч (т) для строк или столбцов. В результате было получено, что функция (10) уникальна для каждого изображения и не повторяется. Данное свойство может быть использовано для предварительной классификации цифровых изображений. 3"4(&!,)[ ! | ,, Ь '■ ® данном случае анализировалась не са-
ма функция Дя , а характеристики ее Фурье спектра (рисунок 4): интенсивность центральной составляющей а2, ширина спектра по уровню 0.99 Дй>,()(,„ и отношение максимальной спектральной составляющей к центральной Ыа. Различным типам подстилающей поверхности соответствуют разные значения этих параметров, так с ростом числа компонент полоса Дй,Л!, уменьшается, а интенсивность центральной составляющей увеличивается.
Единственное отличие наблюдается при количестве компонент равном двум, для этого случая максимальная составляющая в спектре и центральная составляющая не совпадают и в форме 54(гУг,,) наблюдаются ярко выраженные симметричные гармоники.
В рамках построения модели подвижных изображений рассмотрим класс видеопоследовательностей, полученных с борта различных летательных аппаратов (ЛА) и представляющих собой аэровидеосьемку ландшафта земной поверхности и различных застроек в градации серого от 0 до 255. Предлагается рассмотреть следующие возможные типы изменений, происходящих в кадре:
1 Камера движется относительно подстилающей поверхности, совершая разнообразные маневры в горизонтальной плоскости.
Ь \
: а ........;.........ТЛ..(
130 м;
Рисунок 4
'50
, ра
1ыл(х,у), х = М, (А/ + ха)у = Н,^ + у„);
(И)
где / - яркость текущего кадра по первой модели формирования, - предыдущий кадр видеопоследовательности, /о.а - неизвестная добавочная часть, обусловленная попаданием новых объектов в поле зрения камеры, х0, у„ - параметры начального сдвига, обусловленные скоростью перемещения камеры относительно подстилающей поверхности.
2 Камера неподвижна относительно изображения, а на самом изображении присутствуют движущиеся объекты.
Ут'Уо21
(12) 1ал{х,у),х е [О
У 6 [0. Уп 1 и [у« I • М ] ё у <£ ь,, у2 ] Iп [у,,,, уп1 ] В данном случае величина 1.6 представляет собой часть изображения, соответствующую перемещающемуся объекту. Возможны и другие его преобразования (помимо перемещения), такие как растяжение, скос и поворот. В этом случае применяются соответствующие преобразования изображения.
3 Камера движется в вертикальной плоскости и малоподвижна в горизонтальной плоскости.
= I. (13)
где К1 т - коэффициент масштаба. При этом в обшем случае необходимо отдельно учитывать изменение масштаба по л и по у соответственно.
4. Совместное движение в горизонтальной и вертикальной плоскости, а также движение объекта:
Ъ{х,у) = ЩМг[М^1,{х,ут), (14)
где Л/,, М,, М, - операторы применения соответствующего типа изменения, происходящего в кадре.
В результате экспериментальных исследований было показано, что применение комбинированного типа модели предсказания позволяет минимизировать энергию разностного кадра и, следовательно, ошибку предсказания. По сравнению с известным разностным кодированием без предсказания выигрыш получался порядка 5 раз.
При разработке сложных моделей формирования шума, учитывающих влияние-как внутренних шумов системы формирования, так и различных внешних негативных факторов, анализировались модели вида:
1({х, У) = + (х, >•)) • (х,у) + г}2„ (х,у)) ■ ц2о (х,у), (15)
1({х,у) = (11Л,(х,у) ■ (х,у) + г;1а (х,у)) ■ (л,;-) + //2„ (х,у), (16)
1((х,У) = ит(х,у) + /7,„ (л,у)) • ри, (х,у)-р2„ (х,у) + Чг„ (х,у) , (17)
1г(.х,у) = {1ш(х,у) ■ //,„ (*,>■) + Пи, (,х,у) + Пи и,У)) ■ /"ь - (18)
где сг]а - аддитивные внешние шумы, /л1п - мультипликативные внешние шумы, <т,„ - аддитивные шумы системы регистрации, /./,„ - мультипликативные шумы системы регистрации. Необходимо заметить, что внешние и внутренние шумы имеют рачлич-
ную природу формирования и для их фильтрации необходимо использовать различные алгоритмы.
В ходе экспериментальных исследований было определено, что модель формирования шума (17) наиболее адекватно описывает последовательность формирования и наличие аддитивной и мультипликативной составляющей шума на цифровых снимках.
Во второй главе проведена разработка алгоритма сжатия цифровых изображений с применением оптимальной по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления базисной системы из семейства известных вейвлет-функций на каждом уровне разложения. Определена оптимальная базисная система по критерию минимума С КО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе разработанной статистической модели. Обоснован алгоритм одновременной фильтрации и сжатия зашумленных цифровых изображений с использованием ВПР и оптимальной функции трешелдинга вейвлет-коэффициентов.
Осуществлена разработка алгоритма сжатия с разными коэффициентами кп и
gll на каждой ступени вейвлет-разложения, т.е. с оптимизацией используемой базисной системы по критерию (19). Это позволило определить комбинацию базисов на разных уровнях разложения, обеспечивающих наибольший коэффициент сжатия при заданном качестве восстановления:
1
= пих( /(Х'у) ) 7дё М =
= ^81,1 = 1,^,, (19)
(МI
где {...} - размер в битах, - количество анализируемых базисов ВПР. В результате экспериментальных исследований был получен оптимальный базисный вектор класса Добеши с1Ь5 с!Ь2 с!Ы (¡Ы с!Ы с1Ы . Аналогичная процедура проводилась для класса базисных систем симлетов и биортогональных вейвлетов. Однако дальнейшие исследования оптимальных базисных систем показали, что оптимальный базисный вектор класса Добеши обеспечивает минимум СКО восстановления при заданном коэффициенте сжатия. В целом предлагаемый алгоритм состоит из следующих этапов:
1 Выполняется шестиуровневое ВПР сигнала с использованием оптимального базисного вектора, выбранного из класса базисов (в данном случае Добеши) с1Ь5 с!Ь2 с!Ы (1Ы й1Ы ей/ на каждом уровне соответственно.
2 Путем изменения порога задается уровень визуального качества, с которым будет восстановлено изображение после декомпрессии.
3 Осуществляется обнуление всех коэффициентов вейвлет-преобразования IV (.х,у), модуль которых меньше или равен заданному порогу.
4 Производится преобразование полученной на шаге 3 матрицы коэффициентов И'(х,у) в матрицу-строку путем построчного считывания.
5 Примененяется к полученной строке алгоритм кодирования длин серий.
6 Осуществляется обработка полученной на шаге 5 строки алгоритмом кодирования Хаффмана.
Зависимости коэффициента сжатия предложенного алгоритма от числа уровней разложения при одинаковом значении энергии отброшенных коэффициентов представлены на рисунке 5.
Таким образом, предложен алгоритм сжатия неподвижных цифровых изо-
20 --
15
10
д Оптимальный Дэбешн 7 на каждой уровне —Х- - Хаара —9— Добеши 2 J
f " ч
У¿/г"
/ f
f
1
5
N
бражений на основе использования оптимального базисного вектора в классе Добеши на каждой ступени ВИР, который обеспечивает в 1,22 раза более высокое сжатие по сравнению со стандартом JPEG при одинаковом качестве восстановления и не уступает JPEG 2000, при этом на 60-70% снижает требования к вычислительным затратам по сравнению с JPEG 2000,
3 4 Рисунок 5
который использует арифметическое сжатие.
Синтез оптимальной базисной системы проводился на основе ПАКФ изображений, полученной в первой главе, по схеме Малла с отбрасыванием высокочастотных коэффициентов ВПР. В этом случае псевдохарактеристическая функция (ПХФ) сжимаемого изображения записывается в виде:
[/' (jtu)f =
(20)
где Рк(/е;) = (г)) - преобразование Фурье от ПАКФ изображения. Известно, что передаточная функция вейвлет-фильтра / ()о>) должна быть согласована с ПХФ, которая в свою очередь определяется через ПАКФ цифровых изображений, разработанную в первой главе. Анализ результатов сравнения изображений при использовании ВПР с синтезированной базисной системой на каждом уровне разложения и ВПР с оптимизированным фиксированным базисом класса Добеши показал, что выигрыш в коэффициенте сжатия в первом случае составляет порядка 2-3%.
Кроме этого, разработан новый алгоритм совместной фильтрации и сжатия неподвижных цифровых изображений с применением вейвлет-преобразования, который при Ёц, =10 обеспечивает значение ПОСШ выше на 4дБ при подавлении аддитивных и мультипликативных шумов по сравнению с фильтрацией всех коэффициентов ВПР и на 13дБ выше при отсутствии фильтрации.
В третьей главе разработан алгоритм сжатия видеоданных на основе разностного кодирования и ВПР с синтезированной базисной системой. Предложен алгоритм сжатия видеоданных на основе ВПР и математической модели предсказания вектора движения, разработанной в первой главе. Построена функция градационного преобразования для повышения визуального качества неподвижных цифровых изображений. Проведены исследования влияния формата представления чисел на эффективность алгоритмов сжатия специфических видеоданных. Также рассмотрены аспекты практической реализации предложенных алгоритмов с помощью анализа современной элементной базы и выбора наиболее подходящего цифрового сигнального процессора (ДСП), который обеспечивает достаточное быстродействие системы для работы предложенных алгоритмов в реальном масштабе времени
При разработке алгоритмов сжатия видеоданных на основе ВПР и математиче-
1 арзме «рое
Блок улрзепишя лредалютмем
а Комбинированны* Э»лр1мя
предоаззтвль разностного падре
> И ПР«ДСквЭв№ЮГО
Исход-оо изо*Ч>в»к|,ние
Ус1 роист вя •ирворв! дорацт епсмВПР
Блок управлении параметрами Бозмхив сисгеыь ЭЛР
Сжатые «•ме^юю.»
Коэффициент
скои модели предсказания вектора движения целесообразно использовать для предсказания видеокадров разработанные в первой главе модели движения. В целом блок-схема алгоритма сжатия видеоданных представлена на рисунке 6. В результате получено, что разработанный алгоритм Рисунок 6
обеспечивает коэффициент сжатия до 80 раз при хорошем качестве восстановления видеоданных.
Проведен анализ основных параметров ЦСП ведущих мировых производителей. На основе проведенного анализа сделан вывод о том, что современная элементная база позволяет осуществить аппаратно-программную реализацию предложенных в работе алгоритмов сжатия специфических видеоданных в реальном масштабе времени
В заключении приведены основные научные и практические результаты диссертационной работы:
1 Показана возможность представления аналитической статистической модели цифровых изображений в виде многокомпонентного бета-распределения. Разработана процедура аппроксимации ФПВ многомодового случайного процесса многокомпонентным бета-распределением, которая обеспечивает оценку статистики хи-квадрат в доверительном интервале 5% с 95% доверительной вероятностью.
2 Доказана целесообразность применения комбинированного критерия для поиска параметров модели ФПВ и ФР в виде многокомпонентного распределения, который обеспечивает статистику хи-квадрат в доверительном интервале 5% с 95% доверительной вероятностью.
3 Обоснована возможность использования функции (9) для аналитической аппроксимации ПАКФ цифровых изображений с погрешностью менее 5% по средне-квадратическому критерию.
4 Предложены различные модели движения, которые возможны при проведении аэровидеосъемки подстилающей поверхности. Показано, что использование данных моделей по сравнению со стандартным разностным кодированием без предсказания позволит получить выигрыш порядка 5 раз по энергии разностного кадра.
5 Проанализирована АКФ пикселей по времени и получена корреляционная карта видеопоследовательностей рассматриваемого класса, которая позволяет провести разбиение видеопоследовательности на медленно и сильно меняющиеся области. Учитывая данные области, можно производить более эффективное предсказание последующих кадров на основе многоканального корреляционного предсказателя, что позволит получить более высокое сжатие видеоданных при фиксированном качестве восстановления. Показано, что данный алгоритм проигрывает попиксельному (наи-
лучшему) КП на 3...4%. однако требует в среднем в 6.5 раз меньших вычислительных затрат.
6 Проанализированы различные модели формирования шума на цифровом изображении и обоснована наиболее адекватная из них модель, описываемая выражением (17). Проанализированы основные виды искажений цифровых изображений.
7 Получен оптимальный базис в классе Добеши на каждом уровне разложения по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления. Показано, что применение данного базиса обеспечивает на 18% более высокое сжатие по сравнению со стандартом JPEG при одинаковом качестве восстановления и не уступает JPEG 2000. Однако за счет использования статистического кодирования по Хаффману в предложенном алгоритме в несколько раз снижаются требования к вычислительным затратам по сравнению с JPEG 2000, который использует арифметическое сжатие.
8 Произведен синтез оптимальной базисной системы на основе ПАКФ изображений, разработанной в первой главе, которая обеспечивает на 24% больший коэффициент сжатия по сравнению с базисом в классе Добеши.
9 Показана целесообразность синтеза оптимальной базисной системы на каждом уровне разложения и предложен алгоритм подобного синтеза на основе оценки ПАКФ коэффициентов аппроксимации ВПР. Использование данного подхода позволило дополнительно повысить коэффициент сжатия на 8...9% по сравнению с оптимальным базисом в классе Добеши на каждом уровне разложения.
10 Разработан алгоритм одновременной фильтрации и сжатия цифровых изображений, который позволил получить при Ен, =10 значение ПОСШ на 4дБ выше,
по сравнению со случаем фильтрации всех коэффициентов ВПР и на 13дБ выше по сравнению со случаем отсутствия фильтрации. Использование предварительного сжатия в предложенном алгоритме позволило уменьшить вычислительные затраты на 20...30%.
11 Предложена комбинированная функция трешелдинга, которая позволила осуществить сжатие и получить дополнительный выигрыш при подавлении шумов на цифровых изображениях в среднем на 2...4 дБ.
12 Предложена модернизация алгоритма эквализации гистограммы цифровых изображений на основе многокомпонентного бета-распределения, который позволяет выполнять обратные преобразования, а также хранить информацию об исходной ФПВ в виде параметров модели, кроме этого предложенный алгоритм эквализации позволяет получить в 1,57 меньшую неравномерность, чем известный алгоритм выравнивания гистограммы.
13 Разработан алгоритм сжатия видеоданных на основе разностного кодирования и ВПР с синтезированной базисной системой. Произведена оптимизация данного алгоритма от числа разностных кадров для достижения максимального коэффициента сжатия при одинаковом качестве восстановления исходного видеоряда. Показано, что при числе разностных кадров равном 21 данный алгоритм обеспечивает коэффициент сжатия 50 раз при хорошем визуальном качестве восстановления.
14 Предложен алгоритм сжатия видеоданных на основе ВПР и математической модели предсказания вектора движения, разработанной в первой главе. Показано, что использование кадрового предсказателя позволяет получить коэффициент сжатия 80 раз при хорошем качестве восстановления.
15 Проведены исследования влияния формата представления чисел на эффективность алгоритмов сжатия специфических видеоданных. Показано, что использова-
ние более экономичного 32-битного формата представления не приводит к ухудшению характеристик указанных алгоритмов.
16 Проведен анализ современной элементной базы и выбран наиболее подходящий ЦСП, который обеспечивает достаточное быстродействие системы для работы предложенных алгоритмов в реальном масштабе времени.
СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
1 Разработка статистической модели цифровых изображений и помех на цифровых изображениях // Тезисы докладов 53-СНТК, Рязань: РГРТУ, 2006г. - С.4.
2 Косткин И.В. Модификация алгоритмов обработки изображений с учетом предлагаемой статистической модели // Всероссийская НТК студентов, молодых ученых и специалистов «Новые информационные технологии в научных исследованиях и в образовании» г. Рязань : РГРТУ 2007г. С. 128-129.
3 Кириллов С.Н. Косткин И.В. Алгоритм эквализации на основе многокомпонентного бета-распределения яркости изображения // Вестник РГРТА 2007 №21 С. 50-54.
4 Косткин И.В. Алгоритм поровой сегментации с учетом статистической модели цифровых изображений в виде многокомпонентного бета-распределения // 32-я научно-практическая конференция «Сети системы связи и телекоммуникации» г.Рязань: РВВКУС 2007г. С. 179.
5 Кириллов С.Н. Косткин И.В. Алгоритм вейвлет-сжатия неподвижных цифровых изображений с использованием оптимального базиса на соответствующих уровнях разложения // Научная сессия МИФИ-2007.. Москва: МИФИ, 2007г. С. 141-142.
6 Косткин И.В. Алгоритм вейвлет-сжатия неподвижных цифровых изображений // Вестник РГРТА 2007 №20 - С. 110-113.
7 Кириллов С.Н. Косткин И.В. Алгоритм вейвлет-сжатия неподвижных цифровых изображений с использованием оптимального базиса на соответствующих уровнях разложения // Доклады 9-й Международной конференции «Цифровая обработка сигналов и ее применение» Москва, 2007. Т.1. С. 98-101.
8 Кириллов С.Н. Косткин И.В.Алгоритм сжатия видеоданных в реальном масштабе времени с использованием вейвлет-преобразования и разностного кодирования // 15-я Всероссийская научно-техническая конференция «Современное телевидение» М.: ФГУП МКБ «Электрон», 2007г.С.183-185.
9 Кириллов С.Н. Косткин И.В. Алгоритм сжатия подвижных цветных 24-битных изображений в реальном масштабе времени с использованием вейвлет-пакетного разложения //5-я МНТК К.Э Циолковский - 150 лет со дня рождения. Космонавтика. Радиоэлектроника. Геоинформатика. Рязань, 2007. С.
10 В.М Ватутин, И.В. Косткин, С.Н. Кириллов, A.B. Круглов, Н.В. Гусаков. Алгоритм сжатия изображений с адаптацией базиса на каждом уровне вейвлет-пакетного разложения в информационно-управляющих системах для визуального контроля управляемого объекта // Информационно-измерительные и управляющие системы 2007 №7т.5 С.37-41.
11 Кириллов С.Н., Косткин И.В. и др. под ред. Ватутина В.М.. Цифровая обработка сигналов помехоустойчивых космических радиолиний. Модели, алгоритмы и технические средства - М: Радиотехника, 2007.- 96с.
12 Кириллов С.Н., Косткин И.В., Косткина Е.В. Кодирование видеоинформации в реальном масштабе времени с использованием адаптивной компенсации движения // Материалы 15-ой Международной научно-технической конференции «Проблемы
передачи и обработки информации в сетях и системах телекоммуникаций». Рязань: РГРТУ, 13-15 февраля 2008 г.. С.67-68
13 Кириллов С.Н., Косткин И.В. Алгоритм сжатия видеоданных в реальном масштабе времени с использованием оптимального вейвлет-преобразования и разностного кодирования с предсказанием. // 16-я Международная научно-техническая конференция «Современное телевидение». Москва, 2008г. С187-189
14 Косткин И.В. Комбинированный предсказатель для компенсации движения при сжатии видеопоследовательности. // 13-я Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов. Рязань, 2008 С.129-130.
15 Кириллов С.Н. Косткин И.В. Алгоритм сжатия цифровых изображений с использованием синтезированного базиса на каждой ступени вейвлет-пакетного разложения // Доклады 10-й Международной конференции «Цифровая обработка сигналов и ее применение» Москва, 2008. Т.2. С. 480-483.
16 Косткин И.В. Алгоритмы видоизменения гистограммы на основе статистической модели цифровых изображений в виде многокомпонентного бета-распределения. // 33-я Всероссийская научно-техническая конференция «Сети, системы связи и телекоммуникации» Рязань: РВВКУС (Училище связи), 2008.
17 Кириллов С.Н., Косткин И.В. Одновременная вейвлет-фильтрация и сжатие опорного кадра с использованием оптимального базиса класса Добеши на каждой ступени разложения // 17-я Международная научно-техническая конференция «Современное телевидение». Москва, 2009г. С187-189
18 Кириллов С.Н. Косткин И.В. Вейвлет-сжатие и нелинейная обработка неподвижных цифровых изображений с использованием оптимального базиса класса Добеши на каждой ступени разложения // Доклады 11-й Международной конференции «Цифровая обработка сигналов и ее применение» Москва, 2009. Т.2. С. 480-483.
19 Косткин И.В. Алгоритм одновременной фильтрации и сжатия цифровых изображений на основе оптимальной функции трешелдинга // 34-я всероссийская научно-техническая конференция «Информационные и телекоммуникационные технологии. Подготовка специалистов для инфрокоммуникационной среды» Рязань, 2009., ч.1.
20 Ватутин В.М., Круглов A.B., Генералов П.В., Роговской С.Г., Кириллов С.Н., Косткин И.В. Алгоритм сжатия подвижных изображений в реальном масштабе времени на основе вейвлет-пакетного разложения и модели предсказания кадров // Ракетно-космическое приборостроение и информационные технологии 2009-2010. Труды 2 Всероссийской НТК «Актуальные проблемы ракетно-космического приборостроения и информационных технологий», посвященной 100-летию со дня рождения М.С. Рязанского, 2-4 июня 2009г. / под ред. Ю.М. Урлича, A.A. Романова. М.: Радиотехника, 2010. - 272с. - С74-76.
21 Тимошина Н.Е., Снегирев В.М., Ватутин В.М., Полтавец Ю.И., Кириллов С.Н., Бузыканов С.Н., Бердников В.М., Косткин И.В. Система профессиональной подготовки операторов в режиме «Тренаж» для комплекса радиомониторинга // Ракетно-космическое приборостроение и информационные технологии 2009-2010. Труды 2 Всероссийской НТК «Актуальные проблемы ракетно-космического приборостроения и информационных технологий», посвященной 100-летию со дня рождения М.С. Рязанского, 2-4 июня 2009г. / под ред. Ю.М. Урлича, A.A. Романова. М.: Радиотехника,
С.344.
2010.-272с.-С86-91.
Соискатель
И.В. Косткин /
Косткин Иван Вячеславович
Эффективные алгоритмы обработки и сжатия цифровых изображений и видеоданных на основе вейвлег-пакетного разложения
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Подписано в печать 23.01.2012
Формат бумаги 60x84 1/16. Условных печатных листов 1,1. Тираж 100 экз. Заказ № 44.
Участок оперативной полиграфии ГНУ ВНИИМС Россельхозакадемии, 390025, Рязань, ул. Щорса, д. 38/11.
Текст работы Косткин, Иван Вячеславович, диссертация по теме Радиотехника, в том числе системы и устройства телевидения
61 12-5/1663
РЯЗАНСКИЙ ГОСУДАРСТВЕННЫЙ РАДИОТЕХНИЧЕСКИМ
УНИВЕРСИТЕТ
^^ На правах рукописи
е..
Косткин Иван Вячеславович
ЭФФЕКТИВНЫЕ АЛГОРИТМЫ ОБРАБОТКИ И СЖАТИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ И ВИДЕОДАННЫХ НА ОСНОВЕ ВЕЙВЛЕТ-ПАКЕТНОГО РАЗЛОЖЕНИЯ
ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук по специальности 05.12.04 «Радиотехника, в том числе системы и устройства телевидения»
Научный руководитель: Д.т.н., профессор Кириллов Сергей Николаевич
Рязань-2011
СОДЕРЖАНИЕ
ВВЕДЕНИЕ.............................................................................................................................................4
1 РАЗРАБОТКА И ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКОЙ МОДЕЛИ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ВИЗУАЛЬНОГО ВОСПРИЯТИЯ.....13
1.1 Вводные замечания..............................................................................................13
1.2 Разработка модели функции плотности вероятности яркости неподвижных цифровых изображений.......................................................................................,.....17
1.2.1 Классификация гистограмм распределения яркости различных неподвижных изображений.......................................................................................17
1.2.2 Обоснование процедуры аппроксимации гистограммы изображений многокомпонентным бета-распределением..................................................26
1.3 Разработка модели пространственных автокорреляционных функций неподвижных цифровых изображений...............................................................................45
1.4 Разработка модели подвижных изображений....................................................55
1.4.1 Типы моделей подвижных цифровых изображений.............................55
1.4.2 Первый тип модели..................................................................................59
1.4.3 Второй тип модели..................................................................................65
1.4.4 Третий тип модели..................................................................................68
1.4.5 Комбинированный тип модели...............................................................70
1.5 Разработка модели временной автокорреляционной функции подвижных изображений .....................................................................................................................72
1.6 Разработка модели шумов и искажений на цифровых изображениях............77
1.6.1 Основные типы шумов на цифровых изображениях............................77
1.6.2 Обоснование модели формирования шума на
цифровых изображениях..................................................................................80
1.6.3 Основные виды искажений на цифровых изображениях.....................84
1.7 Выводы..................................................................................................................86
2 РАЗРАБОТКА АЛГОРИТМОВ СЖАТИЯ НЕПОДВИЖНЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ВЕЙВЛЕТ-ПАКЕТНОГО РАЗЛОЖЕНИЯ..................................................................88
2.1 Вводные замечания..............................................................................................88
2.2 Алгоритм сжатия изображений на основе оптимального выбора базиса из известных базисных систем..........................................................................................91
2.3 Синтез базиса вейвлет-пакетного разложения по критерию минимума ошибки восстановления исходного изображения при фиксированном коэффициенте сжатия ....................................................................................................................................103
2.3.1 Постановка задачи................................................................................103
2.3.2 Решение задачи синтеза базисной системы........................................107
2.4 Алгоритм одновременной фильтрации и сжатия изображений на основе вейвлет-пакетного разложения.......................................................................................111
2.5 Выводы................................................................................................................124
3 ПРАКТИЧЕСКИЕ АСПЕКТЫ РЕАЛИЗАЦИИ АЛГОРИТМОВ СЖАТИЯ ВИДЕОДАННЫХ С ИСПОЛЬЗОВАНИЕМ ВЕЙВЛЕТ-ПАКЕТНОГО РАЗЛОЖЕНИЯ И РАЗЛИЧНЫХ АЛГОРИТМОВ КОМПЕНСАЦИИ ДВИЖЕНИЯ.......................................................................126
3.1 Вводные замечания............................................................................................126
3.2 Построение функции градационного преобразования для повышения качества визуального восприятия неподвижных цифровых изображений........................131
3.3 Алгоритм сжатия видеоданных с потерями на основе вейвлет-пакетного разложения и разностного кодирования..........................................................................139
3.4 Алгоритм сжатия видеоданных на основе вейвлет-пакетного разложения и математической модели предсказания
вектора движения.....................................................................................................144
3.5 Основные критерии определения качества цифровых
изображений..............................................................................................................146
3.5.1 Классические объективные критерии определения качества цифровых изображений.................................................................................................... 146
3.5.2 Универсальный индекс качества цифровых
изображений...................................................................................................148
3.5.3 Субъективное измерение качества цифровых
изображений...................................................................................................151
3.6 Исследование влияния формата представления чисел на эффективность практической реализации алгоритмов сжатия видеоданных...........................................152
3.7 Аппаратно-программная реализация алгоритмов сжатия видеоданных......153
3.8 Выводы................................................................................................................159
ЗАКЛЮЧЕНИЕ..................................................................................................................................161
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.....................................................................166
ПРИЛОЖЕНИЕ А СПИСОК АББРЕВИАТУР И УСЛОВНЫХ ОБОЗНАЧЕНИЙ..............178
ПРИЛОЖЕНИЕ В КОПИИ АКТОВ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ РАБОТЫ.................................................................................................182
ВВЕДЕНИЕ
Актуальность темы. В настоящее время значительно возрос интерес к различным методам обработки и сжатия цифровых изображений и видеоданных. Это связано с развитием таких отраслей науки и техники как исследование дальнего и ближнего космоса, компьютерная графика, правоохранительная деятельность, цифровое телевидение и др., где информация имеет характер подвижных и неподвижных изображений. При этом различные видео потоки необходимо хранить и передавать по каналам передачи информации с ограниченной пропускной способностью. Поэтому необходимо применять различные эффективные алгоритмы сжатия данных, с целью экономии места на физических носителях информации и снижения требований к используемым каналам передачи информации. Кроме этого с развитием цифрового телевидения растет интерес к стандартам сжатия, работающим в реальном масштабе времени, для передачи видеоданных в прямом эфире. Большой вклад в развитие теории обработки и сжатия цифровых изображений и видеоданных внесли отечественные и зарубежные ученые Грузман И.С., Киричук B.C., Претт У., Гонсалес Р., Вудс Р., Фриден Б., Сикорский Д.А., Воробьев В.И., Грибунин В.Г., Добеши И., Ярославский Л.П., Хуанг Т.С., Эклунд Дж.-О., Красильников H.H. и др. [1... 10].
Однако современные алгоритмы обработки цифровых изображений носят в большинстве случаев эмпирический характер и не опираются на адекватную статистическую модель амплитуды яркости точек цифровых снимков. Основное преимущество использования статистических моделей состоит в возможности синтеза различных оптимальных алгоритмов обработки цифровых изображений, а также модернизации существующих алгоритмов гис-тограммных преобразований, направленных на улучшение визуального качества снимков, получаемых с помощью различных систем регистрации. При этом исследования, посвященные статистической обработке цифровых изо-
бражений, в интересах разработки адекватных моделей цифровых изображений до настоящего времени проводились в ограниченном объеме. В свиязи с этим актуальной является задача разработки адекватной статистической модели амплитуд яркости точек цифровых изображений, которая включает функцию плотности вероятности (ФПВ), функцию распределения (ФР), корреляционную функцию (КФ) а также математическую модель подвижных изображений.
В свою очередь любая система формирования создает изображение, в котором содержится шум. Шум является неизбежным негативным фактором при решении задач обработки изображений, поэтому для борьбы с ним разработано большое количество методов и алгоритмов. Однако применение тех или иных подходов для борьбы с шумами существенно зависит от их природы и математической модели. Таким образом, необходимо построить их статистическую модель, которая позволит синтезировать оптимальные алгоритмы фильтрации различного рода шумов на цифровом изображении.
В настоящее время для сжатия цифровых изображений получил широкое распространение аппарат вейвлет-пакетного разложения (ВПР) [7]. В работах [3, 6] показано, что зрительная система человека воспринимает искажения вносимые ВПР в меньшей степени, чем искажения от дискретного косинусного преобразования (ДКП). Декоррелирующие свойства ВПР в основном зависят от выбора базисной функции разложения. В [7] разработана концепция кратномасштабного анализа, а также алгоритмы сжатия изображений и видеоинформации [3, 6]. Однако в общем случае отсутствуют практические рекомендации по выбору базисной системы для обработки заданного сигнала, а все разрабатываемые алгоритмы основаны на эмпирическом выборе системы разложения. Таким образом, актуальна задача разработки алгоритма сжатия цифровых изображений на основе ВПР с оптимальной базисной системой на каждом уровне разложения.
Известные вейвлет-базисы [7] были получены без учета априорной информации об обрабатываемом сигнале, а значит, они не могут обеспечивать минимум СКО восстановления для конкретного класса сигналов. К тому же, базисные функции не позволяют путем параметрического синтеза изменять свои свойства и тем самым повышать качественные характеристики устройств обработки изображений. Исходя из этого, необходимо синтезировать оптимальную базисную систему по критерию минимума СКО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе разработанной статистической модели.
При аппаратно-программной реализации алгоритмов обработке и сжатия цифровых изображений, достигнутые характеристики могут значительно отличаться от полученных с помощью имитационного моделирования. Поэтому большое значение имеет исследование эффективности предложенных алгоритмов обработки и сжатия цифровых изображений при использовании различных форматов представления данных, применяемых в современных процессорах. Кроме того, необходим анализ возможности программной реализации разработанных алгоритмов на современной элементной базе в реальном масштабе времени.
Цель и задачи работы. Основной целью данной работы является разработка эффективных алгоритмов обработки и сжатия цифровых изображений на основе статистической модели яркости цифровых снимков, обеспечивающих максимальный коэффициент сжатия при заданной ошибке восстановления. Поставленная цель работы достигается решением следующих задач:
ных цифровых изображений и проанализировать временные корреляционных функции подвижных цифровых изображений, а также проанализировать модель движения объектов, присутствующих на видеопоследовательности, необходимую для построения кадрового предсказателя.
2 Разработать алгоритм сжатия цифровых изображений с применением оптимальной по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления базисной системы из семейства известных вейвлет функций на каждом уровне ВПР, а также синтезировать оптимальную базисную систему по критерию минимума СКО восстановления изображения при отбрасывании высокочастотных коэффициентов ВПР на каждом уровне разложения на основе статистической модели.
3 Обосновать алгоритм одновременной фильтрации и сжатия зашум-ленных цифровых изображений с использованием ВПР и оптимальной функции терешелдинга вейвлет-коэффициентов.
4 Разработать алгоритм сжатия видеоданных на основе ВПР с оптимальным выбором базиса класса Добеши на каждом уровне разложения и разностного кодирования с предсказанием.
5 Оптимизировать разработанные алгоритмы с целью уменьшения вычислительных затрат и проанализировать возможности аппаратно-программной реализации предложенных алгоритмов сжатия видеоданных на современной элементной базе.
Методы проведения исследований. В работе использовались методы статистической радиотехники, математической статистики, матричного исчисления, численные методы вычислительной математики. Данные теоретические методы сочетались с экспериментальными исследованиями.
1 Показана возможность представления аналитической статистической модели цифровых изображений в виде многокомпонентного бета-распределения. Разработана процедура аппроксимации ФПВ многомодового случайного процесса многокомпонентным бета-распределением, которая обеспечивает оценку статистики хи-квадрат в доверительном интервале 5%, с 95% доверительной вероятностью.
2 Доказана целесообразность применения комбинированного критерия для поиска параметров модели ФПВ и ФР в виде многокомпонентного распределения, который обеспечивает статистику хи- квадрат в доверительном интервале 5%, с 95% доверительной вероятностью.
3 Предложены различные модели взаимного движения фоторегистри-рующего устройства и снимаемой сцены, которые возможны при проведении аэровидеосъемки подстилающей поверхности. Показано, что использование данных моделей по сравнению с известным разностным кодированием без предсказания позволит получить выигрыш порядка 5 раз по энергии разностного кадра.
4 Получен оптимальный базис в классе Добеши на каждом уровне разложения по критерию максимума коэффициента сжатия при фиксированной ошибке восстановления. Показано, что применение данного базиса обеспечивает коэффициент сжатия на 18% выше по сравнению со стандартом JPEG, при одинаковом качестве восстановления и не уступает JPEG 2000. Однако за счет использования статистического кодирования по Хаффману в предложенном алгоритме в несколько раз снижаются требования к вычислительным затратам по сравнению с JPEG 2000, который использует арифметическое сжатие.
сжатия, по сравнению с базисом в классе Добеши. Показана целесообразность синтеза оптимальной базисной системы на каждом уровне разложения, и предложен алгоритм подобного синтеза на основе оценки ПАКФ коэффициентов аппроксимации ВПР. Использование данного подхода позволило дополнительно повысить коэффициент сжатия на 8...9% по сравнению с оптимальным базисом в классе Добеши на каждом уровне разложения.
6 Разработан алгоритм сжатия видеоданных на основе ВПР с синтезированной базисной системой и разностного кодирования. Произведена оптимизация данного алгоритма от количества разностных кадров между двумя опорными для достижения максимально возможного коэффициента сжатия при одинаковом визуальном качестве восстановления. Показано, что при количестве разностных кадров равном 21 данный алгоритм обеспечивает коэффициент сжатия 50 раз при хорошем визуальном качестве восстановления.
7 Предложен алгоритм сжатия видеоданных на основе ВПР и математической модели предсказания вектора движения, которая представляет собой совокупность разработанных моделей взаимного перемещения фоторе-гистрирующего устройства и снимаемой сцены . Показано, что использование кадрового предсказателя позволяет получить коэффициент сжатия 80 раз при хорошем качестве восстановления.
Достоверность. Достоверность полученных в диссертационной работе результатов и выводов обеспечивается качественным и количественным сопоставлением результатов экспериментальных исследований с известными положениями теории обработки и сжатия цифровых изображений и видеоданных.
Практическая ценность работы. Предложенные в работе алгоритмы обработки и сжатия цифровых подвижных и неподвижных изображений могут быть использованы в различных радиотехнических системах (РТС), в частности в системах передачи информации и телевидения, в системах видео-
конференций, охранных системах видеонаблюдения, а также при сжатии высоко-динамичных видеоизображений. Реализация результатов исследований позволит снизить требования к пропускной способности линии передачи, а также уменьшить необходимый объем запоминающих устройств, что обеспечит улучшение показателей качества всей РТС.
Результаты диссертационной работы нашли применение в разработках ОАО «Российские космические системы» (ФГУП РНИИ «Космического приборостроения) и в учебном процессе ФГБОУ ВПО «Рязанский государственный радиотехнический университет», что подтверждено соответствующими актами.
Основные положения, выносимые на защиту.
1 Алгоритм сжатия цифровых изображений с использованием оптимальных по критерию максимума коэффициента сжатия при заданном качестве восстановления базисов класса Добеши на каждом уровне разложения ВПР, который обеспечивает коэффициент сжатия на 24% больше по сравнению с JPEG.
2 Процедура аппроксимации ФПВ и ФР яркости цифровых изображений многокомпоне�
-
Похожие работы
- Методы и алгоритмо-программное обеспечение вейвлет-анализа статических изображений
- Методы, алгоритмы и устройства для покадрового кодирования и передачи видеоданных по радиоканалам с низкой пропускной способностью
- Методы и алгоритмы вейвлет-кодирования зашумленных изображений в радиотехнических системах
- Алгоритмы вейвлет-анализа и беспороговой фильтрации при SPIHT-кодировании радиолокационных изображений
- Методы и устройства преобразования и квантования вейвлет-спектров при внутрикадровом сжатии цифровых телевизионных сигналов
-
- Теоретические основы радиотехники
- Системы и устройства передачи информации по каналам связи
- Радиотехника, в том числе системы и устройства телевидения
- Антенны, СВЧ устройства и их технологии
- Вакуумная и газоразрядная электроника, включая материалы, технологию и специальное оборудование
- Системы, сети и устройства телекоммуникаций
- Радиолокация и радионавигация
- Механизация и автоматизация предприятий и средств связи (по отраслям)
- Радиотехнические и телевизионные системы и устройства
- Оптические системы локации, связи и обработки информации
- Радиотехнические системы специального назначения, включая технику СВЧ и технологию их производства