автореферат диссертации по радиотехнике и связи, 05.12.17, диссертация на тему:Разработка и исследование эффективного метода кодирования изображений

кандидата технических наук
Бакшеев, Илья Владимирович
город
Санкт-Петербург
год
1997
специальность ВАК РФ
05.12.17
Автореферат по радиотехнике и связи на тему «Разработка и исследование эффективного метода кодирования изображений»

Автореферат диссертации по теме "Разработка и исследование эффективного метода кодирования изображений"

- 9 КЮЛ 1997

На правах рукописи

Бакшеев Ипья Владимирович

РАЗРАБОТКА И ИССЛЕДОВАНИЕ ЭФФЕКТИВНОГО МЕТОДА КОДИРОВАНИЯ ИЗОБРАЖЕНИЙ .

Специальность 05.12.17. - РАДИОТЕХНИЧЕСКИЕ И ТЕЛЕВИЗИОННЫЕ СИСТЕМЫ И УСТРОЙСТВА

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 1997

Работа выполнена в Санкт-Петербургской государственной .академии аэрокосмического приборостроения.

Научный руководитель - доктор технических наук, профессор Красильников H.H. •

Официальные оппоненты:

доктор технических наук, профессор Белицкий В.И.

кандидат технических наук Манцветов A.A.

Ведущая организация - Научно-исследовательский институт системотехники. Санкт-Петербург.

Защита состоится " 1997 г. в __ ча-

сов на заседании диссертационного совета Д 063.36.03 Санкт - Петербургского государственного электротехнического университета им. В. И. Ульянова (Ленина) по адресу: 197376, Санкт - Петербург, ул. Проф. Попова, 5.

С диссертацией можно ознакомиться в библиотеке СПбГЭТУ

Автореферат разослан с^сл^ 1997 г.

Ученый секретарь диссертационного совета

Егорова С.Д.

о,-:<1 характеристика работы

. •/.■•у.спь темы. С развитием видеокомпьютерных технологий •л •.¡«толы передачи, обработки и хранения изображений при-.г., /г ьоныо возможности и псе более широко используются о . т.' областях науки и техники: для передачи изображений с ■.-.л-сстэоииых спутников Земл.1, для автоматизации технологических п системах мультимедиа, в медицинской диагностике, |'.;''.'.>!--иалистике и т.д.

опссте с тем применение цифровых методов сопряжено с рядом серьезных проблем. Одна из важнейших заключается в необходимости ¡".".пользования широкополосных каналов связи для передачи и носителей информации большого объема для хранения оцифрованных изображений. Многочисленные исследования показали, что изображения," с которыми наиболее часто приходится иметь дело, обладают большой статистической избыточностью вследствие сильной корреляционной связи между значениями смежных растровых элементов. Это обстоятельство указывает на возможность уменьшения числа бит, требуемых для представления изображения.

Данная работа посвящена разработке и исследованию эффективного метода кодирования изображений. Актуальность проблемы обусловлена необходимостью сократить объем данных, записываемых на носитель информации в целях архивации изображений, при ' условии, сохранения высокого качества декодированного изображения. Несмотря на то, что к настоящему времени разработано большое число методов кодирования изображений, ввиду присущих им недостатков, задача разработки эффективного метода кодирования остается по-прежнему актуальной.

Кпль работы. Целью работы является разработка и исследование эффективного метода кодирования изображений, использующего пирамидальные структуры и обеспечивающего высокую степень сжатия, данных при высоком качестве декодированного изображения. ,Ч«П(1чи исследования.

1. Разработка и исследование метода эффективного кодирования и.'.опрая-епий, использующего свойство анизотропии пространствен-• - частотной характеристики (ПЧХ) зрительной системы человека, ¡¡оследоианис влияния типа и протяженности импульсной ха-• •■■ дсиимирующего / интерполирующего фильтра, использу-

еыого в процессе кодирования / декодирования, на величину oj'w-: . ; воспроизведения изображения.

3. Исследование закона распределения значений отсчетов разностных изображений, представляющих уровни пирамиды Лаплас:* и выбор шкалы квантования разностных изображений на меньшое число уровней.

4. Исследование эффективности применения метода кодировал, по Хцффмену данных, подлежащих записи на носитель информации.

5. Разработка и исследование алгоритмов интерполяции, используемых для определения значений отсчетов восстановленного изображения.

6. Экспериментальное исследование эффективности разработанного метода кодирования изображений.

Методы исследования. Для решения указанных задач в диссертационной работе использовались методы статистического анализа и обработки изображений, анализ существующих способов кодирования изображений, методы программирования на алгоритмических языках.

Экспериментальное исследование эффективности разработанного метода кодирования изображений проводилось на ПЭВМ типа I DM PC с использованием методов машинного моделирования.

Новые тучные результаты. В диссертационной работе получены следующие новые научные результаты:

■ 1. Разработан и исследован эффективный метод кодирования изображений, учитывающий свойство анизотропии ПЧХ зрительной системы человека путем использования децимирующего / интерполирующего фильтра с окном прозрачности, согласованным с ПЧХ зрительной системы. Выбрана оптимальная структура дискретизации изображения.

2. Исследована зависимость качества восстановленного изображения от типа и протяженности импульсной характеристики децимирующего / интерполирующего фильтра. Даны рекомендации по* рыбору импульсной характеристики фильтра.

3. Проанализирована эффективность кодирования по Хаффмену данных, подлежащих записи на носитель информации с целью архивации.

4. Исследован закон распределения значений отсчетов разностных изображений, представляющих уровни nnpat.nv.ij. Выбрана шкала квантования разностных изображений на меньшее число /¡ осп.:!'.

5. Проанализир твана зависимость формы амплитудно-частотной характеристики (АЧХ) интерполятора, применяемого для вычисления значений отсчетов восстановленного изображения, от протяженности интерполяционной функции sinc(x) и даны рекомендации по выбору ее параметров.

6. Разработан и исследован алгоритм адаптивной интерполяции отсчетов восстановленного изображения, позволяющий сократить вычислительные и временные затраты на этапе восстановления значений декодированного изображения.

7. Разработаны алгоритмы и программы, позволяющие выполнить моделирование и оценить эффективность предложенного метода кодирования изображений.

Практическая ценность. Разработанный в диссертационной работе метод кодирования изображений позволяет осуществлять эффективное сжатие оцифрованных изображений при их архивации и межет быть использован при создании графических банков данных, для экономичной передачи изображений по электронной почто и т.д.

Разработанные алгоритмы и программы, моделирующие эффективный метод кодирования, могут быть использованы для создания пакета программ, позволяющего реализовать данный метод в среде Windows.

Внедрение результатов работы. Основные теоретические и экспериментальные результаты диссертационной работы использованы при выполнении НИР с номером гос. регистрации 53-00-229-2, а также внедрены в НИИКИ ОЗП в системе анализа изображений, что подтверждается соответствующими актами.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на 50 - он юбилейной научно - технической конференции, посвященной 100 - летию изобретения радио, С.-Петербург, 1995 г.; 51 - ой научно - технической конференции, посвященной Дню радио, С.-Петербург, 1996 г.; международной научно - технической конференции "Цифровые технологии в кино и телевидении", Россия, С.-Петербург, 1996 г.

Публикации. Основные положения диссертации изложены' в 6 публикациях, в том числе в 2 статьях и 4 тезисах докладов.

Структура и объем работы. Диссертационная работа состоит из введения, пяти разделов, заключения, списка литературы, включающего 96 наименований, 2 приложений. Основная часть работы изло-

жена на 142 страницах машинописного текста. Работа содержит 51 рисунок и 18 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении дано обоснование актуальности и практической значимости рассматриваемой проблемы - эффективного кодирования изображения. Сформулирована цель работы, решаемые задачи, кратко описано содержание глав диссертационной работы.

Первый раздел посвящен анализу состояния проблемы кодирования изображений, обзору известных методов кодирования, рассмотрению функциональной модели зрительной системы, а также выбору критерия, в соответствии с которым в данной работе оценивается степень искажения восстановленного изображения.

Хранение изображений в цифровой форме затруднено из-за большого объема кода, который необходимо при этом записать на носитель информации. В связи с этим проблема статистического кодирования остается наиболее важной в телевидении и видеокомпьютерных технологиях. Как показали многочисленные исследования, изображения, наиболее часто встречающиеся на практике, обладают большой статистической избыточностью вследствие сильной корреляционной связи между значениями смежных растровых элементов.

Первые методы кодирования, которые принято называть "методами первого поколения", такие как ДКИМ, кодирование с преобразованиями и другие, базируются на использовании свойства пространственной корреляции отсчетов оцифрованного изображения и практически не используют свойств зрительной системы человека.

Следующим этапом в развитии методов кодирования изображений стало появление методов второго поколения, учитывающих в процессе обработки свойства зрительной системы. Одно из главных отличий между методами первого и второго поколений заключается в следующем. Кодирование изображений в своей основе производится в два этапа: в начале массив значений элементов изображения преобразуются в последовательность сообщений, а затем этим сообщениям ставятся в соответствие кодовые слова. В методах первого поколения делался упор на втором этапе, тогда как в методах второго поколения внимание акцентируется на первом этапе, с учетом

свойств зрения, и полученные при этом результаты используют для второго шага. В первом разделе рассмотрены четыре метода второго поколения: кодирование наоснове выращивания областей; кодирование на основе разложения по направлениям; вейвлет преобразование и пирамидальный метод кодирования, алгоритм работы которого послужил основой для разрабатываемого метода.

Суть пирамидального метода кодирования заключается в разбиении исходного изображения на частотные компоненты путем последовательных фильтраций и их последующей компрессии. Высокочастотные компоненты вследствие слабой чувствительности зрения к высокочастотным составляющим квантуются на меньшее число уровней, а низкочастотные компоненты могут быть представлены меньшим числом элементов согласно двумерной теореме отсчетов. Полученные таким образом составляющие кодируются и записываются на носитель информации.

Для восстановления изображения используют интерполяционные фильтры, которые применяются для компенсации децимаций, внесенных на этапе кодирования. Когда все уровни пирамиды декодированы, и интерполированы для достижения первоначального разрешения, их поэлементная сумма дает декодированное изображение.

В заключительной части раздела рассмотрены критерии, позволяющие оценить степень искажения восстановленного изображения. В данной работе были использованы критерии верности, основанные на оценках нормированных средних квадратов ошибок.

Во вторам разделе изложены научные аспекты, позволившие усовершенствовать классический алгоритм пирамидального метода кодирования и на его основе разработать новый метод. Основной предпосылкой для усовершенствования, явилось свойство анизотропии пространственных спектров реальных изображений. Как известно, изолинии, характеризующие их форму, напоминают фигуру близкую ромбу, оси симметрии которого совпадают с координатными осями V*х, у^ частотной плоскости. Данное свойство спектров обусловлено наличием на изображении большого числа вертикальных и горизонтальных границ пследствие того, что предметы реального мира находятся в по1,а лонного тяготения. Указанная особенность спектров изображений нашла свое отражение в свойствах зрительной системы человека. Сходная анизотропия была обнаружена и при экспериментальном исследовании ПЧХ зрения, граница которой по форме также

напоминает ромб, как и линии постоянной спектралной интенсивности типовых изображений.

На основании анализа данных, изложенных выше, в данной работе внесено усовершенствование в классический алгоритм пирамидального кодирования, с целью более полного использования свойств зрительной системы человека и статистики кодируемых изображений. Для построения пирамиды Лапласа (этап кодирования) и декодирования исходного изображения использована импульсная характе-* ристика, ориентация "окна" которой согласована с формой ПЧХ зрительной системы. При этом "окно прозрачности" децимирующего и интерполирующего фильтров имеет форму ромба, оси симметрии которого совпадают с осями и у/у.

При таком согласовании окна прозрачности фильтров с формой ПЧХ зрения (а следовательно и с формой спектра типичных телевизионных изображений), было достигнуто двукратное уменьшение его площади по- сравнению со случаем использования квадратного окна прозрачности при условии обеспечения требуемой частоты среза и,.р. Полезным следствием данного усовершенствования явилась возможность использования вдвое меньшего числа отсчетов для представления изображения, полученного после обработки фильтром с окном прозрачности такой формы. АЧХ такого фильтра должна удовлетворять выражению

С помощью преобразования Фурье найдено выражение для импульсного отклика фильтра, окно прозрачности которого согласовано с формой ПЧХ зрительной системы и пространственным спектром обрабатываемого изображения

О в остальных случаях.

'ср.

1 зт(л:(х+у)/4Дд) ат(и(у-х)/4Дд)

Мх.у)-

•X'

■к-

8Ддг я(х+у) /4Д;

л(у-х) /4Дд

Полученное выражение для импульсной характеристики фильтра является неразделимой функцией в отношении пространственных ко-

ординат х и у Вместе с тем, на практике важно иметь возможность проводить раздельную обработку изображения: сначала, например, вдоль оси х, а затем вдоль оси у, что позволяет существенно сократить объем вычислений, а следовательно и время, затрачиваемое на их выполнение. Для получения выражения для импульсной характеристики с разделяющимися переменными был использован прием поворота системы координат на,угол 45° против часовой стрелки.. При. этом в новой системе координат

х'-(х+у)//2, ■ у' = (-х+у)/У2.

*х+1Уу)/У^ 1Уу '-(-»*

С учетом приведенных выше соотношений, выражение для импульсной характеристики фильтра в новой координатной системе принимает следующий вид

1 зЫпГ/2\'Щ) З1п(лу'/2|^2ДЛ)

Ь (х *, у') - -*-*-.

8Дд 2 Ш' /2(/2Дд ) (Пу' /2/2Дд)

АЧХ фильтра, ориентация окна прозрачности которого согласована с формой ПЧХ зрительной системы, может быть таким образом записана как

■ (1 при |»»/|<*Ср/^. |иу' \<чср/2, К(их *. ну') - <

I 0 в остальных случаях.

Задача синтеза цифрового фильтра с импульсной характеристикой требуемой формы (1ф(х,у) решена с использованием метода взвешенного суммирования, Иф(х,у) находится путем суммирования значений импульсных откликов д(х,у), совпадающих с распределением прозрачности в апертуре реального датчика сигнала с определенными весовыми коэффициентами Ьпк, которые могут принимать как положительные, так и отрицательные значения,

оо оа

Ьф (х. у)-Е Е }1пк*ИэЛ(х+пДзл,у+кДэЛ), к--™

где Дзл - величина, соответствующая расстоянию между точками взятия отсчетов на изображении (полагаем Дэл одинаковыми вдоль осей х и у). При этом в силу вещественности АЧХ фильтра

1»ф(х.у)-Ьф(-х.-у).

Для возможности практического использования были наложены ограничения на протяженность импульсной характеристики. В связи с этим в данном разделе подробно рассмотрен вопрос о зависимости формы АЧХ фильтра от протяженности его импульсной характеристики. выраженной в числе отсчетов. Проведенные исследования показали, что ограничение протяженности импульсной характеристики фильтра является причиной неравномерности АЧХ Кф(их,0) в полосе О<1»х/|0д<1, а также снижения крутизны среза. Однако при числе коэффициентов N5)11, форма АЧХ фильтра в достаточной степени приближается к идеальной, и для решения ряда задач можно ограничиться указанным числом коэффициентов импульсной характеристики.

В заключительной части раздела рассмотрена задача передискретизации изображения, подлежащего кодированию с целью перехода от ортогональной к шахматной структуре дискретизации, которая является наиболее эффективной, с точки зрения плотности упаковки основного и побочных спектров на частотной плоскости при ромбовидной форме спектра дискретизируемого изображения. Для перехода к шахматной структуре дискретизации, которая позволяет в два раза уменьшить число отсчетов, требуемых для представления изображения, проводится его вторичная дискретизация путем перемножения изображения, имеющего ортогональную структуру расположения отсчетов, с дискретизирующей функцией вида

О) со

0(х,у)-Д;Д Е Е 8(х-2пД.<-кДх) хб(у-кДу).

В третье/и разделе рассмотрены вопросы.. связанные с реализа- . цией эффективного метода кодирования изображений. Показана необ- . ходимость выполнения предварительной фильтрации исходного изображения, с целью ограничения его спектра, вдоль линий постоянной спектральной интенсивности, поскольку в случае, если спектр исходного изображения отличен по форме от ромба, то при передискретизации неизбежно произойдет наложение основного и побочных

спектров, что в свою очередь приведет к возникновению шума пространственной дискретизации (ШПД).

Согласование окна прозрачности двумерного предварительного фильтра с линиями постоянной спектральной плотности мощности изображения позволило при последующей передискретизации в два раза уменьшить пространственную плотность отсчетов, по сравнению со случаем использования предварительного фильтра, имеющего АЧХ в форме квадрата, при сохранении четкости изображения. Коэффициент передачи предварительного фильтра при этом удовлетворяет выражению

Далее в разделе приведены результаты исследований, проведенных с целью выбора импульсной характеристики децимирующего / интерполирующего фильтра, обеспечивающей наилучшее качество декодированного изображения.

На первом этапе эксперимента было проведено исследование влияния параметров импульсной характеристики на качество восстановленного изображения и ожидаемый коэффициент сжатия при построении четырехуровневой пирамиды Лапласа. В ходе эксперимента были исследованы случаи, когда импульсная характеристика является гауссовой (коэффициент осевой симметрии а - 0.26..0.49), треугольной (а - 0.5), трехнедельной (а - 0.6), а также импульсная характеристика вида з!пс(х).

На этапе декодирования для компенсации внесенных децимаций, был применен интерполирующий фильтр с импульсной характеристикой вида бшсЫ, ''позволяющий, как известно, восстанавливать значения децимированных отсчетов с наперед заданной точностью.

Исследование проводилось с использованием ряда различных типовых изображений размером 256 х 256, проквантованных на 256 уровней. В процессе исследований были оценены искажения, возникающие при разбиении исходного изображения на отдельные частотные компоненты, составляющие пирамиду Лапласа, а также искажения, возникающие на этапе реконструкции изображения. Для перечисленных выше импульсных характеристик были построены четыреху-

0 в остальных случаях.

ровневые пирамиды Лапласа (псевдо-Лапласа), и восстанавливалось исходное изображение. Качество восстановленного изображения оценивалось с использованием нормированной среднеквадратичной ошибки (НСКО) и пикового отношения сигнал/шум (ПОСШ). Были определены значения энтропии уровней пирамиды Лапласа, согласно выражению:

2 55

н~ е гш-ю&т).

I -о

По результатам проведенных экспериментов сделаны следующие выводы.

1. Как для классического алгоритма пирамидального'кодирования, так и для алгоритма кодирования с предварительной пёредиск-ретизацией исходного изображения лучшие качественные показатели восстановленного изображения обеспечиваются при использовании импульсной характеристики б1п(х)/х. НСКО в этом случае равна нулю, это означает, что восстановленное изображение после проведения "разборки" и "сборки" исходного изображения полностью ему идентично.

2. Энтропия первого уровня пирамиды Лапласа в среднем на 3 бит меньше, чем у исходного изображения. Причем эта разница больше при использовании треугольной (а -0,5) и з!пс(х) импульсных характеристик.

Следующий этап эксперимента заключался в исследовании зави- ' симости качества восстановленного изображения и значений энтропии уровней пирамиды Лапласа от их числа (были рассмотрены случаи построения четырех- и трехуровневой пирамиды Лапласа).

. При сравнении качества восстановленных изображений, полученных с использованием классического метода и метода с предварительной передискретизацией, при построении трех- и четырехуровневой пирамиды Лапласа, сделан вывод о том, что при кодировании с использованием трехуровневой пирамиды Лапласа достигается более высокое качество восстановленного изображения.

Далее в разделе рассмотрена проблема выбора положения порогов и уровней квантования, используемых для осуществления процедуры квантования пирамиды Лапласа исходя из требования минимума среднеквадратичной ошибки квантования.

Поскольку среднеквадратическая ошибка квантования равна

Ц.ах ЬО Р,

где к - число уровней квантования, Р( - пороги квантования, а А, - уровни квантования, №(Ь) - плотность вероятности распределения яркости в изображении, то положение уровней квантования А1 и пороговых уровней Р, можно найти, решая задачу о минимуме средкеквадратической ошибки Е, приравнивая нулю производные ёЕ/йР, -0 и йЕ/йк^ -0. Следовательно, для выбора шкалы квантования, являющейся оптимальной для решения задачи квантования пирамиды Лапласа, необходимо определить гистограмму распределения значений отсчетов высокочастотных изображений, представляющих собой уровни пирамиды.

В результате серии экспериментов установлено, что плотность вероятности разностных изображений можно с высокой точностью аппроксимировать' кривой лапласовского типа и, следовательно, для квантования их на меньшее число уровней должна использоваться шкала, согласованная с лапласовской плотностью распределения вероятностей.

Заключительная часть раздела посвящена вопросу выбора кода, используемого для кодирования данных непосредственно перед их записью на носитель информации. В качестве такого кода выбран код Хаффмена, позволяющий минимизировать число бит, требуемое для хранения значений яркости растрового элемента кодируемого изображения, что подтверждено серией экспериментов. Показано, что при использовании кода Хаффмена расход двоичных единиц на хранение значения яркости одного растрового элемента изображения практически равен его значению энтропии.

В четверто/и разделе сформулирована задача интерполяции отсчетов восстановленного изображения и рассмотрены два алгоритма интерполяции, использованные нами с этой целью.

Декодированное изображение имеет шахматную структуру расположения отсчетов. Для приведения полученного изображения к первоначальному виду, который позволяет в дальнейшем использовать для его обработки стандартное аппаратное и программное обеспечение, необходимо осуществить переход от.шахматной к ортогональной

структуре расположения отсчетов декодированного изображения. Данная операция выполняется путем интерполяции "недостающих" отсчетов восстановленного изображения.

Отмечено, что наилучшей для случая, когда спектр ограничен на частоте игр-у(д/2, является интерполяционная функция б!пс(х). Она позволяет производить безошибочное восстановленне отсчетов при условии ее бесконечной протяженности, за счет полного подавления побочных спектров неискаженной передачи основного спектра. При этом интерполяционная формула, для случая дискретного синтеза принимает вид

оо

ШДх/Япр,тДу/дПр)« Е 51п(п.(!г,/дпр-к))/[я(т/япр-к)1* 00

х Е Ьд (пД1(,кДу)><з1п(п(1/яПр-п))/[гс(1/ч1,р-п)].

где - коэффициент преобразования стандарта вверх (в нашем случае чпр-2), . 1,ш,п, к - целые числа.

Исследована зависимость АЧХ дискретного интерполятора ш протяженности интерполяционной функции. Показано, что при числе отсчетов N3)10 АЧХ по форме приближается к идеальной и для решения большинства задач, можно ограничиться таким числом отсчетов интерполяционной функции.

Разработан алгоритм адаптивной интерполяции, дающий хорошие результаты при переходе от шахматной к ортогональной структуре дискретизации. Адаптивный алгоритм предусматривает предварительное обнаружение перепада яркости на изображении и определение его ориентации относительно четырех существующих отсчетов декодированного изображения, имеющего шахматную структуру расположения отсчетов. Дальнейшая интерполяция производится по определенным элементам, выбранным так, чтобы по возможности не исказить фронт яркостного перепада.

Установлено, что применение адаптивного алгоритма более эффективно при интерполяции отсчетов изображения, содержащего большое количество прямых протяженных перепадов яркости (изображение типа "архитектурный ансамбль" в эксперименте), в связи с наличием в алгоритме операции выделения контуров данного типа. Интерполяция _ отсчетов с использованием адаптивного алгоритма

позволила достичь более высокого качества восстановленного изображения (уменьшить значение НСКО на 10 - 15%) по сравнению со случаем использования интерполятора 1-го порядка и значительно сократить время вычислений по сравнению со случаем использования интерполяционной функции sinc(x).

D пяпо/.t разделе рассмотрены методы и результаты моделирования разработанного способа кодирования изображений. Приведено описание программ, написанных на алгоритмическом языке TURBO PASCAL и предназначенных для решения задачи моделирования.

Исследование эффективности разработанного метода (коэффициент сжатия, качественные показатели восстановленного изображения) проводилось на целом ряде изображений размером 256 * 256, с характерными для телевидения сюжетами. Также было проведено сравнение эффективности разработанного метода и классического метода пирамидального кодирования изображений.

В результате исследования получены следующие результаты:

- разработан метод кодирования изображений, который позволил получить большее значение коэффициента сжатия данных (практически в два раза), в сравнении с оригинальным методом пирамидального кодирования, при одинаковом качестве восстановленных изображений, что обусловлено согласованием в разработанном методе ориентации окна прозрачности децимирующего / интерполирующего фильтра с формой ПЧХ зрительной системы, что позволило вдвое сократить число отсчетов, требуемое для представления дискретизиро-ванного изображения;

- показано, что вычислительные затраты при кодировании с использованием разработанного метода лишь в незначительной степени превосходят вычислительные затраты классического метода пирамидального кодирования, что обусловлено наличием небольшого числа дополнительных операций, привнесенных в обработку изображения, подлежащего кодированию: предварительная фильтрация, передискретизация, интерполяция отсчетов восстановленного изображения.

В заключение работы был проведен эксперимент по сравнению эффективности разработанного метода кодирования и стандарта сжатия неподвижных изображений JPEG (Joint Photographie Expert Group). В качестве JPEG кодека использована программа,' встроенная в систему обработки изображений Graphic Workshop for Windows 1.1.

• Анализ результатов исследования показал, что:

- применение разработанного метода эффективного кодирования изображений позволяет получить лучшее качество восстановленного изображения при одинаковом сжатии или большее сжатие при том же качестве восстановленного изображения по сравнению с использованием системы.кодирования JPEG;

. - применение JPEG для кодирования изображений дает худшие результаты по объективным (ПОСШ, коэффициент сжатия) и субъективному (визуальное качество восстановленного изображения) показателям. в частности, при большом сжатии JPEG накладывает на изображение заметную блоковую структуру и в большей степени искажает передачу полей с постоянной яркостью за счет ошибок квантования.

Все изложенное позволило сделать вывод о целесообразности использования разработанного в данной работе метода в качестве альтернативы существующему стандарту сжатия JPEG. Алгоритм данного метода также может быть использован в качестве основы (этап внутрикадрового кодирования) для разработки систем сжатия подвижных изображений.

В заключении сформулированы основные результаты работы, которые состоят в следующем:

1. Разработан и исследован эффективный метод кодирования изображений, учитывающий свойство анизотропии пространственно-частотной характеристики зрительной системы человека путем согласования окна прозрачности децимирующего / интерполирующего фильтра с формой ПЧХ зрения, который позволяет существенно сократить объем данных, подлежащих записи на носитель информации, при архивации изображений. Выбрана оптимальная структура дискретизации кодируемого изображения.

2. Исследована зависимость качества восстановленного изображения от типа и протяженности импульсной характеристики децимирующего / интерполирующего фильтра. Даны рекомендации по выбору импульсной характеристики фильтра.

3. Неизбежно во'-"икающий при передискретизации ШПД устранен путем использования метода предварительной фильтрации исходного изображения, направленного на ограничение его спектра вдоль линий постоянной спектральной интенсивности. Проанализировано выражение для импульсной характеристики предварительного фильтра с целью выбора его параметров.

Исследован закон распределения значений отсчетов разност-¡кч изображений, представляющих уровни пирамиды. Показано, что г:.'-о"л;ость вероятности распределения значений отсчетов разностных i<:yj'j',ta:+.eHiiH с высокой точностью аппроксимируется лапласовским зеленом. 3 связи с этим для квантования пирамиды Лапласа на :.■'.'•:>.!: ее число уровней использовалась шкала, согласованная с лап-.'•асопской плотностью распределения вероятностей.

5. Проанализирована эффективность кодирования по Хаффмену , подлежащих записи на носитель информации. Показано, что

"/.!! использовании кода Хаффмена для кодирования данных, записы--ixr.'.ix на носитель информации, удается достичь 2 - 3 - кратного с-с-.тня при кодировании первого уровня пирамиды (битовое изображение) и 1.5 - 2 - кратного сжатия при кодировании второго уровня пирамиды (двухбитовое изображение).

6. Проанализирована зависимость формы АЧХ интерполятора, ропн'няомого для вычисления значений отсчетов восстановленного ^опр.чжения, от протяженности интерполяционной функции sinc(x) с целью выбора ее параметров.

7. Разработан и исследован алгоритм адаптивной интерполяции, позволяющий осуществить восстановление значений отсчетов декодированного изображения с целью обратного перехода от шахматной к ортогональной системе дискретизации. Показано, что в ряде случаев благодаря высокому быстродействию его использование предпочтительнее, чем использование дискретного интерполятора, имеющего импульсную характеристику типа sinc(x).

8. Разработаны алгоритмы и программы, позволяющие выполнить моделирование и оценить эффективность предложенного метода кодирования изображений.

9. Проведены экспериментальные исследования, подтвердившие высокую эффективность разработанного метода кодирования изображений. Согласно результатам исследований, предлагаемый метод кодирования обладает рядом преимуществ перед существующим стандартом сжатия неподвижных изображений JPEG.

список публикаций по теме диссертации

1. Бакшеев И. В.. Методы кодирования изображений // Ааиро ,-,•-• ский сборник, СПГААП, 1996.-е.

2. Бакшеев И. В. Программная реализация пирамидального мс-ц: кодирования изображений.// Тезисы докладов -50-ой нои/и".. научно - технической конференции, посвященной 100 - лоу.ь^ изобретения радио. Санкт-Петербург.- 1995 - с.40.

3. Бакшеев И. В. Способ повышения эффективности пирамидального метода кодирования изображений // Тезисы докладов 51-ой научно-технической конференций,•Санкт-Петербург. - 1996 - с.51

- 52.

4. Бакшеев И. В. Способ повышения эффективности пирамидального метода кодирования изображений // XXII Гагаринские чтения. Сборник тезисов докладов молодежной научно-технической конференции. 2-6 апреля, МГЛТУ им. К. Э. Циолковского. Москк;.

- 1996 г. .

5. Красильников Н. Н., Бакшеев И.В. Метод сжатия данных для хивации изображений // Изв.ВУЗов, серия Приборостроение. -1996 - N8,9.-0.

6. Красильников Н. Н., Бакшеев И. В. Эффективный метод сжатия данных для архивации изображений // "Пятая Санкт-Петербургская видеоярмарка", Научно-техническая конференция, Те;:ни-1 докладов, часть I "Цифровые технологии о кино и тилеиплс-нии",- 1996 - с. 54.