автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование и разработка методов обработки видеоинформации для телекоммуникационных целей

кандидата технических наук
Шишенко, Андрей Петрович
город
Санкт-Петербург
год
2004
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка методов обработки видеоинформации для телекоммуникационных целей»

Автореферат диссертации по теме "Исследование и разработка методов обработки видеоинформации для телекоммуникационных целей"

На правах рукописи

ШЕШЕНКО Андрей Петрович

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ

ОБРАБОТКИ ВИДЕОИНФОРМАЦИИ ДЛЯ ТЕЛЕКОММУНИКАЦИОННЫХ ЦЕЛЕЙ

Специальность 05.13.01. - Системный анализ, управление и обработка информации

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург - 2004

Работа выполнена в Санкт-Петербургском государственном университете телекоммуникаций им. проф.М.А.Бонч-Бруевича на кафедре "Инженерная машинная графика"

Научный руководитель -

доктор технических наук, профессор Дегтярев В.М.

Официальные оппоненты:

доктор технических наук, профессор, член - корреспондент РАН

Смирнов Ю.М.

кандидат технических наук, профессор Когновицкий О.С. Ведущая организация: ЛОНИИС

Защита диссертации состоится 01 июля 2004 года в 16-00 часов на заседании диссертационного совета К 219.004.01 Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича

по адресу: 191065, Санкт-Петербург наб.р. Мойки, 61

С диссертацией можно ознакомится в библиотеке Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича.

Автореферат разослан 1 щш,? 2004 г.

Ученый секретарь диссертационного совета, к.т.н., доцент '

В.Х- Харитонов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы.

Перевод систем связи на дискретную основу привел к необходимости поиска новых путей к обработке видеоинформации и передачи изображений по каналам связи.

Цифровые фотоаппараты и видеокамеры начинают проникать в связь. Их интенсивное применение в связи задерживается пропускной способностью каналов связи. Человек воспринимает изображения в области световых частот (700 - 300 нм), разбивая их на элементы (около 127 млн.) с высокой разрешающей способностью (около 160 тыс. на 1 кв. мм). С сетчатки глаза информация поступает в слепое пятно, где обрабатывается и по миллиону нервных волокон параллельно передается для обработки в мозг. Технически реализовать данную схему пока не представляется возможным. В настоящее время передача дискретных изображений на большие расстояния осуществляется следующим образом. Полученное с помощью оптики изображение разбивают на элементы (пикселы) дискретной матрицы, записывают эти пикселы в память, присваивая им численные значения интенсивности (цвета), и затем последовательно передают по каналу связи. При приеме записывают в память и последовательно рисуют изображение на экране. Передача изображений в реальном времени требует мощных и дорогостоящих каналов при сравнительно невысокой разрешающей способности. Можно ускорить передачу изображений, разбивая его на части и каждую часть передавать по отдельному каналу. Можно упрощать дискретное изображение, снижать разрешение, число полутонов или цветов. Можно передавать только изменения в сценах при неизменном фоне. Можно передавать цифровые модели псевдореальных объектов в компактной записи с последующей визуализацией на приемном пункте. Все эти мероприятия ведут к снижению размера передаваемого кода. Качество изображения и размер передаваемого кода имеют н е п о с р е оНАЭТА|МЛф1Я-' а н я я

БИБЛИОТЕКА I

высокое качество изображения, снизить длину передаваемого кода. Устранение избыточности (сжатие) в изображениях и цифровых кодах позволяет уменьшить объем цифровой записи изображения. Наиболее сложно сжимать кадр многоцветного изображения с большим числом мелких неповторяющихся элементов.

Одной из важных проблем является первичная обработка изображения -сокращение его объема за счет удаления избыточности информации, появляющейся из-за двоичного представления и записи информации.

В данной работе рассмотрены и предложены методы сжатия с потерями и без потерь первичной информации сложных многоцветных изображений для передачи их по дискретным каналам связи.

Для дальнейшего развития систем передачи сложных цветных изображений в телекоммуникационных сетях и расширения их возможностей данная работа весьма актуальна.

Цель работы. Целью диссертационной работы исследование возможности эффективного кодирования цветных дискретных изображений и цветовых объектов с использованием цветового анализа и разработка соответствующих методов (алгоритмов) сжатия, цветовых моделей объектов и сцен, пригодных для практического применения в области связи.

Методы исследования. В процессе исследования использовались методы дискретных преобразований изображений, методы моделирования цветовых объектов и сцен, аналитическая геометрия, высшая алгебра, программирование с использованием средств компьютерной графики.

Научные положения, выносимые на защиту:

- Анализ методов кодирования, сжатия изображений, стандартов передачи изображений в телекоммуникационных сетях;

- Методы цветовой фильтрации, цветового анализа и сжатия дискретных цветных изображений, содержащих большое число мелких и неповторяющихся элементов;

- Анализ методов моделирования объектов и сцен и использование их для трансляции компьютерных фильмов и игр в телекоммуникационных сетях;

- Метод алгебраического моделирования цветовых объектов и сцен.

Научная новизна. В процессе решения поставленных задач получены следующие новые научные результаты:

- Определен уровень наличия и состояние разработки методов кодирования и сжатия цветных дискретных изображений, цветовых объектов и сцен с целью использования их в телекоммуникационных сетях;

- Разработаны методы цветовой фильтрации, цветового анализа и сжатия дискретных цветных изображений;

- Предложен метод алгебраического компактного описания цветового объекта;

- Определены дальнейшие пути развития результатов, полученных в данной работе.

Практическая ценность работы. Разработанные и предложенные в данной работе методы и алгоритмы: дают возможность:

- проводить анализ цветных изображений;

- выделять цветовые элементы с целью распознавания цветовых изображений;

- создавать описания сцен, содержащих компактные описания цветовых объектов;

- присваивать объектам дополнительные свойства (твердость, температуру в каждой точке и др.);

- управлять динамикой объектов (изменение формы, ориентации и перемещения с минимальным числом вычислительных операций);

- организовать процесс передачи по каналам связи сцен с динамическими цветовыми объектами в реальном времени.

Реализация результатов работы. Результаты работы использованы в учебном процессе кафедры «Инженерная Машинная Графика» Санкт-Петербургского государственного университета телекоммуникаций им. проф.

5

М.А. Бонч-Бруевича, при проведении научно-исследовательских и проектных работ в ООО НПФ «Беркут».

Апробация работы. Результаты работы докладывались на заседании секции дома ученых им. М. Горького (РАН) «Начертательная геометрия, графика и автоматизация проектирования» в октябре 2002 и мае 2003 года, на 55-ой Научно-технической конференции профессорско-преподавательского состава Санкт-Петербургского государственного университета телекоммуникаций, январь, 2003; на Седьмой международной конференции New Approaches to HighTech: Nondestructive Testing and Computer Simulations in Science and Engineering, июнь, 2003; на заседании кафедры «Инженерная Машинная Графика» Санкт-Петербургского государственного университета телекоммуникаций, март, 2004. Личный вклад автора. Основные научные положения, теоретические выводы, а также результаты компьютерных экспериментов, содержащиеся в диссертационной работе, получены автором самостоятельно.

Публикации. По теме диссертации опубликовано 8 научных работ.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы, включающего 159 наименований и трех приложений. Работа изложена на 155 страницах, содержит 16 рисунков, 11 таблиц, объем приложения составляет 25 страниц.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении содержится обоснование актуальности проблемы сжатия многоцветного кадра изображения без потерь и с управляемыми потерями качества изображения, необходимости разработки методов устранения цветовой избыточности в дискретных изображениях, разработки компактных моделей объектов и сцен, с описанием их свойств и использование этих результатов в системах связи. Определена цель исследований и разработок.

В главе 1 «Цифровая обработка и сжатие дискретных изображений без потерь» рассмотрены три основных графических формата, которые широко используются для кодирования и передачи изображений (BMP, TIFF, GIF). Проведен анализ алгоритмов без потерь таких как RLE, LZ, LZW, JBIG, Lossless

JPEG и алгоритмы Хаффмана, который показал, что основная проблема, которую решают эти алгоритмы, это сокращение длины двоичных кодов, нахождение одинаковых кодов и удаление избыточных нулей. Такой подход к сжатию не дает большого эффекта. Были проведены эксперименты по сжатию изображений при использовании архиватов, имеющих в настоящее время широкое применение. Было выяснено, различные виды изображений по цвету, по разрешающей способности и представленные в различных форматах при сжатии дают различные коэффициенты. Были проведены эксперименты по сжатию трех изображений, представленных в форматах: BMP, TIFF, GIF с разрешением 300 и 1200 dpi, черно-белые, цветные, различные по насыщенности полутонов и цвета. Это черно-белая фотография с большим уровнем полутонов, абстрактная графика с небольшим количеством цветов и градаций и полноцветная фотография с множеством полутонов.

Анализ эффективности сжатия архиваторов показывает, что архиваторы располагаются в следующей последовательности: LZH, ARJ, ZIP и RAR. Архиваторы LZH, ARJ, ZIP имеют приблизительно одинаковые результаты. RAR по отношению к ним сжимает лучше в среднем в 1,3 -1,6 раза. Чем больше размер файла, тем выше коэффициент сжатия. Минимальный коэффициент сжатия 1,181 показал LZH на цветной фотографии с большим число цветов и разрешением 300 dpi. Максимальный коэффициент сжатия 2.0868 показал RAR на черно-белой фотографии с большим числом полутонов и разрешением 1200 dpi. Формат TIFF сжимается незначительно лучше, чем BMP. Формат GIF практически не сжимается.

С одной стороны, рассмотренные алгоритмы достаточно универсальны, и покрывают все типы изображений, с другой — у них, по сегодняшним меркам, слишком маленький коэффициент архивации. Используя один из алгоритмов сжатия без потерь, можно обеспечить архивацию изображения примерно в два раза.

В главе 2 «Методы спектрального сжатия дискретных изображений» представлены методы, которые используют дискретные преобразования изображе-

ний, причем работают не с пикселами, а со спектром изображения. Это преобразование Фурье, дискретные косинусные преобразования, дискретные преобразования Виленкина-Кренстенсона, фрактальный метод, метод всплесков и метод полевых структур. Эти методы по своей сути работают с потерями информации. Они выделяют отдельные области изображений, упрощают запись о них и при восстановлении не воспроизводят потерянные при кодировании детали. Наибольшее применение имеет архиватор JPEG, имеющий в своей основе дискретные косинусные преобразования, но его коэффициенты сжатия (10-30) не позволяют обеспечить режим передачи видеофильмов по каналам связи.

Новые перспективные методы, основанные на векторном квантовании, субполосном кодировании, фрактальных преобразованиях, преобразованиях на основе всплесков, кодирование в виде полевой модели - потенциально могут обеспечить существенно более высокое, чем 10-30 раз, сжатие изображений, однако их внедрение пока во многих случаях упирается в проблему вычислительной сложности их реализации (которая часто объясняется отсутствием четких алгоритмов).

Практически отсутствуют работы по сжатию информации с помощью цветовой фильтрации дискретных изображений.

В главе 3 «Требования к цифровой обработке и передаче видеоинформации по каналам связи» рассмотрены требования, изложенные в стандарте MPEG-4. Документ создавался большим коллективом лучших ученых и разработчиков мира. По существу он показывает, в каком направлении надо идти, чтобы обеспечить передачу изображений на большие расстояния в реальном времени.

Пока в составе средств, названных в MPEG-4, немного средств, которые могли бы быть использованы для глобальных сетей и признаны как стандарты. Тем не менее, в нем заложены требования, которые побуждают ученых и разработчиков добиваться этой цели. Для данной диссертационной работы стандарт MPEG-4 явился руководством для поиска и решения поставленных в данной диссертационной работе целей.

В главе 4 «Методы цветового сжатия дискретных изображений» предлагается метод цветовой фильтрации изображений без потерь.

Метод цветовой фильтрации изображения (МЦФ) основан на иерархическом построении полей цветового описания 2-д изображения с исключением записей нулевых полей. Число используемых уровней яркости цвета системы КЗС и разрешение поля изображения может быть различным. Эти параметры обычно записываются в заголовке файла и зависят от характеристик технического оборудования. Разрешение поля изображения зависит от минимального физического размера и числа пикселов, которые можно вывести на экран или получить от объектива фотоаппарата или видеокамеры. Широко используются устройства, которые поддерживают 256 уровней интенсивности цвета (красного, зеленого, синего и серого). При кодировании каждого цвета (красного, зеленого, синего) отводится по байту для записи номера уровня интенсивности (0255). Комбинации уровней трех цветов дают нам 16 777 256 оттенков цвета в том числе и серого цвета.

Число чистых цветов, имеющих максимально возможное число уровней (256) интенсивности цвета от темного до яркого без изменения оттенка, при любых комбинациях уровней равно 7 (красный, зеленый, синий, красно-зеленый, красно-синий, зелено-синий и серый от черного до белого). Схема фильтрации и перекодировки цветового изображения показана на рис. 1.

Метод ориентирован на сокращение записей в одноплоскостном битовом поле, где под пиксел отводится 24 бита по 8 бит на каждый цвет (формат BMP).

Суть метода заключается в цветовой фильтрации поля изображения для создания иерархической модели изображения, при этом определяются поля распределения чистых цветов. Затем проводится анализ числа полутонов, присутствующих в данном изображении и затем применяется перекодировка уровней с целью получения наибольшего числа нулей в записи, которые используются для восстановления исходного поля. После получения конечных полей

осуществляется сжатие путем удаления нулей из записей, формируются таблицы перекодировок и запись файла сжатия.

Рис. 1 Схема фильтрации и перекодировки цветового изображения Алгоритм разложения изображения на цветовые битовые поля для красного цвета следующий:

- Пропускаем исходное изображение через красный фильтр, если изображение не равно нулю, то в первый разряд семиразрядного числа пишем 1, при нулевых значениях пишем 0;

- Красное изображение пропускаем через фильтры уровней яркости, если изображение не равно нулю, то в первый разряд п-уровнего числа уровня пишем 1, при нулевых значениях пишем 0;

- исключая нулевые поля.

Формируем битовые поля уровней красного и последовательно записываем, Таким образом, мы получили заголовок записи использования всех уровней красного цвета в исходном изображении и битовые поля уровней красного цвета.

Подобным образом мы фильтруем все чистые цвета, а именно красно-зеленый, зеленый, красно-синий, зелено-синий, синий и серый. Затем сформированную битовую запись, в которой будет преобладать запись единиц, сжимаем любым методом без потерь.

Порядок декодирования будет осуществлять восстановление последовательных единичных и нулевых полей для формирования исходной информации.

Раскладывая на чистые тона, мы получаем возможность выделения объектов, расположенных на изображении, что может быть использовано для распознавания образов и выделения групп цветовых объектов.

Использование семи чистых цветов дает дополнительную информацию для анализа изображения, является общим случаем данного метода и имеет некоторую избыточность в записях, что снижает коэффициент сжатия.

Наибольший эффект можно получить, если использовать только три чистых цвета, а именно красный зеленый и синий. Но это ограничивает возможности метода по анализу цветности, выявления цветовых объектов в изображении и использования методов дискретных преобразований для сжатия данных.

В приложении 1 приведены программы, реализующие данный метод.

В ходе экспериментов по цветовому сжатию изображений было определено в ходе анализа сжатых полей, что поиск однотипных последовательностей размером от одного до четырех байт, значительно увеличивает время вычислений по мере увеличения длины последовательности. Программа обработки кодов приведена в приложении 1. В приложении 2 имеется таблица минимизации байтовых кодов по записи числа единиц.

Предложенный метод цветового сжатия открывает еще один из видов иерархической (структурной) записи изображений. Он ориентирован на многоцветные изображения с большим числом мелких объектов.

В работе также предложен метод выборочного снижения уровней цвета.

Данный метод содержит алгоритм сжатия с потерей информации за счет снижения числа полутонов цветового отображения.

Для увеличения коэффициента сжатия используется алгоритм сдвига полутонового уровня вверх или вниз в зависимости от частоты его использования и наличия соседнего уровня. В этом случае поле уровня объединяется с соседним верхним или нижним уровнем, при этом увеличивается повторяемость кодов и возможность уменьшения общего объема записи. Информация об цветовых объектах не пропадает, но при этом могут возникать цветовые искажения. На практике это выглядит как чрезмерное увеличение или уменьшение контрастности изображения. В геометрических формах для сглаживания поверхностей используются специальные алгоритмы. Подобный прием может быть применен и при корректировке цвета в цветовых объектах. Этот вопрос в данной работе не рассматривается, но его решение может принести дополнительные возможности по дальнейшему сжатию цветовых объектов.

Были проведены эксперименты по снижению числа полутонов и упаковки их от 8 до 4 бит.

Для реализации требований стандарта МРЕО-4 (рис.2) необходимо использовать компьютерные модели объектов и сцен.

Рис. 2 Структурная схема трансляции управляемых компьютерных фильмов

В диссертации проведен анализ таких методов как: рецепторный, точечный, векторный (полигональный). Предложена алгебраическая модель объекта с включением в алгебраическое уравнение негеометрических свойств.

В общем виде, алгебраическое описание объекта с множеством свойств поверхности и тела объекта имеет вид

Ат" S BkJ,

где А - коэффициенты при переменных алгебраического уравнения поверхности, ограничивающей объект, т - число переменных уравнения (свойств объекта); п - число степеней при переменных (сложность свойств); Бк' алгебраическое функциональное выражение ограничения свойств объекта. В частном случае оно равно нулю. Алгебраические уравнения описываются в лексографической форме, записываются в машинную модель в виде последовательности коэффициентов от младшего к старшему. Например, уравнение 2-го порядка с включением цвета (переменная с) имеет вид

ацх2 + ацху + a^xz + anxc + ац>х + ajy2 + agyz + a7yc + гцу + asz2 + + a3z + а2с2 + aie + ao = 0.

Рис. 1 Пример окраски эллипсоида При повышении степени число членов уравнения возрастает в лексогра-фическом порядке. При увеличении числа переменных дает увеличение числа коэффициентов, зависящее от общего числа коэффициентов до добавления и растет по мере повышения степени, но не более чем в два раза.

Можно сделать вывод, что добавление описания свойств в алгебраическую модель незначительно увеличивает общий объем записи модели объекта по сравнению с другими способами описания моделей объектов.

Было проведено сравнение объемов записи объекта, представленного в виде окрашенного эллипсоида. Результаты представлены в табл.1.

Таблица 1 Сравнение объемов записи описаний объектов различными

методами

Наименование метода записи модели Объем зашей (байт) Коэффициент сжатия

Стандарт TIFF 6 140 776 1

Стандарт JPEG 79 443 77,2980

МЦФ 76549 80,2201

Рецепторный 28 311552 ООО ООО 0,000002184

Точечный 1 633 597 200 0,003759

Векторный 74 352 82,5905

Алгебраический 60 102346,2666

Анализ коэффициентов сжатия (табл.1) показывает, что передача и хранение точечных, рецепторных моделей и не сжатых изображений нецелесообразно по существующим каналам связи. Возможно использование стандарта JPEG и МЦФ для передачи изображений слайдов. Для целей передачи компьютерных фильмов и игр можно использовать векторные модели, однако они не обеспечат режима реального времени передачи 60 кадров в секунду реальных сцен с быстрой сменой обстановки сцены.

Наиболее перспективной моделью цветовых объектов, ориентированной на передачу сцен в реальном времени следует считать алгебраическую модель и в этом направлении развивать методы алгебраических описаний реальных объектов, формирование машинных моделей на базе алгебраических описаний, алгоритмы преобразований (управляемое изменение геометрической формы, цве-

та или других свойств, перемещение, вращение и масштабирование) таких машинных моделей для телекоммуникационных целей.

Заключение по результатам проведенных исследовании и разработок В ходе проведенных исследований и разработок получены следующие научные и практические результаты:

1. Проведен анализ графических форматов дискретных изображений, методов и алгоритмов сжатия информации с потерями и без потерь, широко используемых стандартов JPEG и MPEG-4. Рассмотрены их возможности для обеспечения передачи видео информации в реальном времени по телекоммуникационным сетям.

2. Оценены возможности использования перспективных методов сжатия изображений, таких как, фрактальный метод, метод всплесков, метод полевых структур для телекоммуникационных целей в современных условиях.

3. Рассмотрены методы и модели описаний цветовых объектов и использование их в современных информационных технологиях трансляции компьютерных фильмов и игр по телекоммуникационным сетям.

4. Предложены методы цветовой фильтрации дискретных изображений для сжатия их с потерями и без потерь, позволяющие проводить цветовой анализ и распознавание объектов на изображении.

5. Предложена алгебраическая модель описания цветового объекта и сцены, имеющая значительные преимущества по компактности записи данных перед широко используемыми в настоящее время моделями.

6. Создан комплекс экспериментальных программ методов цветовой фильтрации и проведена экспериментальная проверка методов.

7. Сделано сравнение разработанных методов и модели с существующими методами и моделями по критериям объема записи.

8. Намечены пути использования и развития полученных результатов исследований и разработок:

- Создание интеллектуальных цветовых анализаторов изображений;

- Изучение алгебраических возможностей окраски объектов;

- Использование алгебраических моделей в телекоммуникационных сетях. Основные положения диссертации опубликованы в следующих работах:

1. Шишенко АЛ. Передача визуальной информации по каналам связи для целей медицины, Материалы 54 НТК СПбГУТ 28 января -1 февраля 2002

2. Andrey P. Shishenko, Vladimir M. Degtyarev/'Analitical design of complex surfaces", Preprint and Program, Proceedings of SPAS Vol 6, pp. F16 - F19 (2002)

3. Шишенко A. IL Методы сжатия видеоинформации для телекоммуникационных целей, Материалы 55 НТК СП6ТУТ 27-31 января 2003

4. Andrey P. Shishenko, Vladimir М. Degtyarev, "Compression of a display frame by deleting the exuberant colour information", Preprint and Program, Proceedings of SPAS Vol 7, pp. F02-F04 (2003)

5. Andrey P. Shishenko, Vladimir M. Degtyarev,"Analitical design ofcomplex surfaces", Proceedings ofSPIE Vol 5127 Sixth International Workshop on Nondestructive Testing and Computer Simulations in Science and Engineering, edited by Alexander I. Melker, (SPIE, Bellingham, WA, 2003) pp. 267 - 271

6. Шишенко А.П. Перспективы развития сетей компании Вымпелком с возможностью использования передачи видеоизображений, Материалы 1-ой НПК СЗ региона РФ с международным участием «Высокие хирургические, лазерные и информационные технологии в медицине СПб и СЗ региона РФ: Перспективы дальнейшего развития», СПб, 20-21 ноября 2003

7. Шишенко А.П. Метод цифровой фильтрации кадра изображения // Труды учебных заведений связи / СПбГУТ. СПб, 2003. № 169. С. 50-54.

8. Шишенко A.IL Многоуровневое сжатие цветных изображений, Материалы 56 НТК СПбГУТ 26-30 января 2004

ü" 1 2 si 7 6

Оглавление автор диссертации — кандидата технических наук Шишенко, Андрей Петрович

Введение

Глава 1 Цифровая обработка и сжатие дискретных изображений без потерь

1.1 Графические форматы

1.1.1 Файлы BMP

1.1.2 Структура файла BMP

1.1.3 Файлы PCX

1.1.4 Файлы TIFF

1.1.5 Файлы GIF

1.1.6 Файлы PNG

1.1.7 Файлы JPEG

1.2 Алгоритмы сжатия изображений без потерь

1.2.1 Алгоритм RLE

1.2.2 Алгоритм LZ

1.2.3 Алгоритм LZW

1.2.4 Классический алгоритм Хаффмана

1.2.5 Алгоритм Lossless JPEG

1.3 Эффективность сжатия дискретных изображений существующими архиваторами

1.4 Выводы

Глава 2 Методы спектрального сжатия дискретных изображений

2.1 Основные подходы к реализации сжатия дискретных изображений

2.2 Модель дискретного изображения

2.3 Квантование

2.4 Кодирование изображений

2.5 Фрактальное сжатие изображений

2.6 Метод волновых всплесков

2.7 Сжатие изображений на основе их представлений в виде полевой структуры

2.8 Стандарт сжатия цифровых изображений JPEG

2.9 Выводы

Глава 3 Требования к цифровой обработке и передаче видеоинформации по каналам связи

3.1 Стандарт MPEG

3.2 Кодированное представление медийных объектов

3.3 Основные функции в MPEG-4 версия

3.4 Видео-система

3.5 Кодирование формы и А1рЬа-представление

3.6 Кодирование 2-D сеток с нечетко выраженной структурой

3.7 Натуральное видео

3.8 Визуальная секции MPEG

3.9 Декодирование

3.10 Выводы

Глава 4 Методы цветового сжатия дискретных изображений

4.1 Метод цифровой фильтрации изображения

4.1.1 Метод дискретной спиральной развертки (МДСР)

4.1.2 Метод цветовой фильтрации изображения без потерь (МЦФБП)

4.1.3 Декомпрессия сжатых изображений

4.1.4 Метод цветовой фильтрации изображения с потерями (МЦФСП)

4.1.5 Экспериментальная проверка и сравнение МЦФ с WinRar и JPEG

4.2 Методы описаний моделей цветовых объектов

4.2.1 Рецепторная матрица 4.2.2 Описание точками if 4.2.3 Описание полигонами

4.2.4 Описание сплайнами

4.2.5 Аналитическое описание

4.2.6 Алгебраическая модель цветового объекта

4.2.7 Сравнение моделей 139 4.3 Выводы

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Шишенко, Андрей Петрович

Основной поток информации из окружающего мира человек получает через зрение. Создание, сохранение, обработка и передача зрительных образов (изображений), является постоянной заботой человечества на протяжении всей его истории. Наскальные рисунки, художественные полотна, фотографии, кино, телевидение, компьютерные информационные системы - этапы развития возможностей человека создания, передачи и получения изображений. Развитие науки и техники позволило человеку изучить собственное зрение и создавать на его подобии технические средства записи изображений и передачи их на большие расстояния. Получив возможность передавать информацию с помощью электромагнитных колебаний, человек изобрел радио и телевидение. В своем развитии радио и телевидение прошли путь от аналоговых систем до дискретных, начиная с передачи весьма простых сообщений (азбука Морзе) до видео конференций в цвете и реальном времени. Появление телевидения напрямую связало задачи обработки изображений с задачами обработки электрических сигналов, а необыкновенный подъем в последние десятилетия цифровой электроники привело к тому, что повсеместный переход от аналоговых форм представления сигналов к цифровым стал характерной чертой современных электронных систем. В этой связи вопросы цифровой обработки изображений (ЦОИ) приобретают сегодня особую актуальность.

Если вернуться к человеку, то он получает видео информацию [1] в области световых частот (700-300 нм) в дискретном виде. Сетчатка глаза содержит около 127 млн. рецепторов (120 млн. палочек и 7 млн. колбочек с тремя выступами для приема лучей красного, зеленого и синего цвета). Плотность размещения рецепторов 160 тыс. на 1 кв. мм. Глаз обладает глубокой адаптацией по отношению к интенсивности света, то есть он может различать огромное количество порогов яркости. Современные технические устройства строят изображения на экране по подобному принципу, однако, по своей разрешающей способности и пороговой чувствительности они намного уступают человеческому глазу.

Существует проблема, связанная с передачей изображений. Области частот, в которой работают современные передатчики, намного ниже светового диапазона и здесь возникает проблема адекватной модуляции изображения.

Есть еще одна проблема, которая существует при передаче изображений, это последовательное считывание элементов изображения при записи и последовательная развертка при воспроизведении. Такая же проблема существует и в вычислительной технике, когда обработка данных осуществляется последовательно. В вопросах параллельной обработки изображений результаты в вычислительной технике по сравнению с человеком весьма скромные. Известно, что в области слепого пятна глаза информация сжимается от 127 млн. рецепторов и передается в мозг в виде импульсов по 1 млн. нервных волокон. Пока нет ясного представления механизма такого сжатия.

Мечта человечества создать устройства, которые позволяли бы им общаться на удаленном расстоянии, например, на разных концах земного шара (а в последствии и в космосе) в одно и тоже время с реакцией восприятия человека (реальное время).

В технических устройствах для решения задачи передачи изображений в реальном времени можно пойти следующими путями. Фиксировать изображение с помощью матриц определенного разрешения и значение каждого элемента матрицы передавать по отдельному каналу. Число таких каналов будет равно числу элементов матрицы. Если изображение имеет миллион элементов, то и каналов нужно будет столько же. Разворачивать такое изображение не будет необходимости, так как все элементы будут приходить одновременно и выводиться сразу же в определенной точке изображения. Такая реализация, по-видимому, будет возможна на уровне нанотехнологий и использования для каналов очень высоких частот, проникающих на большие расстояния (например, гравитация). Пока это не достижимо. Следующий путь заключается в сжатии информации после получения с устройств фиксации изображения до минимальных размеров, передача сжатой информации по каналам связи и восстановления этой информации в виде изображения. Время суммы всех трех этапов обработки видеоинформации определит время общения. Задача перед исследователями и разработчиками заключается в снижении временных показателей на всех этапах обработки информации. При этом необходимо учитывать разрешающую способность видеоинформации (градаций яркости и цветности), искажения ее в результате передачи по каналам связи и потерь качества и цветности в результате ее воспроизведения. Видеоинформация проходит процесс преобразования ее в двоичную форму и обратно и понятно, что при этом возможны потери информации.

Во-первых, преобразования используются для выделения характерных признаков изображения. Например, постоянная составляющая спектра Фурье пропорциональна средней яркости изображения, а высокочастотные составляющие характеризуют ориентацию и резкость контуров.

Другой областью применения преобразований является кодирование изображений, когда оцифровке (квантованию с конечным числом уровней) подвергается не само дискретное изображение, а его спектр, что во многих случаях позволяет добиться заметного сокращения длины получаемого кода.

Третья область приложений - это сокращение размерности при выполнении вычислений; иначе говоря, в процессе спектральной обработки (например, фильтрации) малые по величине коэффициенты преобразования можно отбросить без заметного ухудшения качества обработки. И вторая, и третья области применения преобразований в классификации Прэтта это, по сути, один и тот же круг задач сжатия информации при обработке изображений, или просто сжатия изображений.

Под термином сжатие изображений понимается сокращение, насколько возможно, затрат бит для кодирования дискретных изображений при сохранении требуемого уровня качества их последующего воспроизведения. Другими словами, сжатие изображений - это их эффективное, в смысле экономии бит, представление в виде двоичного кода.

Современные вычислительные средства пока что не в полной мере удовлетворяют характеристикам, требуемым для передачи цифровых изображений с нужным разрешением в реальном масштабе времени [2]. Цифровые системы требуют огромных ресурсов памяти для записи качественных цифровые изображений и для демонстрации цифрового видеофильма в реальном масштабе времени необходима передача данных со скоростью 160 мегабит/с [2]. Сказанное объясняет тот громадный интерес, который проявляется во всем мире к поискам путей эффективного кодирования изображений.

Наибольшие усилия исследователей в области сжатия изображений были направлены на разработку методов дискретных преобразований. В 1965 году появилась работа Кули и Тьюки [3], содержавшей описание алгоритма быстрого вычисления дискретного преобразования Фурье. Идея замены одноцветного изображения как непосредственного объекта кодирования отсчетами его двумерного спектра дискретного преобразования Фурье (ДПФ) была выдвинута в 1968 году [4,5]. Кодирование посредством использования ДПФ основано на том, что для большинства изображений естественного происхождения значения многих коэффициентов ДПФ сравнительно малы. Такие коэффициенты можно часто вообще отбросить, или отвести на их кодирование малое число бит, без риска внести какие-либо значимые искажения. В 1969 году Прэтт, Эндрюс и Кэйн предложили использовать для кодирования изображений вместо преобразования Фурье преобразование Адамара [6-8], что во многих практических случаях позволяет значительно уменьшить объем необходимых вычислений. После этого были предприняты исследования по применению для кодирования изображений дискретных преобразований Карунена-Лоэва [9] и Хаара [10,11]. Преобразование Карунена-Лоэва является оптимальным в том смысле, что обеспечивает минимальную среднеквад-ратическую ошибку кодирования, однако требует, к сожалению, знания статистических характеристик обрабатываемых изображений и не имеет быстрого алгоритма вычисления [I]; преобразование Хаара, напротив, характеризуется в высшей степени эффективным алгоритмом вычисления, но дает, как правило, сравнительно большую погрешность кодирования [1]. В 1971 году Шибата и Эномото [12] предложили специально для использования в кодировании изображений так называемое наклонное преобразование векторов из или 8 компонент. Вскоре после этого Прэтт, Чени Уилч разработали обобщенный алгоритм наклонного преобразования векторов большой длины и двумерных массивов [13]. Все преимущества кодирования одноцветных изображений с использованием преобразований вытекают, в конечном счете, из особенностей распределения энергии среди элементов дискретного спектра - благодаря этому двумерный спектр более удобен для кодирования, чем изображение в исходном представлении [14-16]. Вследствие значительных корреляционных связей между элементами изображения естественной природы основная энергия в дискретном спектре имеет тенденцию концентрироваться в относительно небольшом числе отсчетов, соответствующих медленно осциллирующим базисным функциям. Поэтому, без существенного ущерба для последующего восстановления изображения, малые по величине спектральные коэффициенты можно вообще обнулить, а оставшиеся элементы спектра оцифровать (проквантовать и закодировать). Как показано Ахмедом и др. [17], в применении к кодированию изображений, для которых подходит Марковская статистическая модель, дискретное косинусное преобразование (ДКП), имеющее быстрый алгоритм вычислений, приближается по эффективности к преобразованию Карунена-Лоэва [15,18,19]. Данный факт явился причиной того, что именно ДКП послужило основой при разработке стандарта сжатия неподвижных изображений JPEG [20-24]. Указанный стандарт явился плодом многолетних усилий коллектива специалистов, образованного в 1987 году из представителей двух авторитетных международных организаций: МОС и МККТТ. Появление объединенной группы JPEG было вызвано ростом числа разработчиков и пользователей различных систем ЦОИ и вытекавшей из этого необходимостью унификации формата сжатого представления цифровых изображений. Выработанная в итоге спецификация

23,24] явилась документом, которого сегодня придерживаются практически все разработчики программных систем ЦОИ общего назначения. Уже производятся специализированные микросхемы, реализующие сжатие и восстановление по JPEG аппаратно и обеспечивающие обработку цветных изображений в реальном масштабе времени (480x640 точек, 30 кадров/с [25]).С точки зрения достижимого уровня сжатия, стандарт JPEG не является лучшим среди существующих ныне методов эффективного кодирования изображений. Так, методы, базирующиеся на использовании векторного квантования [26-39,49] (в пространственной или спектральной областях), субполосного кодирования [36-43], преобразований на основе волновых импульсов ("всплесков") [44-50], а также фрактальные методы [51-54] -могут обеспечить значительно более высокие уровни сжатия по сравнению с JPEG. Однако пока во многих случаях внедрение новых перспективных методов упирается в проблемы сложности их реализации, которая часто объясняется отсутствием четких алгоритмов. В этом свете метод JPEG предстает как компромиссный вариант, обеспечивающий, с одной 10 стороны, достаточно высокое сжатие (10-50 раз для цветных изображений [22]), а с другой стороны - приемлемую для самого широкого применения сложность реализации. Именно- компромисс между качеством, универсальностью обработки и ее вычислительной сложностью был положен группой JPEG в основу первоначального выбора метода сжатия для последующей доработки и стандартизации [22]. Как уже отмечено выше, для кодирования изображений помимо ДКП можно использовать и другие унитарные преобразования. Например, применение для сжатия информации в ЦОИ дискретного преобразования Виленкина-Крестенсона (ДПВК) [55,56]. Система функций Виленкина-Крестенсона является частным случаем более общих мультипликативных систем [57] и была получена в результате обобщения на комплексную плоскость хорошо известной системы функций Уолша [58,59]. Дискретное преобразование Уолша прочно занимает свое место в ряду других унитарных преобразований, применяемых для обработки изображений [60-63]. Гораздо более скудную информацию можно почерпнуть в литературе по поводу практического использования ДПВК. Как наиболее полный и системный труд, в котором рассматривается не только теория, но и приложения теории, здесь нужно выделить монографию [56]; следует отметить также работы [64,65]. В некоторых источниках [56,66-68] нашли освещение и отдельные приложения ДПВК к обработке изображений. Косвенные данные позволяют предположить, что предложенные методы сжатия изображений на основе ДПВК [66,67], позволяют проводить обработку достаточно быстро (поскольку вычисление ДПВК в ряде случаев может быть сведено только к операциям типа сложения и вычитания [56]), однако, уступают по эффективности спектральным методам на основе ДКП (поскольку среди преобразований, имеющих быстрые алгоритмы, ДКП традиционно считается наилучшим для кодирования изображений [1,2,69]).

Необходимо отметить, что в случае кодирования многоцветных дискретных изображений выше представленные методы дискретных спектральных преобразований вносят значительные искажения и в ряде случаев не достигают требуемых результатов. Особенно это проявляется для изображений, имеющих множество различных небольших объектов изображения с богатой цветовой гаммой.

Повышение требований к качеству дискретного многоцветного изображения заставило искать другие методы сжатия изображения. Анализ цветовой составляющей изображения, получаемой непосредственно с цифрового устройства записи изображения, определение минимального цифрового кода записи этого изображения дает возможность определить пути сжатия цветовой информации и коррекции потерь для различного рода задач, выделения объектов, распознавания образов и т.п.

Таким образом, задача диссертационной работы была определена как исследование возможности эффективного кодирования изображений и объектов с использованием цветового анализа и разработка соответствующих методов (алгоритмов) сжатия, пригодного для практического применения. Новизна поставленной задачи вытекает из того, что применение цветового анализа для кодирования дискретных изображений и объектов изучено мало, актуальность обусловлена исключительной важностью проблем цифровой обработки видеоинформации, сжатия изображений и объемных сцен для передачи их по каналам связи и архивации.

В первой главе диссертации проводится краткий обзор и классификация основных подходов к реализации эффективного сжатия и обработки дискретных изображений, отмечается, что существует целый ряд методов, которые могут быть использованы для сжатия изображений с целью передачи их по каналам связи. Рассмотрены различные форматы и алгоритмы сжатия записи дискретных изображений без потерь информации. Дано сравнение эффективности существующих архиваторов для сжатия различных видов изображений.

Во второй главе рассмотрены методы дискретных преобразований изображений, их квантование и кодирования для достижения наивысших коэффициентов сжатия дискретных изображений при учете возможных потерь информации. Наибольшее внимание здесь уделено стандарту JPEG, который был выбран в качестве прототипа при сравнении с различными методами сжатия дискретных изображений.

В третьей главе рассмотрены современные требования к сжатию, обработке и передаче дискретных естественных и искусственных изображений, объектов и пространственных сцен по каналам связи. Проведен анализ стандартов передачи изображений на основе стандарта MPEG-4.

В четвертой главе рассмотрены методы описания пространственных цветных объектов, предложены методы сжатия дискретных изображений на основе цветового анализа и аналитический метод описания цветовых объектов. Дано сравнение методов описания объектов и сцен.

В приложении приведены исходные тексты программ обработки дискретных изображений и объектов на алгоритмическом языке С++ и изображения, используемые в вычислительном эксперименте.

Заключение диссертация на тему "Исследование и разработка методов обработки видеоинформации для телекоммуникационных целей"

4.3 Выводы

Анализ коэффициентов сжатия (табл. 4.9) показывает, что передача и хранение точечных, рецепторных моделей и не сжатых изображений нецелесообразно по существующим каналам связи. Возможно использование стандарта JPEG и МЦФ для передачи изображений слайдов. Для целей передачи компьютерных фильмов и игр можно использовать векторные модели, однако они не обеспечат режима реального времени передачи 60 кадров в секунду реальных сцен с быстрой сменой обстановки сцены.

Наиболее перспективной моделью цветовых объектов, ориентированной на передачу сцен в реальном времени следует считать алгебраическую модель и в этом направлении развивать методы алгебраических описаний реальных объектов, формирование машинных моделей на базе алгебраических описаний, алгоритмы преобразований таких машинных моделей для телекоммуникационных целей.

Библиография Шишенко, Андрей Петрович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Прэтт У. Цифровая обработка изображений: Пер. с англ. М.: Мир, 1982. Кн.1 и 2.-312 и 480 с. Пеев Е., Боянов К., Белчева О. Методы и средства за компрессия на изображения Автоматика и информатика.-1994.-28, №3.-стр.З-14, Cooley J. W,, Tukey J. W. An algorithm for machine computation of complex Fourier series Mach. Comput 1965. V.19. P. 297-

2. Andrews H.C, Pratt W.K. Fourier transform coding of images Hawaii International Conference on System Science, January 1968. P. 677-

3. Anderson J.B., Huang T.S. Piecewise Fourier transformation for picture bandwidth compression IEEE Trans. Commun. -1972.- V. COM-20 JVbS. P.488491. 6.

4. Прэтт У., Кэйн Д., Эндрюс X. Кодирование изображений посредством преобразования Адамара ТИИЭР. 1969. Т.57.-№1. 66-

5. Prult W.K., Andrews H.C. Application of Fourier-Hadamard transformation to bandwidth compression Picture bandwidth compression Ed.: Huang T.S., Tretiak O.J. -New York: Gordongand Breach, 1972.-P. 515-554.

6. Woods J. W., Huang T.S. Picture bandwidth compression by linear transformation and block quantization Picture bandwidth compression Ed.: Huang T.S., Tretiak O.J. New York: Gordong and Breach, 1972. P.555-573.

7. Habibi A., Wintz P.A. Image coding by linear transformation and block quantization IEEE Trans. Commun. Tech. -1971. V. COM-19. №1. P.50-63.

8. Эндрюс Г. Применение вычислительных машин для обработки изображений Пер. с англ. под ред. Б.Ф.Курьянова. М.: Энергия. 1977. 161 с. 11. Rao K.R., Narusimhan М.А., Revuluri К. Image data processing by HadamardHaar transforai IEEE Trans. Computers. 1975. V. C-23. №9. P. 888-896.

9. Enomoto H., Shibata K. Orthogonal transform coding system for television signals IEEE Trans. Electromagnetic Compatibility. 1

10. Special issue on Walsh functions. -V. EMC-13.-№3.-P. 11-17.

11. Pratt W.K., Chen W.H., Welch L.R. Slant transform image coding IEEE

12. Andrews H.C., Pratt W.K. Transform image coding Proc. Computer processing in communications. New York: Polytechnic Press, 1969. P. 63-84.

13. Ахмед H.. Рас К. Ортогональные преобразования при обработке цифровых сигналов: Пер. с англ. М.: Связь, 1980. 248 с.

14. Применения цифровой обработки сигналов: Пер. с англ. Под ред. Э.Оппенгейма. М: Мир, 1980. 552 с.

15. Ahmed N., Naturajan Т., Rao K.R. On image processing and a discrete cosine transform IEEE Trans. Computers. -1974. V. C-23 №1.- P.90-93. 18. Rao K.R., Yip P. Discrete cosine transform algorithms, advantages, applications. London: Academic Press inc., 1990.

16. Eliott D.F., Rao K.R. Fast transforms: algorithms, analyses, applications. London: Academic Press inc., 1982. 488 p.

17. Hung A.C. Image compression: The emerging standard for color images IEEE Computing Futures. 1

19. Wallace O.K. Overview of the JPEG (ISO/CCITT) still image compression: image processing algorithms and techniques Proceedings of the SPIE. 1990. V.1244.-P. 220-233.

20. Wallace O.K. The JPEG algorithm for image compression standard Communications of the ACM. 1991.-V.34. -№4. P. 30-44. 23. ISO/IEC JTCI Committee Draft 10918-

21. Digital compression and coding of continuous-tone still images. Part

22. Requirements and guidelines. 1991. 24. ISOAEC JTCI Committee Draft 10918-

23. Digital compression and coding of continuous-tone still images. Part

25. Kwosaki M., Waki H. A JPEG-compliant color image compression dccompresssion LSI Mitshubisi Elec. Adv. -1994. -V.68, Sept. P. 17-18.

26. Gray R.M. Vector Quantization IEEE ASSP Magazine. April 1984. P. 429.

27. Nasrabadi N.M., King R.A. Image coding using vector quantization: A review IEEE Trans, on Communication. 1988. V. 36. №8. P. 957-971.

28. Ngan K.N., Koh H.C. Predictive classified vector quantization IEEE Trans. Image Proc. -1992. -V.I. -№3. P. 269-280. 29. Kim T. Side match overall match vector quantizers for images IEEE Trans. Image Proc. -1992. -V.I. -№2. P. 170-185.

29. Buhman J., Kunel H. Vector quantization with complexity costs IEEE Trans, on Information Theory.- 1993.-V.39.-№4..p, 1133-1145.

30. Cosman P.C. et al. Using vector quantization for image processing Proc. IEEE -1993. -V.81.-Xo9.-P. 1326-1341.

31. Huang СМ., Harris R. W. A comparison of several vector quantization code book generation approaches IEEE Trans. Image Proc- 1993.-V.2.-№1 .P.108-112.

32. Mathews V.J. Multiplication free vector quantization using L/ distortion measure and its variants IEEE Trans. Image Proc- 1992. -V.I.-№1.-P. 11-17.

33. Chan Ch.-K., Po L.-M. A complexity reduction technique for image vector quantization IEEE Trans. Image Proc. 1992. -V.I. -№3. P. 312-321.

34. Huang CM. et al. Fast full search equivalent encoding algorithms for image compression using vector quantization IEEE Trans. Image Proc. 1992. -V.I. №3.-P. 413-416.

35. Senoo Т., Giord B. Vector quantization for entropy coding of image subbands IEEE Trans. Image Proc. 1992. -V.I. -№4. P. 526-532.

36. Kossentini F., Chung W.C., Smith M. Subband image coding using entropyconstrained residual vector quantization Information Processing and Management. 1994. -V.30. -№6. -P. 887-896.

37. Woods J.W. Subband image coding of images IEEE Trans, on ASSP.-1986.V.34.-№5.-P.1278-1288. 39. Kim E.H., Modestmo J.W. Adaptive entropy coded subband coding of images IEEE Trans. Image Proc. 1992. -V.I. -№l.- P. 31-48.

38. Nanda S., Pearlman W.A. Tree coding of image subbands IEEE Trans. Image Proc. 1992. -V.I.-№2.-P. 133-147.

39. Tuubman D., Zakhor A. Orientation adaptive subband coding of images IEEE

40. Kovacevic J. Subband coding system incorporating quantizer models IEEE Trans. Image Proc. 1995. -V.4. -№5. P. 543-553.

41. Stefunoiu D. Introduction to signal processing with wavelets Studies on Information and Control. -1994. V.3. №1. P. 97-110.

42. Ramuchandran K., Vetteri M. Best wavelet packet bases in a rate-distortion sense IEEE Trans. Image Proc. 1993. -V.2. 2. P. 160-175.

43. Gopinuth R.A., Burrus C.S. On cosine-modulated wavelet orthogonal bases IEEE Trans. Image Proc. 1995. -V.4. -№2. P. 162-177.

44. Antoni M. et al. Image coding using wavelet transform IEEE Trans. Image Proc. 1992. -V.l.-№ 2. -P. 205-220.

45. Lewis A.S. Knowles G. Image Compression using the 2-D wavelet transform IEEE Trans. Image Proc. 1992. -V.l. 2. P. 244-250.

46. Barlaud M. et al. Pyramidal lattice vectior quantization for multiscale image;: coding IEEE Trans. Image Proc. 1994. -V.3. 4. P. 367-381.

47. Горлов C.K., Корыстны A.B., Родин B.A. Об одной реализации метода сжатия отображений с помощью нелинейной аппроксимации сумм ФурьеХаара Теор. функций и прибл.: Тр. 7-й Саратов, зим. шк. (1994 г.). Ч.

48. Саратов: Изд.-во СЕУ, 1995.

49. Beaumont J.M. Image data compression using fractal techniques ВТ Technological Journal. 1991.-V. 9-№4.-P. 92-109.

50. Jaquin A.E. Image coding based on a fractal theory of iterated contractive image transformations IEEE Trans. Image Proc. 1992. -V.I.-№1. P. 18-30.

51. Бондаренко B.A., Дольников В.Л. Фрактальное сжатие изображений по Барнсли-Слоану Автоматика и телемеханика. 1994. №5. 12-20.

52. Fractal image compression: theory and application./ Ed.: Y.Fisher. New York, 1995.-XVIII, 341 p.

53. Efimov A. V. Multiplicative function systems and their applications in discrete

54. Голубов Б.И., Ефимов A.B., Скворцов В.А. Ряды и преобразования Уолша: Теория и применения. М.: Наука, 1987. 344 с.

55. Виленкин Н.Я. Об одном классе полных ортогональных систем Изв. АН СССР. Сер. мат. 1947. Т.П. 363-400.

56. Levy Р. Sur une generalization des fonctions orthogonales de M. Rademacher Comment, math. helv. 1944. -V.16. -P. 146-152.

57. Chrestenson H.E. A class of generalized Walsh functions Pacific. J. Math. 1955.-V.5.-№1.-P. 17-32.

58. Хармут X. Теория секвентного анализа. Основы и применения: Пер. с англ. -М.: Мир, 1980.-574 с.

59. Ярославский Л. II. Введение

60. Ярославский Л.П. Цифровая обработка сигналов в оптике и голографии. Введение

61. Птачек М. Цифровое телевидение. Теория и техника Пер. с чешек, под ред. Л.С. Вилепчика. М.: Радио и связь, 1990. -528 с.

62. Трахтман A.M., Трахтман В.А. Основы теории дискретных сигналов на конечных интервалах. М.: Сов. Радио, 1975.

63. Трахтман В.А. Спектральный анализ в базисе функций ВиленкинаКрестенсона Радиотехника и электроника. 1975. -Т. 20.- №1. HOBS.

64. Поспелов А.С. Некоторые математические задачи и алгоритмы цифровой обработки информации с использованием дискретных преобразований: Дисс. на соиск. уч. стен, д-ра физ.-мат. наук. М., 1992. -398 с.

65. Поспелов А.С. Методы обработки цифровой видеоинформации с использованием преобразований голографического типа Сб. тр. междунар. совет, по програмир. и мат. методам решения физ. задач (Дубна, 14-19 июня 1993). Сообщение ОИЯИР11-94-100.-С. 71-73.

66. Лисовец Ю.П., Поспелов А.С. Мультипликативные голографические преобразования для обработки изображений Методы цифровой обработки изображений: Сб. науч. тр. МИЭТ. М.: МИЭТ, 1982 100-109.

67. Perkins M.G. А comparison of the Hartley, Cas-Cas, Fourier, and discrete cosine transforms for image coding IEEE Trans. Commim. 1988. V.36. 6. -P.758-761.

68. Storer J.A. Data compression: Methods and theory. Rockville (Md): Computer science press, 1988.-X, 413 p.

69. Джайн A.K. Сжатие видеоинформации: Обзор ТИИЭР.- 1981.-T.69.-№3.С. 71-117.

70. Кунт М., Икопомопулос А., Кошер М. Методы кодирования изображений второго поколения ТИИЭР. 1985. -Т.73. №4. 59-86.

71. Задирака В.К., Евтушенко В.Н. Оптимальный способ зонного кодирования с использованием Слэнт-преобразования Кибернетика и системный анализ. 1994.-№4.-С. 56-60.

72. Digital image processing Collect.: Chellappa R. Los Alamitos (Ca) et al.: IEEE computer soc. press, 1992. IX, 801 p.

73. Дмитриев В.И. Приьсладная теория информации: Учебник для студ. вузов. М.: Высшая школа 1989. 320 с.

74. Andrews Н.С., Hunt B.R. Digital Image Restoration.- Englewood Cliffs (NJ): Prentice Hall, 1977. XVIII, 238 p.

75. Bimey K.A., Fischer T.R. On the modeling of DCT and subband image data for compression IBEE Trans. Image Proc. 1995. V.4. №2. P. 186-193.

76. Good J. The interaction algorithm and practical Fourier analysis J. Royal Stat. Soc. (London). -1958. V. B-20. P. 361-372.

77. Нуссбаумер Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток: Пер. с англ. М.: Радио и связь, 1985. 248 с.

78. Голд Б., Рейдер Ч. Цифровая обработка сигналов: Пер. с англ. М.: Сов. радио, 1973. -368 с.

79. Жуков Д.М. Эквивалентность одномерного и двумерного преобразования

80. Гагарин Ю.И., Гагарин К.Ю. Гиперкомплексные быстрые преобразования Фурье в расширенных полях рациональных чисел труды СПбГТУ 1998 472 стр.77-80

81. Witten I., Neal R.M., Cleary J.G. Arithmetic coding for data compression Comm. ACM.-1987.-V.30.-№ 6.

82. Мастрюков Д. Алгоритмы сжатия информации. Часть

83. Арифметическое кодирование Монитор. 1994. -№1. 20-26. 85. Lee B.C. FCT А fast cosine transform Proc. IEEE ICASSP. -1984. P. 28A3.1-28A3.4.

84. Hauque M.A. A two-dimensional fast cosine transform IEEE Trans. ASSP. 1985. -V. 33.-№6.-P.1532-1538.

85. Duhamel P., Guillemont C. Polynomial transform computation of 2-D DCT Proc. ASSP90. -1990.-P.1515-1518. 88. Cho N., Lee S. Fast algorithm and implementation of 2-D discrete cosine transform IEEE Trans. Circuits and Systems. 1991. -V.38. P.297-305.

86. Ефимов A.B., Умняшкин С В Быстрые алгоритмы вычисления дискретного мультипликативного преобразования и оценки его спектральных характеристик Теор. функций и прибл.: Тр. 7-й Саратов, зим. шк. (1994 г.). Ч. 2.- Саратов: Пзд.-во СГУ, 1995. 9-20.

87. Yopgeshwaz J., Mammone K.J. A new perceptual model for video sequence encoding 10th int. conf. Pattem recognition, Atlantic City, NJ, 16-21 June 1990 Vol2, стр. 188-193.

88. Pancha Rathan S., Golderg M. Mini-max algorithm for image adaptive vector quantization//IEEE proc. I. 1991 138, №1, стр.53-60.

89. Васин Ю.Г., Лебедев Л.И., Пучкова О.В. Оптимизация вычислительной и емкостной сложности алгоритмов распознавания объектов видеоинформации Автоматизированная обработка сложной графической информации Нижегородск.гос.ун-т Ниж.Новгород, 1990, стр. 62-86.

90. Васин Ю.Г., Крахов А.Д., Мартынова Е.М. Анализ положения большого числа объектов на плоскости с использованием иерархических структур представления видеоданных Автоматизированная обработка сложной графической информации Нижегородск.гос.ун-т Ниж.Новгород, 1990, стр. 96-110.

91. Unser Michael, Aldroubi Akram, Eden Murrey Fast B-Spline transforms for continuous image presentation and interpolation.// IEEE trans. Pattern anal. And mach. Intel!. 1991, 13, №3, стр.277-285.

92. Huynh Dung T. Effective entropies and data compression Inf. And comput. 1991, 90, №1, стр. 67-85.

93. Desoky Ahmed, OConnor Carol, Kleim Tomas Compression of image data using arithmetic coding Comput.sci.and statist.: proc. 20th symp.interface, Fairfax, Va, 20-23 apr 1988, Alexandria (Va), 1988, стр. 812-815.

94. Algazi V.Ralph, Kelly Philip L., Estes Robert R. Compession of binary facsimile images by preprocessing and color shrinking IEEE trans.commun. 1990, 38,№9,стр.1592-1598.

95. Stranger V.J. A feature motion compensation technique for image sequence compression Proc. 6th scand. conf Image anal, Oulu, June 19-22, 1989 vol.2. Стр. 1059-1066.

96. Wallance Gregory. The JPEG stillpicture compression standart Commun. ACM 1991,34, №4, стр.31-34.

97. Nasrabadi Nasser M., Feng Yushn. Image compression using address-vector quantization// IEEE trans.commun. 1990, 38, №12, стр. 2166-2173.

98. Mougeot M., Azencott R., Angeniol B. Image compression with back propagation: Improvement of the visual restoration using different cost functions Neural Networks -1991,4, №4, стр. 467-476.

99. Болтов Ю.Ф,, Бобылев А.В., Смирнов Р.С. Усовершенствование системы сжатия изображений на основе их представлений в виде полевой структуры Труды учебных заведений связи СПбГУТ. СПб, 2002 168. 316324.

100. Болтов Ю.Ф., Носков А.Ф„ Ситников В.В. Сжатие графической информации на основе представления изображения в виде полевой структуры Труды учебных заведений связи СП6ГУТ. СПб, 1998. 164.

101. Болтов Ю.Ф., Носков А.Ф., Ситников В.В. Концепция сжатия графической информации на основе представления изображения в виде полевой структуры /AICNAS: докл./ ЛОНИИС. СПб, 1998.

102. Болтов Ю.Ф., Носков А.Ф., Ситников В.В. Система предикативного сжатия изображений на основе полевой структуры Труды зебных заведений связи СП6ГУТ. СПб. 2000. 166.

103. Kosis S.M. Fractal-based image compression 23rd Asilonaz conf.sygnals. Syst. And comput., Pasific grove, Calif, oct.30 nov.l, 1989 confrec.vol. 1, San Jose, 1989, стр. 177-181.

104. ArozuUah Mohhamed, Namphol Aran. A data compression system using neural network based architecture IJCNN int. jt. Conf. Neural networks, San Diego, Calif 1990, vol.1 NY, стр.531-536. lOS.Paik Chul Hwa, Fox Martin D. Transform-based medical image compression using a recursive preprocessing approach Proc.l6th Aimual Northeast Bioeng.conf University park. Pa, March 26-27,1990, №4, стр.67-68.

105. Shweizer L., Paridon G., Sienranza G.L., Marsi S. A fully neural approach for image compression Artif Neural Networks: Proc. Int.conf, Espoo, 24-28 June, 1991,vol,l Amsterdam, 1991, стр.815-820. 110. Li C.G., Gokmen M., Hirchman A.D., Wang Y. Information preserving image compression for archiving NMR images Comput. Med. Image and graph. 1991, 15,№4,стр.277-283.

106. Rioul Oliver, Vetterli Martin. Wavelets and signal processing IEEE signal process.mag, 1991, 8, №4, стр.14-38. 112. Li Weiping. Vector transform and image coding IEEE trans.circuits and syst.video technol. 1991,1, №4, стр.308-317.

107. Sayood Khalid, Anderson Karen. A differential losseless image compression scheme IEEE trans. Sygnal process., 1992,40, №1, стр.236-241.

108. Kokkinidis P.A., Metaxaki-Kossionidou An adaptive improvement of an image compression technique Microprocess. And microprogram., 1992, 34, 1 5, стр. 231-234.

109. Горшков A.C. Быстрый теоретико-числовой метод для синтеза и сжатия изображений Програмирование, 1992, №4, стр.72-78.

110. Jayant Nikil. Signal compression: Technology targets and research directions IEEE J. Selec. Areas Commun. 1992,10, №5, стр. 796-818.

111. Vaisey Jacques, Gersho Allen. Image compression with block size segmentation IEEE trans.signal process, 1992 40, №8, стр.2040-2060.

112. Perkins Michael G. Data compression of stereopairs IEEE trans. Communications 1992,40, №4, CTp.684-696.

113. Shusterman E., Feder Meir. Image compression via improved quadtree decomposition algorithms IEEE trans.image process 1994 3, №2, стр.207-215.

114. Jain V.K., Lin L. Image processing using a universal nonlinear cell 6th Annu lEE conf. Wafer scale 1п1еф., San Francisco, Calif, jan.19-21, 1994, p r o c Pscataway, 1994, стр.40-51.

115. Saden lian. Universal data compression based on approximate string matching Appl.math.and comput.sci. 1995, 5, Jr24, стр.717-742.

116. Barsnsley Michael F. Fractal image compression Notic.Amer.Math.Soc. 1996-43,№6,стр.657-662.

117. Tang Li-an, Huang Thomas S. Characterizing smiles in the context of video phone data compression Proc 13th lAPR int.ocnf.pattem recogn., Vienna, aug 25-29, 1996, vol.3, track C: applic.and robotic systems Los Alamitos, 1996, стр.659-663.

118. Cochran Wayne O., Hart John C Flynn Patrick J. Fractal volume compression IEEE trans. Visual and comput.graph., 1996 2, №4, стр.313-322.

119. Забярянский Фрактальное сжатие изображений Компьютеры прогр. -1997,№6,стр.16-22.

120. Метоп Nazir, Wu Xiaolin. Recent developments in context-based predictive techniques for lossless image compression Comput.J, 1997, 40, №2-3, стр. 127-136.

121. Howard Paul G. Text image compression using soft pattem matching Comput J., 1997, 40, №2-3, стр.146-156.

122. Storer James A., Helfgott Harald. Lossless image compression by block matching Comput J., 1997,40, №2-3, стр.137-145.

123. Menezes Vinod, Nandy S.K., Mitra Biswadip. Signal compression through spatial frequency-based motion estimation Integration, 1997, 22, №1-2, стр.115135.

124. Горлов C.K., Новиков И.Я., Родин В.А. Коррекция полиномов Хаара, применяемая для сжатия графической информации Изв. Вузов мат. 2000 №7, стр.6-10.

125. Choi Jin Soo, Kim Yong Han, Lee Ho-Jang, Park In-Sung. Geometry compression of 3D mesh models using predictive two-stage quantization IEEE trans. Circuits and Syst. Video Technol. 2000-10 №2 стр.312-322.

126. Yang En-hui, Kieffer John C. Efficient universal lossless data compression algorithms based on a greedy sequential grammar transform IEEE trans. Inf.Theory 2000, №3 стр 755-777.

127. Chrysafis Christos, Ortega Antonio. Line-based, reduced memory, wavelet image compression IEEE trans. Image precess. 2000-9 №3, стр.378-389.

128. Меньшиков В.И., Пасечников M.A. О возможности создания эффективных итеративных алгоритмов сжатия информации Мурм.гос.техн. Ун-т Мурманск, 1999.

129. Зайцев Д.Ю. Использование фрактальных методов для сжатия информации Микроэлектироника и информатика

130. Всерос. Межвуз.конф. Студ. И аспир., Зеленоград 20-22 апр. 1998, тез. Докл. Ч.2 М, 1998 стр.184. 141. Li Jinghua, Yu Songyu, Yan Feng. Аппаратная реализация ВС на основе сжатия декомпрессии изображений J. Data Acquis, and Process. 1999. 14,2.-С. 214-217.

131. Кочин Л. Б. Особенности отображения видеоинформации в цвете Балт. гос. техн. ун-т "Военмех". СПб, 1999. 11 с.

132. Королев А. В., Рубан И. В., Малахов В. Метод сжатия видеоданных посредством преобразований Электрон, моделир. 1999. 21,4. 47-56.

133. Andrew B. Watson. Digital Images and Human Vision MIT Press, 1993. 150. K. Shen, G. Cook, L. Jamieson, and E. Delp. An Overview of Parallel Processing Approaches to Image Compression Proceedings of SPIE Visual Communications and Image Processing, San Jose, CA, vol. 2186, pp. 197-208, February 1994. 151. http://mpeg.telecomitalialab.com/standards/mpeg-4/mpeg-4.htm

134. Шишенко А.П. Метод цифровой фильтрации кадра изображения Труды учебных заведений связи СПбГУТ. СПб, 2003 169. 50-54.

135. Дегтярев В.М. Структурно-аналитический способ представления трехмерных геометрических объектов в ЦВМ. Обмен опытом в радиопромышленности, М., 1973, вып. 10 (НИИЭИР).

136. Дегтярев В.М., Морозов СМ. Машинная реализация структурноаналитической модели трехмерных объектов. Сборник трудов ЛМИ, Л., серия 6,1991.

137. Degtyarev V.M. and Pavlov P.V. «Computer library of super high degrees surfaces for 3D simulation» in International workshop on New Approach to HiTech: Nondestructive Testing and Computer Simulation Science and Engineering, Alexander I. Melker, Editor, Proceedings of SPIE Vol.4348, p.398-404, (2000).

138. Degtyarev V. M. and Gusev M. N. «Computer simulation of gas dynamic process for jet engine» in International workshop on New Approach to Hi-Tech: Nondestructive Testing and Computer Simulation Science and Engineering, Alexander I. Melker, Editor, Proceedings of SPIE Vol.4348, p.422-430, (2000). 157. Woo T. A Combinatorial Analysis of Boundary Data Structure Schemata. CG A, 5(3), March 1985,19-27

139. Baumgart B.G. A polyhedron representation for computer vision. NCC 75, 589-596

140. Томпсон H. Секреты программирования трехмерной графики для windows 95. издательство Питер, Санкт-Петербург, 1997