автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Адаптивное кодирование источника видеоинформации в системах на кристалле
Автореферат диссертации по теме "Адаптивное кодирование источника видеоинформации в системах на кристалле"
На правах рукописи
Зубакин Игорь Александрович
АДАПТИВНОЕ КОДИРОВАНИЕ ИСТОЧНИКА ВИДЕОИНФОРМАЦИИ В СИСТЕМАХ НА КРИСТАЛЛЕ
Специальность: 05.12.04 - Радиотехника, в том числе системы и
устройства телевидения
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
004ЬИЬ7УЬ
Санкт-Петербург - 2010
004606796
Работа выполнена в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» им. В. И. Ульянова (Ленина).
Научный руководитель
доктор технических наук, профессор Цыцулип Александр Константинович
Официальные оппоненты:
доктор технических наук, профессор Красильников Николай Николаевич кандидат технических наук, доцент Гласман Константин Францевич
Ведущее предприятие - Филиал ФГУП «Центральный научно-исследовательский институт «Комета» «Научно-проектный Центр оптоэлектронных комплексов наблюдения» («НПЦ ОЭКН») (Санкт-Петербург).
Защита состоится «ОЦ » июня 2010 г. в йЛ- часов на заседании совета по защите докторских и кандидатских диссертаций Д 212.238.03 Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» им. В. И. Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.
С диссертацией можно ознакомиться в библиотеке университета. Автореферат разослан « Я. 5"» мая 2010 г.
Ученый секретарь совета по защите докторских и кандидатских диссертаций
Баруздин С. А.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Диссертация посвящена решению части крупной научно-технической проблемы адаптивного кодирования источника видеоинформации в прикладных телевизионных системах, состоящей в оптимизации кодирования нестационарных сигналов изображения для реализации в системах на кристалле, отличающихся существенным ограничением на сложность кодера. При этом акцент делается на разработку адаптивного алгоритма, обеспечивающего минимальное количество информации при максимуме ее качества.
Актуальность темы
Разработка адаптивного алгоритма сжатия видеоинформации в системах на кристалле является актуальной, так как системы на кристалле являются самым современным направлением развития микроэлектроники, что нашло отражение в Федеральной целевой программе «Национальная технологическая база» на 2007-2011 гг. При этом главным аспектом актуальности является экономия пропускной способности. Дефицит пропускной способности - «вечная» проблема техники связи. Классические разработки кодеров источников видеоинформации в силу недостатка априорпой информации об источнике не позволяют достичь предельной эффективности кодирования. Повышение эффективности кодирования нестационарных сигналов (достижение высоких коэффициентов сжатия видеоинформации, определяемых эпсилон-энтропией источника при ограничении сложности кодера) особенно актуально в системах на кристалле, для которых типичны существенные ограничения на площадь кристалла, и, следовательно, на сложность кодера. Разработка методов кодирования, обеспечивающих информационное равновесие при передаче зашумленных видеосигналов, является сложной теоретической задачей, решение которой должно найти применение при создании современных кодеков видеоинформации, выполненных как системы на кристалле и видеосистемы на кристалле. Существенный вклад в решение проблем передачи, характерных для смешанных систем связи (непрерывный источник и цифровой канал связи), внесли работы: К. Шеннона, А. Н. Колмогорова, Б. Оливера, Р. Л. Добрушина, Б. С. Цыбакова, Л. П. Ярославского, Л. И. Хромова, А. К. Цыцулина и др. Данная работа является развитием известных результатов и приложением их к кодированию телевизионных сигналов, в котором применяются методы кодирования с преобразованием (.JPEG, MPEG и т.п.). В развитие этих методов внесли вклад У. Прэтт, Р. Гонсалес, Р. Вудс, Д. Сэломон, Я. Ричардсон, Ю. Б. Зубарев, В. П. Дворкович, М. И. Кривошеев, И. И. Цуккерман, А. А. Умбиталиев, Р. Е. Быков, А. И. Величкин и др.
В связи с нацеленностью данной работы на проектирование прикладных (в первую очередь бортовых) телевизионных систем акцент в работе делается на синтезе кодера источника, без учета ограничений на сложность реализации декодера на приемном пункте.
Цель работы
Цель работы — определение предельной эффективности кодирования нестационарных телевизионных сигналов при ограничении сложности кодера. Для достижения поставленной цели были поставлены и решены следующие задачи:
1) показана возможность достижения информационного равновесия, т.е. равенства скорости создания информации источником и пропускной способности канала, в смешанной системе связи, состоящей из непрерывного источника и дискретного канала, при определенной комбинации априорной информации, критерия качества и ограничения;
2) разработан адаптивный алгоритм кодирования для прикладных бортовых телевизионных систем с учетом ограничения сложности кодирования в условиях априорной неопределенности и нестационарности телевизионных сигналов;
3) разработана методика объективной оценки различных алгоритмов сжатия с учетом введенных меры нестационарности и обобщенного показателя эффективности кодека;
4) сформированы компактные представительные выборки статических изображений и> видео для определения эффективности кодирования различными алгоритмами.
\
5) определена предельная эффективность кодирования при ограничении сложности кодера.
Предмет исследования
Достижению высоких коэффициентов сжатия, определяемых эпсилон-энтропией источника видеоинформации, препятствуют априорная неопределенность и нестационарность реальных телевизионных сигналов. На практике обычно статистические свойства кодируемых сигналов известны приблизительно, вследствие чего множество методов кодирования нацелены в первую очередь на преодоление априорной неопределенности в статистических свойствах сигнала и его нестационарносга. Решение этой проблемы было намечено в работах проф. Быкова Р. Е., в которых была учтена смена сюжета Статистическая радиотехника использует два подхода к преодолению априорной неопределенности: создание методов, устойчивых к отклонению статистики сигнала ог принятой модели и адаптивных методов. Практические методы сжатия изображений, базирующиеся на принципе устойчивости, обычно разрабатываются в два этапа: сначала синтезируется некий алгоритм для конкретного типа изображений, затем в него вводятся различные дополнения, призванные расширить диапазон априорной неопределенности статистик сигнала. Методы, базирующиеся на принципе адаптации, изменяют свои параметры и/или структуру в зависимости от статистики сигнала. Адаптивные методы более эффективны, так как позволяют избегать ошибок в условиях априорной неопределенности и в условиях нестационарности сигналов.
Синтез методов кодирования и декодирования подчиняется общему правилу: * минимизация скорости передачи информации при заданном критерии качества при увеличении априорной неопределенности требует увеличения сложности кодеров и декодеров. Вместе с тем, в виду большой априорной неопределенности и нестационарности реальных изображений и видео представляется крайне сложно оценить эпсилон-энтропию источника. В связи с этим важной составляющей концепции кодирования является адаптивность кодера к сюжету.
Проектирование систем связи согласно концепции К. Шеннона должно быть нацелено на достижение равенства эпсилон-энтропии источника и пропускной способности канала. И хотя Шеннон подчеркивал, что он рассмотрел ограничение мощности в канале лишь в качестве одного из примеров, это ограничение в теории связи осталось доминирующим, оставив без внимания такое важное ограничение на кодер, как его сложность. Так, несмотря на большое количество работ, посвященных методам кодирования изображений, существующие алгоритмы сжатия получены без учета ограничения на сложность, хотя неявно и подразумевают ее. Вместе с тем, в связи с бурным развитием микроэлектроники и в связи с появлением систем на кристалле и видеосистем на кристалле синтез алгоритмов сжатия при наличии ограничения становится важным и ограничение на сложность должно быть введено с самого начала разработки алгоритма. При фиксированной технологии создания систем на кристалле (норме точности проектирования) одним из таких ограничений является ограничение на площадь кристалла, которая должна быть распределена таким образом между фотоприемной матрицей и вычислителем, чтобы обеспечить максимум некоторого показателя качества системы кодирования. Поэтому разрабатываемый алгоритм должен быть простым.
Такой подход к синтезу алгоритма диктует необходимость в разработке методики оценки такого упрощенного алгоритма. В телевидении вопросам оценки различных методов кодирование уделяется большое внимание. В телевизионном вещании получил широкое распространение метод экспертных оценок, который также нашел отражение в Международных рекомендациях. Особенностью прикладных телевизионных систем является наличие эксперта, обрабатывающего статические изображения или видео. Оценка эффективности алгоритма сжатия для прикладных телевизионных систем должна быть осуществлена не на произвольных изображениях или видео, которые могут быть выбраны из разных классов и в достаточно большом количестве (негласно полагая при этом, что они
являются представительными), а на основе компактной представительной выборки изображений или видео. Целесообразность введения последней есть следствие, во-первых, априорной неопределенности и нестационарности реальных изображений и видео, во-вторых - потребности получения объективной достоверной оценки эффективности кодера при допустимых временных затратах на анализ выбранного кодера.
В связи с этим основной задачей является разработка адаптивного алгоритма кодирования видеоинформации, обеспечивающего минимальное количество информации при максимуме его качества (в смысле среднеквадратической ошибки) с учетом ограничения на сложность реализаций алгоритма в системах на кристалле, а также разработка методики оценки этого алгоритма.
Основные методы исследования
На пути решения поставленной задачи имеются трудности, разрешаемые различными методами: теоретические (методы теории информации, теории алгоритмов и теории сложности), компьютерного моделирования и экспериментальной оценки адаптивного алгоритма кодирования.
Научная новизна работы
Основным научпым результатом является разработанный адаптивный алгоритм кодирования источника видеоинформации (параметры которого выбираются в зависимости от текущих значений пространственной и временной корреляции видеосигнала) на основе трехмерного дискретного косинусного преобразования (ДКП), обладающего максимальной эффективностью кодирования (оцениваемой по взвешенной сумме потери полезной информации, скорости передачи и сложности кодера).
Частные результаты:
1. На основе введенного понятия сопряженной триады (априорной информации, критерия качества и совокупности ограничений) найдены решения уравнения связи для смешанной системы связи.
2. Введено понятие обобщенного показателя эффективности кодека, включающего вектор весовых коэффициентов (вектор концепции кодека) и совокупность частных информационных показателей качества кодека: потери полезной информации, скорости передачи и сложности кодера и декодера.
3. Для корректной оценки кодеров разработана методика, использующая обобщенный показатель эффективности кодека и компактную представительную выборку статических изображений и видео, сформированную на основе меры широкополосности и предложенной меры нестационарности сигналов.
Основные положения, выносимые на защиту:
1. Для обеспечения информационного равновесия в смешанной системе связи следует осуществлять синтез кодера на основе сопряженной триады, в которую входит введенная А. Н. Колмогоровым эпсилон-энтропия с ограничением максимума отклонения принимаемого сигнала от передаваемого.
2. Для достижения минимума количества информации при максимуме ее качества в смысле среднеквадратической ошибки необходима и достаточна сложность кодера, определяемая спектральным отношением сигнал/шум.
3. Для оценки качества работы кодека целесообразно использование обобщенного показателя эффективности кодека, включающего вектор концепции кодека и совокупность частных информационных показателей качества кодека: потери полезной информации, скорости передачи, сложности кодера и декодера.
4. Максимум эффективности кодирования (в смысле обобщенного показателя эффективности кодера) в системах на кристалле бортовых телевизионных систем на современном уровне технологии достигается при использовании трехмерного ДКП с адаптацией размеров видеосегментов.
5. Для оценки эффективности кодирования тестовые изображения и видео должны быть сформированы с учетом их меры нестационарности и меры широкополосности.
Практическая значимость работы
Практическая значимость работы определяется выигрышами, достигнутыми в эффективности разработанного метода адаптивного кодирования источника видеоинформации.
Разработанный алгоритм характеризуется следующими показателями:
• эффективность, определяемая с точки зрения предложенного обобщенного показателя кодера (учитывающего потери полезной информации, скорости передачи и сложности кодера) превышает эффективность кодера МРЕО-2 в два раза, кодера МРЕО-4 в три раза;
• для видеоданных с малой скоростью движения коэффициент сжатия лежит в диапазоне от 300 до 400, что соответствует скорости передачи, равной 0,02 бит/пиксел, при примерно одинаковом с кодером МРЕО-4 относительно хорошем качестве восстановления видеоданных;
• для видеоданных с большой скоростью движения коэффициент сжатия лежит в диапазоне от 80 до 150 (алгоритм динамически приспосабливается к скорости движения, сохраняя высокое качество и относительно высокий коэффициент сжатия);
• алгоритм не уступает по качеству МРЕО-4 и методу кодирования на основе трехмерного ДКП без адаптации, но обеспечивает вычислительную сложность, на несколько порядков меньшую по сравнению с кодером МРЕО-4.
Личный вклад
Включенные в диссертацию материалы получены лично автором или при его непосредственном участии: определение сопряженной триады для смешанной системы связи, обеспечивающей равенство скорости создания информации источником и пропускной способности канала; разработка и экспериментальное исследование адаптивного алгоритма; формирование компактной представительной выборки статических изображений и видео.
Реализация результатов работы
Разработанный алгоритм нашел применение в ОКР «Цифра-СФ» (ФГУП «НИИТ») и «Цифра-ЗО-ЛЭТИ» (СПбГЭТУ «ЛЭТИ»), о чем имеется 2 акта о внедрении.
Апробация работы
Результаты, полученные в диссертации, были представлены и обсуждались на следующих российских и международных конференциях:
1.61-я научно-техническая конференция профессорско-преподавательского состава университета «ЛЭТИ». СПб, 2008.
2. б-я международная конференция: «Телевидение: передача и обработка изображений». СПб, 2008.
3. Научно-практическая конференция, посвященная столетнему юбилею ФГУП НИИ «Вектор». СПб, 2008.
4.62-я научно-техническая конференция профессорско-преподавательского состава университета «ЛЭТИ». СПб, 2009.
5. XV международная конференция: «Современное образование: содержание, технологии, качество». СПб, 2009.
6. 64-я научно-техническая конференция, посвященная Дню радио. СПб, 2009.
7.7-я международная конференция: «Телевидение: передача и обработка изображений». СПб, 2009.
8.63-я научно-техническая конференция профессорско-преподавательского состава университета «ЛЭТИ». СПб, 2010.
Публикации. По теме диссертации опубликовано 15 работ, 3 из которых опубликованы в журналах, входящих в перечень ВАК, 4 работы опубликованы в других
изданиях и 7 работ содержатся в сборниках материалов научных конференций. Получено свидетельство о государственной регистрации программы для ЭВМ.
Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения, списка использованных источников, включающего 111 наименования. Основная часть работы изложена на 152 страницах машинописного текста. Работа содержит 60 рисунков и 4 таблицы.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационной работы, указана цель работы, определены задачи и методы исследования. Сформулированы научная новизна, практическая значимость работы, а также положения, выносимые на защиту.
Первая глава посвящена обзору различных методов кодирования источников видеоинформации и является попыткой определить возможность создания оптимальной системы передачи видеоинформации с учетом информационного равновесия в системе связи, т.е. равенства скорости создания информации источником и скорости ее передачи через канал связи. Спецификой обзора является учет, с одной стороны, большого количества методов сжатия видеоинформации, и бурного развития систем на кристалле, с другой.
Вторая глава посвящена рассмотрению проблемы оптимизации смешанной системы связи с помощью уравнения связи, формализующего информационное равновесие в системе связи, т.е. равенство скорости создания информации источником и скорости ее передачи через канал связи. На этом пути введено понятие необходимой и достаточной для оптимизации системы связи сопряженной триады, включающей априорную информацию, критерий качества и совокупность ограничений. Показано, что в смешанной системе связи, состоящей из непрерывного источника и дискретного канала, достигается информационное равновесие при выборе в качестве критерия качества критерия максимального различия передаваемого и принимаемого сигналов (тах|х-äб). Остальные две компоненты сопряженной триады рассмотрены раздельно для двух случаев, различающихся допустимой задержкой передачи - с передачей каждого исходного символа и при допустимости блокового кодирования.
При передаче одномерной непрерывной случайной величины сопряженная триада включает:
а) априорную информацию:
-источник полезного сигнала с финитной плотностью вероятностей р(х) (хе[0,А], А < «1), в простейшем случае - это равномерная плотность вероятностей р(х) = 1 / А;
- шум в канале с нулевым математическим ожиданием и финитной плотностью вероятностей р(п), п е [- N12, 7//2] (в простейшем случае так же, как и сигнал, шум может иметь равномерную плотность вероятностей р(п) = 1/ N).
б) ограничения:
- ограничение на усиление g перед квантованием.
Кодер при передаче одномерной непрерывной случайной величины в качестве первого этапа осуществляет умножение на коэффициент g и квантование сигнала с шагом 5 на т интервалов, m = gA/8. Число разрядов квантователя i - целое число (/ = logjт)- Если плотность вероятностей сигнала р(х) равномерна, то после квантования дополнительного кодирования для выравнивания вероятностей символов по Шеннону-Фано не требуется. При произвольной финитной плотности вероятностей такое выравнивание выполняется на втором этапе кодирования. Информационное согласование в смешанной системе связи, формализуемое равенством эпсилон-энтропии источника и пропускной способности канала
tf° = logi = C£ = log(l + f
достигается за счет выбора шага квантования в кодере 5, равного размаху шума в канале N
и умножения входного сигнала на приемной стороне на коэффициент q - + ~ j и
квантования по порогу 8 = q(5 + JV)/2 = qN. При этом коэффициент усиления кодера находится из равенства эпсилон-энтропии источника и пропускной способности канала
N А-в
Коэффициенты усиления кодера и декодера вычисляется через максимальные значения, входящих в них величин.
При передаче многомерной непрерывной случайной величины (случайного сигнала) сопряженная триада включает:
а) априорную информацию:
- источник полезного сигнала со спектром (совокупностью {А^} коэффициентов
разложения в ряд Карунена-Лоэва) с финитной плотностью вероятностей для каждой
00
спектральной компоненты: , х е [0,
Ы1
- белый шум в канале со спектральной плотностью мощности N (возможно гауссовский, а возможно и с иной, например, финитной плотностью вероятностей).
б) ограничения:
сопряженные триады для такой априорной информации можно сформировать для двух комбинаций ограничений при двух различных плотностях вероятностей шума в канале:
1. для финитной плотности вероятностей:
00
• совокупное усиление кодера перед квантованием £ g^ <G;
к=1
• задержка передачи.
2. для гауссовской плотности вероятностей шума в канале снимается ограничение на задержку и, кроме ограничения на усиление, возникает второе - на мощность сигнала в канале:
00
• средняя мощность передаваемого сигнала
• неограниченная задержка передачи.
Кодер в смешанной системе осуществляет следующие операции:
• разложение сигнала в ряд, обеспечивающий статистическую независимость первичных символов (декорреляцию источника);
• умножение спектральных компонент на частотно зависимый коэффициент _N 141-9
Kl '
• квантование первичных символов (спектральных коэффициентов) с шагом 5, усекающее в общем случае бесконечное число членов ряда до конечного значения К, каждый из которых передается т^ уровнями;
• цифровое кодирование, выравнивающее вероятности вторичных символов (при неравномерной финитной плотности вероятностей спектральных коэффициентов Ад);
• при гауссовском шуме канала - блоковое кодирование.
Выражения для эпсилон-энтропии источника и пропускной способности канала принимают вид:
Также во второй главе диссертации выполнено моделирование влияния ограничения сложности кодера на качество кодирования изображений с преобразованием. В рамках кодирования с преобразованием была сформулирована следующая задача: для статистически заданного сигнала при заданной сложности хранения (передачи) нужно определить систему базисных функций и распределение сложности (емкости памяти) между числом базисных функций и их разрядностью. Моделирование с использованием типовых сигналов изображений показывает, что доступную сложность следует распределять между числом базисных функций и разрядностью их отсчетов таким образом, чтобы обеспечить минимум ошибки передачи сигналов и/или максимум пропускной способности канала. При этом переход от ограничения числа передаваемых спектральных компонент сигнала к ограничению сложности кодера при кодировании с преобразованием меняет приоритет при выборе базисных функций. В первом случае, когда сложность базисных функций не учитывается, выбираются те разложения, которые обеспечивают максимальную скорость сходимости ряда (разложение Карунена-Лоэва), во втором случае лучшее качество кодирования обеспечивается с помощью функций, требующих меньшего количества информации для их хранение (например, Уолша-Адамара).
Третья глава посвящена разработке адаптивного алгоритма кодирования источника видеоинформации с преобразованием в частотную область и предназначенного для реализации в системах на кристалле. Обобщение концепции равновесного согласования, рассмотренной во второй главе диссертации для смешанной системы связи, па источники видеоинформации, обладающие нестационарностью, возможно за счет использования в алгоритме кодирования процедуры адаптации к свойствам сюжета. Использование адаптации имеет целью выравнивание вероятностей вторичных символов (спектральных коэффициентов преобразования), и при использовании в качестве критерия качества максимума модуля ошибки, а в качестве ограничения - совокупного усиления кодера, обеспечивается равенство скорости создания информации источником и пропускной способности канала. В качестве преобразования было выбрано трехмерное ДКП, так как оно обладает хорошими декоррелирующими свойствами и для него существуют быстрые алгоритмы.
Ограничение на сложность, типичное для видеосистем на кристалле, диктует необходимость разработки алгоритма умеренной сложности. Разработанный в диссертации алгоритм кодирования динамически определяет оптимальные размеры видеосегмента, к которому применяется трехмерное ДКП, на основе анализа движения. Структурная схема кодера на основе трехмерного ДКП показана на рис. 1. Кодер включает следующие основные блоки: блок управления и анализа движения; блок трехмерного ДКП; блок квантования и блок энтропийного кодирования. Декодер содержит те же блоки, установленные в обратном порядке.
Кодирование включает 3 этапа.
Этап 1. Предварительный анализ последовательности кадров, в результате которого формируются три группы кадров:
• группы без движения (ГБД), или статические;
• группы с малой скоростью движения (ГМСД), или квазистатические;
• группы с большой скоростью движения (ГБСД), или динамические.
При анализе движения очередной кадр записывается в буфер базового кадра (первого кадра формируемой группы). Все последующие кадры сравниваются с базовым путем вычитания для определения остаточных кадров (разности между текущим и базовым кадрами). Степень временной декорреляции е( определяется по формуле:
, N-lM-l
где Уу я Ц - яркости пикселей текущего и базового кадров соответственно; М и N ■ размеры кадра.
Рис. 1. Модель адаптивного кодирования видеоинформации на основе трехмерного ДКП
В зависимости от значения е, выбирается число кадров в группе nt:
• если 0<е,<едоп] (еДОП1 - порог отнесения кадра к статическим), то п, увеличивается на единицу и данная итерация повторяется до тех пор, пока отсутствует движение. В результате формируются ГБД, к которым применяется двумерное ДКП над базовым кадром. Пространственные размеры сегмента в этом случае устанавливаются равными 16x16 пикселей.
• если ЕД0П] < v,t < £дОП2 (бдоп2 ~ порог отнесения кадра к квазистатическим), то nt увеличивается на единицу и данная итерация повторяется до тех пор, пока имеется медленное движение. В результате формируются ГМСД, к которым применяется трехмерное ДКП. Размеры видеосегмента при этом составляют 8 х 8 х nt.
• если е( >еД0П2, то nt = 4 и является постоянным. В результате формируются ГБСД, к которым также применяется трехмерное ДКП. Видеосегменты имеют размеры 4x4x4 пикселей.
Результаты модельного эксперимента над различными видеоданными, кодированными с яркостным разрешением 8 бит/пиксел, показали, что целесообразно установить пороги едоп, =4ивдоп2=24.
Как и для алгоритма MPEG, особой ситуацией является смена сюжета, вызывающая кратковременное нарушение корреляции. Эта ситуация отслеживается по величине е, : если она превышает половину динамического диапазона, то принимается решение о смене сюжета, и новый кадр становится опорным. Если смена произошла при формировании ГБСД, то оставшиеся кадры группы кодируются как /-кадры MPEG.
В пределах каждого видеосегмента группы анализируется движение, и в зависимости от наличия или отсутствия движения выполняется трехмерное или двумерное (по пространству) ДКП.
Этап 2. Квантование и сканирование.
Для квантования и z-сканирования полученный трехмерный набор пространственно-временных частотных коэффициентов подразделяется на слайсы, соответствующие одному значению временной частоты. В каждом слайсе квантование и z-сканирование проводятся независимо от других слайсов.
Пространственно-частотные коэффициенты слайса, полученные в результате трехмерного ДКП, квантуются делением на коэффициент квантования QCy = 1 + (1 + i + j)R, где i и / -координаты отсчета внутри слайса; R -параметр квантования, задаваемый пользователем.
Этап 3, Энтропийное кодирование. Квантованные коэффициенты трехмерного ДКП считываются и кодируются методом Хаффмана.
Для оценки разработанного алгоритма кодирования в диссертации был введен обобщенный показатель эффективности кодека, учитывающий не только меру приближения к эпсилон-энтропии источника, но и то, какими информационными средствами достигнуто данное приближение. Следуя методике векторного синтеза системы, сформирован обобщенный показатель эффективности кодека Р, включающий вектор концепции кодека {с,} и совокупность частных информационных показателей качества кодека {/}}: потери полезной информации АI, скорости передачи Л, сложности кодера 5'к и сложности декодера 5Д. Так как все частные информационные показатели качества кодека связаны с ошибкой передачи с, то ниже они обозначены как (е) :
Р = с0Д/(б) + С[Й(е) + с2 5к(е) + с35д(е).
В частном случае, когда сложность декодера не учитывается, т.е. с^ = 0, что характерно для бортовых систем прикладного телевидения, акцентирующих внимание на сложности кодера, обобщенный показатель эффективности кодера имеет вид:
Р = с0А/(с) + + с25к(Е). (1)
Очевидно, что в различных кодеках векторы концепции {с,-} могут существенно различаться, что и приводит к существованию множества различных оптимальных кодеков. Например, даже при равенстве весовых коэффициентов при скорости передачи и ошибке передачи системы кодирования в телевизионном вещании и в аэрокосмических системах наблюдения существенно различаются в соотношении весовых коэффициентов при сложности кодера и декодера. В телевизионном вещании существенный вес в силу огромных тиражей имеет сложность декодера, в аэрокосмических системах связи в силу жестких массогабаритных ограничений имеет сложность бортового кодера. Для обеспечения общего информационного подхода к решению задачи оптимизации кодека все показатели качества приведены к единому виду, имеющему размерность информации (бит). В частности, в силу того, что все реальные непрерывные сигналы доступны кодированию только в смеси с шумом, точность передачи следует характеризовать не просто ошибкой передачи е, а потерей полезной информации Д/(е) .
Минимум (1) при вариации назначаемой ошибки передачи е может быть найден аналитически, если известны статистические свойства источника и зависимости сложности и скорости передачи от назначаемой ошибки. Известно, что обобщенный показатель качества системы допускает множество решений. Это разнообразие решений в первую очередь связано с отмеченным взаимообменом скорости передачи и сложности кодера. Обобщенный показатель эффективности кодера (1) позволяет объективно сравнивать произвольные кодеры, отличающиеся по всем параметрам: ошибке передачи, скорости передачи и сложности, если зафиксировать выборку испытательных сигналов.
Четвертая глава посвящена разработке методики оценки алгоритмов кодирования источника видеоинформации и формированию компактной представительной выборки статических изображений и видео. Поскольку алгоритм адаптивного кодирования, предложенный в диссертации, является упрощенным, то для него необходима методика оценки его эффективности. Разработчики алгоритмов кодирования проверяют эффективность их работы на некоторой выборке различных сюжетов, негласно полагая, что эта выборка является представительной. Так как речь вдет о кодировании нестационарных сигналов, то для сравнения эффективности кодирования различных алгоритмов предлагается использовать следующую методику, основанную на учете коэффициента нестационарности:
1) ввести меру нестационарности сигналов изображений;
2) разработать алгоритм вычисления введенной меры;
3) определить границы изменения этой меры для очень большой выборки сигналов (заведомо представительной);
4) произвести разбиение интервала изменения этой меры на несколько (по возможности равных) интервалов, количество которых должно быть достаточным для уверенности в представительности выборки;
5) отобрать изображения, принадлежащие к выделенным интервалам меры нестационарности;
6) провести кодирование сформированной выборки каждым из исследуемых алгоритмов;
7) для каждого алгоритма и для каждого элемента выборки оценить значения скорости передачи информации при заданной ошибке передачи (иногда возможна инверсия - оценить ошибку передачи при заданной скорости передачи);
8) при отсутствии статистических данных о вероятностях появления сюжетов с различной мерой нестационарности считать их равновероятными;
9) для каждого алгоритма усреднить по сформированной выборке значения скорости передачи при заданной ошибке (или усреднить ошибку передачи при заданной скорости передачи);
10) сравнить результаты усреднения и выбрать алгоритм, обеспечивающий наименьшую скорость передачи при заданной ошибке (наименьшую ошибку при заданной скорости передачи).
Для реализации предлагаемой методики ключевыми вопросами становятся первые два пункта методики: выбор меры нестационарности сигналов и разработка алгоритма вычисления этой меры.
Для оценки нестационарности сигналов изображений представляется целесообразным воспользоваться методологией статистической радиотехники, в которой используются понятия стационарности в широком и узком смысле, т.е. различают процессы с постоянной/переменной дисперсией, математическим ожиданием и автокорреляционной функцией. Это подсказывает, что обобщенная мера нестационарности должна учитывать совокупное изменение различных статистик S„ сигнала изображения. Это могут быть математические ожидания, дисперсии, интервалы (или коэффициенты) корреляции яркости и цвета и др. Каждая из статистик вычисляется для некоторых интервалов: это могут быть оцененные по отдельным адаптивным алгоритмам интервалы стационарности или априори компромиссно выбранные интервалы. Они должны быть не слишком малыми для получения приемлемых методологических ошибок вычисления статистик и не слишком большими для уменьшения вероятности изменения статистик внутри интервала. Можно считать, что именно такие же соображения лежали в основе выбора окна (8 х 8) элементов при разработке стандартов MPEG.
Общая мера нестационарности М должна вычисляться как сумма (в общем случае взвешенная) мер нестационарности отдельных статистик:
И=1
Для оценки меры нестационарности каждой статистики сигнала предлагается использовать нормированную статистику, вычисляемую аналогично среднеквадратической полосе частот с тем лишь различием, что в формулу должны входить не сами сигналы, а их статистики Sn, вычисляемые раздельно по каждому аргументу. Ниже для упрощения записан один обобщенный дискретный аргумент /е[1,Л']. Формула для непрерывных функций непрерывного аргумента включает отношение интегралов от квадрата производной сигнала к интегралу от квадрата самого сигнала. Для дискретных значений статистик можно использовать не производную, а первую конечную разность:
2 ^«о+о -з„1) -■
/=|
Здесь для вычисления меры нестационарности рассматривается совокупность статистических характеристик (среднее значение тдисперсия Д, и коэффициент корреляции г,-) исходного изображения, вычисляемые в пределах окна (8x8):
ЛМ ЛМ лг-1
2 - ЩГ 2 (Ач1 - АО 2 (1ч1 - П)2
М = М< + М2 + Мъ —г.-+ —--+ --. (2)
N . N „ Лг „
2«? 2 А2 21
/=1 ¡=1 /=1 Важной характеристикой эффективности кодирования изображений различньми алгоритмами является скорость передачи информации. В первом приближении она определяется полосой частот, занимаемой сигналом, поэтому очевидно, что характеризовать изображение только лишь коэффициентом нестационарности нельзя. Поэтому, наряду с коэффициентом нестационарное™, учитывается также полоса частот, занимаемая сигналом изображения. Для оценки полосы частот нестационарного сигнала изображений используется формула, широко применяемая в статистической радиотехнике для оценки среднеквадратической полосы частот (меры широкополосности):
IV--
N12 ,
2
ш--(3)
IV I о
2 И)|
*=1
где \Х(к)\ - значение спектральной составляющей, полученное путем усреднения
спектральных составляющих по всем строкам изображения.
С учетом меры нестационарности (2) и меры широкополосности (3) была сформирована компактная представительная выборка статических изображений. Распространяя такой подход на реальные видео, которые характеризуются нестационарностью не только по пространству, но и по времени, удалось сформировать компактную представительную выборку видео. На примере использования компактной представительной выборки видео была проведена оценка разработанного алгоритма сжатия на основе трехмерного ДКП и оценены основные параметры, определяющие его эффективность. Эффективность предложенного алгоритма показана на примере видеоданных трех типов: с малой, средней и большой скоростью движения.
На рис. 2 показаны графики зависимости коэффициента сжатия К, скорости передачи С [бит/пиксел] и отношения сигнал/шум Ч* [дБ] от параметра квантования Я, полученные в результате моделирования обработки видеоданных с различными скоростями движения адаптивным алгоритмом на основе трехмерного ДКП. На рис. 2 графику 1 соответствует ГМСД, графику 2 - ГБСД, а графику 3 - ГБСД, закодированная алгоритмом на основе трехмерного ДКП без адаптации с размером видеосегмента 8x8x8.
Коэффициент сжатия определялся как отношение размера исходного (несжатого) видеофайла (в битах) к размеру сжатого видеофайла (в битах). Отношение "сигнал/шум" определялось по формуле Ч* = 20^(255/е), где
V)2
- среднсквадратическая ошибка кодирования, причем Т - количество кадров в видеопотоке; УИху( и УВху1 - яркости пикселей с координатами х, у, I в исходном и восстановленном после
квантования кадрах соответственно.
а б
в г
Рис. 2. Зависимость коэффициента сжатия К (а), пропускной способности С (б), отношения сигнал/шум ¥ (в) от параметра квантования Я и зависимость отношения сигнал/шум ¥ (г) от коэффициента сжатия К
Из сравнения результатов, полученных при использовании алгоритма без адаптации с размером видеосегмента 8x8x8 пикселей с результатами применения адаптивного алгоритма к ГБСД, следует наличие выигрыша разработанного алгоритма при близком качестве восстановления видеоданных. Кроме того, использование трехмерного ДКП при кодировании видеоданных позволяет на несколько порядков сократить сложность кодера источника по сравнению с кодером МРЕО-4. Это обусловлено, во-первых, тем, что ДКП является асимптотически оптимальным (при больших размерах фрагментов) преобразованием стационарного сигнала с экспоненциальной автокорреляционной функцией, хорошо аппроксимирующей реальные изображения. Во-вторых, эти два вида кодеров оптимальны для различных характеристик изменения сюжета во времени: МРЕО-4 ориентирован на слежение за объектами, а трехмерное ДКП выделяет любые изменения в сюжете.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
В заключении обосновывается внутреннее единство решенных задач, приводятся выводы по диссертации, подтверждающие решение поставленных задач и служащие обоснованием положений, вынесенных на защиту.
Основным результатом является предложенный, экспериментально исследованный и реализованный алгоритм кодирования видеоинформации, обеспечивающий в прикладных телевизионных системах, реализуемых как система на кристалле, минимальную требуемую пропускную способность канала при максимуме качества видеоинформации. Данный алгоритм показал максимальную эффективность кодирования, оцениваемую согласно введенному обобщенному показателю эффективности кодера, на основе разработанной методики, опирающейся на сформированную компактную представительную выборку сюжетов, учитывающую предложенную меру нестационарности сюжетов. Разработанный алгоритм характеризуется следующими показателями:
• эффективность, определяемая с точки зрения предложенного обобщенного показателя кодера (учитывающего потери полезной информации, скорости передачи и сложности кодера) превышает эффективность кодера MPEG-2 в два раза, кодера MPEG-4 в три раза;
• для видеоданных с малой скоростью движения коэффициент сжатия лежит в диапазоне от 300 до 400, что соответствует скорости передачи, равной 0,02 бит/пиксел, при примерно одинаковым с кодером MPEG-4 относительно хорошем качестве восстановления видеоданных;
• для видеоданных с большой скоростью движения коэффициент сжатия лежит в диапазоне от 80 до 150 (алгоритм динамически приспосабливается к скорости движения, сохраняя высокое качество и относительно высокий коэффициент сжатия);
• алгоритм не уступает по качеству MPEG-4 и методу кодирования на основе трехмерного ДКП без адаптации, но обеспечивает вычислительную сложность, на несколько порядков меньшую по сравнению с кодером MPEG-4.
Наряду с этим в диссертации были получены следующие частные результаты:
1. Введено понятие сопряженной триады (априорной информации, критерия качества и совокупности ограничений), обеспечивающей равновесие в уравнении связи, т.е. равенство скорости создания информации телекамерой и пропускной способности канала связи. На основе введенного понятия с учетом введенной А. Н. Колмогоровым эпсилон-энтропии с ограничением максимума отклонения принимаемого сигнала от передаваемого показано, что в смешанной системе связи с непрерывным источником и дискретным каналом возможно информационное равновесие.
2. При кодировании с преобразованием доступную сложность следует распределять между числом базисных функций и разрядностью их отсчетов таким образом, чтобы обеспечить минимум среднеквадратической ошибки передачи сигналов. При распределении доступной сложности существует оптимум разрядности и числа базисных функций.
3. Переход от ограничения числа передаваемых спектральных компонент сигнала к ограничению сложности кодера при кодировании с преобразованиями меняет приоритет при выборе базисных функций: в первом случае, когда сложность базисных функций не учитывается, выбираются те разложения, которые имеют максимальную скорость сходимости ряда (например, Карунена-Лоэва), во втором случае выбираются разложения с более простыми базисными функциями (например, Уолша-Адамара).
4. Ограничение сложности кодера не может назначаться произвольно, а должно учитывать соотношение полезной и шумовой информации в кодируемом сигнале и назначается, исходя из правила усечения спектральных коэффициентов, начиная с того номера, где полезная информация меньше шумовой информации. Чем больше в кодируемом сигнале отношение полезной информации к шумовой информации, тем больше требуемая оптимальная сложность кодера, обеспечивающего максимальное качество кодирования в смысле минимума информационного риска.
5. Введено понятие обобщенный показатель эффективности кодека, включающий вектор концепции кодека и совокупность частных информационных показателей качества системы связи: потери полезной информации, скорости передачи, сложности кодера и декодера.
6. Разработана методика объективной оценки эффективности алгоритмов кодирования изображений, основанная на введенном обобщенном показателе эффективности кодека и компактной представительной выборке сюжетов, сформированной с учетом меры пшрокополосности и предложенной меры нестационарности. Данная методика позволяет оперативно получать формализованные оценки эффективности кодирования нестационарных сигналов изображений различными алгоритмами и выбрать наилучший алгоритм.
Результаты работы нашли применение в ОКР и НИР, посвященных разработке сложных функциональных блоков, о чем имеются акты внедрения.
СПИСОК ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ РАБОТ
Публикации в изданиях, рекомендованных ВАК России'.
1. Зубакин, И. А. Адаптивный алгоритм кодирования видеоинформации на основе трехмерного дискретного косинусного преобразования [Текст] / И. А. Зубакин, Ш. С. Фахми // Известия вузов. Сер. Радиоэлектроника. - 2010. - Вып. 1. - С. 49-54.
2. Зубакин, И. А. Классификация нестационарных изображений и разработка методики оценки алгоритмов кодирования источника [Текст] / И. А. Зубакин, Ш. С. Фахми И Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики. - 2010. — № 02 (66). - С. 54-59.
3. Зубакин, И. А. Аппаратно-программное проектирование сложных функциональных блоков с использованием систем на кристалле [Текст] / И. А. Зубакин, Ш. С. Фахми, С. С. Шагаров // Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики. - 2010. - № 02 (66). - С. 9098.
4. Свидетельство о государственной регистрации программы для ЭВМ № 20009615441 Автоматизированный поиск опорных точек при кодировании изображений СТУ-АК. / И.А. Зубакин, Ш.С. Фахми. - № 2009614288; заявл. 3.08.2009; зарегистрировано в реестре программ для ЭВМ 1.10.2009.
Другие статьи и материалы конференций:
5. Зубакин, И. А. Влияние вида ограничения на линейное кодирование [Текст] / И. А. Зубакин, А. К. Цыцулин // Вопросы радиоэлектроники. Сер. Техника телевидения. -2006. -Вып. 1.-С. 79-87.
6. Зубакин, И. А. Моделирование влияния ограничения сложности кодера на качество кодирования изображений с преобразованием [Текст] / И. А. Зубакин, А. К. Цыцулин // Вопросы радиоэлектроники. Сер. Техника телевидения. - 2006. - Вып. 2. - С. 32-40.
7. Зубакин, И. А. Обзор методов кодирования и декодирования изображений [Текст] / И. А. Зубакин, Ш. С. Фахми // Вопросы радиоэлектроники. Сер. Техника телевидения. -2008.-Вып. 1. - С.13-41.
8. Зубакин, И. А. Решения уравнения связи [Текст] / И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // Вопросы радиоэлектроники. Сер. Техника телевидения. - 2008. - Вып. 2. -С. 9-27.
9. Зубакин, И. А. Влияние вида ограничения на кодирование и декодирование аналоговой информации [Текст] / И. А. Зубакин // Телевидение: передача и обработка изображений: Материалы 6-ой междунар. конф., г. С.-Петерб., 30 июня - 1 июля 2008 г. -СПб.: изд-во Инсанта, 2008. - С. 111-117.
10. Зубакин, И. А. Связь точности и сложности при кодировании и декодировании цифровой информации [Текст] / И. А. Зубакин // Телевидение: передача и обработка изображений: Материалы 6-ой междунар. конф., г. С.-Петерб., 30 июня - 1 июля 2008 г. -СПб.: изд-во Инсанта, 2008. - С. 117-122.
11. Зубакин, И. А. Решения уравнения связи [Текст] / И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // Научно-технические проблемы в промышленности: Труды конф., г. С.-Петерб., 12-14 ноября 2008 г. - СПб.: Политехпика-сервис, 2008. - С. 374-379.
12. Зубакин, И. А. Анализ архитектур устройств класса «видеосистема на кристалле» [Текст] / Д. А. Заверженсц, И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // Современное образование: содержание, технологии, качество: Материалы XV междунар. конф., г. С,-Петерб., 22 апр. 2009 г. - СПб.: изд-во,СПбГЭТУ «ЛЭТИ», 2009. - Том 1. - С. 143-145.
13. Зубакин, И. А. Оптимальное согласование источника и канала в системах связи с кодово-импульсной модуляцией [Текст] / И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // 64-я Научн.-техн. конф., посвященная Дню радио: Труды конф., г. С.-Петерб., апр. 2009 г. - СПб.: Технопромимпорт, 2009. - С. 158-160.
14. Зубакин, И. А. Полигональное рекурсивное кодирование изображений по опорным точкам [Текст] / И. А. Зубакин, С. В. Очкур, Ш. С. Фахми // Телевидение: передача и обработка изображений: Труды 7-ой междунар. конф., г. С.-Петерб., 29-30 июня 2009 г. -СПб.: Технолит, 2009. - С. 126-133.
15. Зубакин, И. А. Оценка эффективности кодирования нестационарных изображений [Текст] / И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // Телевидение: передача и обработка изображений: Труды 7-ой междунар. конф., г. С.-Петерб., 29-30 июня 2009 г, - СПб.: Технолит, 2009. - С. 19-22.
Подписано в печать 20.05.10. Формат 60*84 1/16. Бумага офсетная. Печать офсетная. Печ. л. 1,0. Тираж 100 экз. Заказ 31.
Отпечатано с готового оригинал-макета в типографии Издательства СПйГЭТУ "ЛЭТИ"
Издательство СПбГЭТУ "ЛЭТИ" 197376, С.-Петербург, ул. Проф. Попова, 5
Оглавление автор диссертации — кандидата технических наук Зубакин, Игорь Александрович
Введение.
1 Обзор методов сжатия видеоинформации.
1.1 Теоретические основы сжатия видеоинформации в реальном времени.
1.2 Методы сжатия статических изображений.
1.3 Методы сжатия динамических изображений.
1.4 Выводы и постановка задачи исследования.
2 Оптимальное согласование источника информации с каналом связи на основе информационного уравнения.
2.1 Информационное согласование непрерывного источника с непрерывным каналом.
2.2 Информационное согласование непрерывного источника с дискретным каналом.
2.3 Специфика кодеров в системах на кристалле. Ограничение сложности.
2.4 Выводы.
3 Разработка адаптивного алгоритма сжатия видеоинформации, обеспечивающего минимальное количество информации при максимуме ее качества.
3.1 Обобщенный показатель эффективности кодера источника видеоинформации.
3.2 Применение дискретного косинусного преобразования для сжатия видеоинформации.
3.3 Адаптивный алгоритм сжатия видеоинформации.
3.4 Выводы.
4 Оценка эффективности разработанного алгоритма сжатия видеоинформации при кодировании видео с разными мерами нестационарности и широкополосности.
4.1 Меры нестационарности и широкополосности статических изображений и видео.
4.2 Оценка эффективности разработанного алгоритма сжатия видеоинформации на компактной представительной выборке видео.
4.3 Выводы.
Введение 2010 год, диссертация по радиотехнике и связи, Зубакин, Игорь Александрович
Диссертация посвящена решению части крупной научно-технической проблемы адаптивного кодирования источника видеоинформации в прикладных телевизионных системах, состоящей в оптимизации кодирования нестационарных сигналов изображения для реализации в системах на кристалле, отличающихся существенным ограничением на сложность кодера. При этом акцент делается на разработку адаптивного алгоритма, обеспёчивающего минимальное количество информации при максимуме ее качества.
Актуальность решения этой проблемы связана с необходимостью разработки адаптивного алгоритма сжатия видеоинформации для систем на кристалле, так как системы на кристалле являются самым современным направлением развития микроэлектроники, что нашло отражение в Федеральной целевой программе «Национальная технологическая база» на 2007—2011 гг. При этом главным аспектом актуальности является экономия пропускной способности. Дефицит пропускной способности - «вечная» проблема техники связи. Классические разработки кодеров источников видеоинформации в силу недостатка априорной информации об источнике не позволяют достичь предельной эффективности кодирования. Повышение эффективности кодирования нестационарных сигналов (достижение высоких коэффициентов сжатия видеоинформации, определяемых эпсилон-энтропией источника при ограничении сложности кодера) особенно актуально в системах на кристалле, для которых типичны существенные ограничения на площадь кристалла, и, следовательно, на сложность кодера. Разработка методов кодирования, обеспечивающих информационное равновесие при передаче зашумленных видеосигналов, является сложной теоретической задачей, решение которой должно найти применение при создании современных кодеков видеоинформации, выполненных как системы на кристалле и видеосистемы на кристалле. Существенный вклад в решение проблем передачи, характерных для смешанных систем связи (непрерывный источник и цифровой канал связи), внесли работы: К. Шеннона, А. Н. Колмогорова, Б. Оливера, P. JL Добрушина, Б. С. Цыбакова, JL П. Ярославского, JI. И. Хромова, А. К. Цыцулина и др. Данная работа является развитием известных результатов и приложением их к кодированию телевизионных сигналов, в котором применяются методы кодирования с преобразованием (JPEG, MPEG и т. п.). В развитие этих методов внесли вклад У. Прэтт, Р. Гонсалес, Р. Вудс, Д. Сэломон, Я. Ричардсон, Ю. Б. Зубарев, В. П. Дворкович, М. И. Кривошеев, И. И. Цуккерман, А. А. Умбиталиев, Р. Е. Быков, А. И. Величкин и др.
В связи с нацеленностью данной работы на проектирование прикладных (в первую очередь бортовых) телевизионных систем акцент в работе делается на синтезе кодера источника'без учета, ограничений на сложность реализации декодера на приемном пункте.
Целью работы является определение предельной эффективности кодирования нестационарных телевизионных сигналов при ограничении сложности кодера. Для достижения поставленной цели были поставлены и решены следующие задачи:
1)!Показана возможность достижения информационного равновесия, т. е. равенства скорости создания информации источником, и пропускной способности канала, в смешанной системе связи, состоящей из непрерывного источника и дискретного канала, при определенной комбинации априорной информации, критерия качества и ограничения;
2) разработан адаптивный алгоритм кодирования для прикладных бортовых телевизионных систем с учетом ограничения сложности кодирования в условиях априорной неопределенности и нестационарности телевизионных сигналов;
3) разработана методика объективной оценки различных алгоритмов сжатия с учетом введенных меры нёстационарности и обобщенного показателя эффективности кодека;
4) сформированы компактные представительные выборки статических изображений и видео для определения эффективности кодирования различными алгоритмами.
5) определена предельная эффективность кодирования, при ограничении сложности кодера.
Предмет, и основные методы исследования. Основные подходы к кодированию телевизионных сигналов в. вещательных телевизионных системах и основные достижения' в этой, области достаточно подробно отражены в=литературе [1]-[13]. Проблематика кодирования'телевизионных сигналов в прикладных телевизионных системах нашла отражение в книгах по этой тематике [14]—[21], где также отражена специфика кодирования сигналов в прикладных телевизионных системах, отличающая; их от вещательных систем. Статья [22] дает обзор различных методов кодирования, телевизионных сигналов; достигнутые результаты в этой области и намечает дальнейшие направления исследований; связанные как с повышением качества кодирования^(понимаемого1 в смысле вносимых искажений),, так, и с достижением более высоких коэффициентов сжатия:
Вместе с тем; достижению высоких коэффициентов, сжатия, определяемых эпсилон-энтропией источника видеоинформации, препятствуют априорная неопределенность и нестационарность реальных изображений. На практике обычно, статистические свойства кодируемых сигналов известны, приблизительно, вследствие чего множество методов кодирования нацелены в первую' очередь на преодоление априорной неопределенности в статистических свойствах сигнала и его нестационарности. Решение этой проблемы было намечено в работах проф. Быкова Р. Е., в которых была учтена смена сюжета [23]. Статистическая./радиотехника [24]— [29] использует два подхода к преодолению априорной неопределенности: создание методов, устойчивых к отклонениям статистики сигнала от принятой модели и адаптивных методов. Практические методы сжатия изображений, базирующиеся на принципе устойчивости, обычно разрабатываются в два этапа: сначала синтезируется некий алгоритм для конкретного типа изображений, затем в него вводятся различные дополнения, призванные расширить диапазон априорной неопределенности статистик сигнала. Методы, базирующиеся, на принципе адаптации, изменяют свои параметры и/или структуру в зависимости от статистики сигнала. Так, известны изобретения методов кодирования, прямо, ставящие цель» достижения' минимума ошибки при заданной скорости передачи (т. е. эпсилон-энтропии) при неизвестных статистических свойствах источника сообщений [30]. При этом предлагается вести кодирование источника (сжатие информации) параллельно в нескольких* кодерах с различными методами (например, со спектральным, разложением по различным базисам) и в канал связи- передавать сигнал с выхода кодера:, обеспечивающего адаптивное приближение к эпсилон-энтропии, и код номера' кодера. Этот пример наглядно иллюстрирует общее правило: минимизация' скорости передачи при заданном: критерии качествам при* увеличении1 априорной-неопределенности требует увеличения сложности кодеров' и декодеров. Вместе с тем, в виду большой- априорной неопределенности и нестационарности реальных изображений! и видео представляется крайне сложно оценить эпсилон-энтропию источника. В' связи с этим, важной составляющей концепции кодирования является, адаптивность кодера к сюжету.
Проектирование систем связи согласно концепции К. Шеннона должно быть нацелено на достижение равенства эпсилон-энтропии источника и пропускной способности канала связи. И хотя Шеннон подчеркивал, что он рассмотрел ограничение мощности в канале лишь в качестве одного из примеров, это ограничение в теории*связи осталось доминирующим, оставив без внимания такое важное ограничение на кодер, как его сложность. Так, несмотря на большое количество работ, посвященных методам кодирования изображений, существующие алгоритмы сжатия получены без учета ограничения на сложность, хотя неявно и подразумевают ее. Вместе с тем, в связи с бурным развитием микроэлектроники и в связи с появлением систем на кристалле и видеосистем на кристалле [31], [32], синтез алгоритмов сжатия при наличии ограничения становится важным и ограничение на сложность должно быть введено с самого начала разработки алгоритма. Стремление обеспечить равенство скорости создания информации источником и пропускной способности канала связи при формализованных математически ограничениях неизбежно приведет к тому, что алгоритм, который минимизирует количество информации и максимизирует ее качество (в смысле среднеквадратической ошибки (СКО)), будет алгоритмом с потерями информации. При этом алгоритм может при приемлемом качестве обеспечить высокие коэффициенты сжатия. Стремление повысить коэффициент сжатия и обеспечить приемлемое качество восстановленного видео при реализации алгоритма кодирования в системах на кристалле должно учесть существующие ограничения, накладываемые на, реализацию алгоритма. При фиксированной технологии создания систем на кристалле (норме точности проектирования) одним из таких ограничений является ограничение на площадь кристалла, которая должна быть распределена таким образом между фотоприемной матрицей и вычислителем, чтобы обеспечить максимум некоторого показателя качества системы кодирования.
Для прикладных телевизионных систем постоянно требуется все большая разрешающая способность (число элементов разложения). Так, сегодня уже выпускаются матрицы форматом 10 Мпикселов, что превышает телевидение высокой четкости HD (2 Мпиксела) и HD2 (8 Мпикселов). Использование идеи переборного алгоритма, заложенной в MPEG, приведет к значительному увеличению сложности. Поэтому основное требование, предъявляемое к разрабатываемому алгоритму, состоит в том, что он должен быть простым. Такое ограничение диктует необходимость в разработке методики оценки такого упрощенного алгоритма. В телевидении вопросам оценки различных методов кодирования уделяется большое внимание. В телевизионном вещании получил широкое распространение метод экспертных оценок [33], который также нашел отражение в Международных рекомендациях [34]—[3 8]. Особенностью прикладных телевизионных систем является наличие эксперта, обрабатывающего видео или статические изображения. Оценка эффективности алгоритма сжатия для прикладных телевизионных систем должна быть осуществлена не на произвольных изображениях или видео, которые могут быть выбраны из разных классов и в достаточно большом количестве (негласно полагая при этом, что они являются представительными), а на основе компактной представительной выборки изображений или видео. Целесообразность введения последней есть следствие, во-первых, априорной неопределенности и нестационарности реальных изображений и видео, во-вторых - потребности получения объективной достовернойf оценки эффективности, кодера при допустимых временных затратах на анализ выбранного кодера.
В связи с этим основной^ задачей является разработка адаптивного алгоритма кодирования t видеоинформации для прикладных кадровых телевизионных систем разведки и землепользования» (статистика изображений в которых хорошо описывается экспоненциальной автокорреляционной функцией), обеспечивающего минимальное количество информации при максимуме ее качества с учетом ограничения на сложность реализаций алгоритма, накладываемого системами на кристалле, а также разработка методики оценки этого алгоритма.
На-пути решения поставленной задачи имеются трудности, разрешаемые различными методами: теоретические (методы теории информации, теории алгоритмов и теории сложности), компьютерного моделирования и экспериментальной оценки адаптивного алгоритма кодирования.
Научная новизна. Основным научным результатом является разработанный адаптивный алгоритм кодирования источника видеоинформации [А1] на основе трехмерного дискретного косинусного преобразования, обладающего максимальной эффективностью кодирования (оцениваемой по взвешенной сумме потери полезной информации, скорости передачи и сложности кодера).
Частные результаты [А2]-[А15]:
1. На основе введенного понятия сопряженной триады (априорной информации, критерия качества и совокупности ограничений) найдены решения уравнения связи для смешанной системы связи.
2. Введено понятие обобщенного показателя эффективности кодека, включающего вектор весовых коэффициентов (вектор концепции кодека) и совокупность частных информационных показателей качества кодека: потери полезной информации, скорости передачи и сложности кодера и декодера.
3. Для корректной оценки кодеров разработана методика, использующая обобщенный показатель эффективности кодека и компактную представительную» выборку сюжетов, сформированную на основе меры широкополосности и предложенной меры нестационарности сигналов изображения и видео.
Практическая значимость. Практическая значимость, работы определяется выигрышами, достигнутыми в эффективности разработанного метода адаптивного кодирования источника видеоинформации.
Разработанный алгоритм характеризуется следующими показателями:
• эффективность, определяемая с точки зрения предложенного обобщенного показателя кодера (учитывающего потерю полезной информации, скорость передачи и сложность кодера), превышает эффективность кодера MPEG-2 в два раза, кодера MPEG-4 в три раза;
• для видеоданных с малой скоростью движения коэффициент сжатия лежит в диапазоне от 300 до 400, что соответствует скорости передачи, равной 0,02 бит/пиксел, при примерно одинаковом с кодером MPEG-4 хорошем качестве восстановления видеоданных;
• для видеоданных с большой скоростью движения коэффициент сжатия лежит в диапазоне от 80 до 150 (алгоритм динамически приспосабливается к скорости движения, сохраняя высокое качество и относительно высокий коэффициент сжатия);
• алгоритм не уступает по качеству MPEG-4 и методу кодирования* на основе трехмерного дискретного косинусного преобразования без адаптации, но обеспечивает вычислительную сложность, на несколько порядков меньшую по сравнению с кодером MPEG-4.
Диссертация содержит введение, четыре главы и заключение. Первая глава посвящена обзору различных методов кодирования видеоинформации [1]—[21], [39], [40]—[62] и является попыткой определить возможность создания оптимальной системы передачи видеоинформации с учетом информационного равновесия в системе связи [14]—[18], т.е. равенства скорости создания информации источником и скорости ее передачи через канал при. заданном качестве информации. Спецификой обзора * является учет, с одной стороны, огромного количества методов кодирования^ видеоинформации, и бурного развития систем на кристалле, с другой [31], [32].
Заключение диссертация на тему "Адаптивное кодирование источника видеоинформации в системах на кристалле"
4.3 Выводы
1. Предложена мера нестационарности для оценки сигналов различного вида, например, для кусочно-стационарных процессов или с монотонно изменяющимися статистиками (например, винеровского процесса, определяемого как интеграл от белого шума, и имеющего линейно возрастающую дисперсию).
2. На основе введенной меры нестационарности и меры широкополосности оценены нестационарность и широкополосность статических изображений и видео и сформирована компактная представительная выборка сюжетов (статических изображений и видео). Мера нестационарности, наряду с мерой широкополосноти, может быть использована в задачах классификации изображений.
3. Разработана методика объективной оценки эффективности алгоритмов кодирования изображений, основанная на введенном обобщенном показателе эффективности и компактной представительной выборке сюжетов, сформированной с учетом широкополосности и предложенной меры нестационарности. Данная методика позволяет сравнивать эффективность кодирования нестационарных сигналов изображений различными алгоритмами и выбрать наилучший.
4. На основе разработанной методики экспериментально показано, что разработанный адаптивный алгоритм сжатия на основе трехмерного ДКП обладает максимальной эффективностью по сравнению с рассмотренными алгоритмами кодирования MPEG и алгоритмом кодирования на основе трехмерного ДКП без адаптации.
5. Разработанный алгоритм характеризуется основными параметрами:
• эффективность, определяемая с точки зрения предложенного обобщенного показателя кодера (учитывающего потери полезной информации, скорости передачи и сложности кодера) превышает эффективность кодера MPEG-2 в два раза, кодера MPEG-4 в три раза;
• для видеоданных с малой скоростью движения коэффициент сжатия лежит в диапазоне от 300 до 400, что соответствует скорости передачи, равной 0,02 бит/пиксел, при примерно одинаковым с кодером MPEG-4 относительно хорошем качестве восстановления видеоданных;
• для видеоданных с большой скоростью движения коэффициент сжатия лежит в диапазоне от 80 до 150 (алгоритм динамически приспосабливается к скорости движения, сохраняя высокое качество и относительно высокий коэффициент сжатия);
• алгоритм не уступает по коэффициенту сжатия MPEG-4 и методу кодирования на основе трехмерного ДКП без адаптации, но обеспечивает вычислительную сложность, на несколько порядков меньшую по сравнению с кодером MPEG-4.
Достигнутые характеристики делают разработанный алгоритм эффективным при передаче цифрового видеопотока по каналам связи с существенно ограниченной и нестационарной пропускной способностью (каналы групповой передачи данных, видео по требованию Интернет и др.).
6. На основе введенного обобщенного показателя эффективности осуществлено сравнение различных алгоритмов сжатия при различных векторах концепции кодера и показано, что в зависимости от вектора трехмерное ДКП может быть как эффективным, так и неэффективным способом кодирования.
ЗАКЛЮЧЕНИЕ
Данная диссертация посвящена решению задачи синтеза адаптивного алгоритма сжатия, обеспечивающего минимальное количество информации при максимуме ее качества, для прикладных телевизионных систем, реализуемых как видеосистемы на кристалле. Особенностью таких систем является жесткое ограничение на площадь кристалла, которая должна быть наилучшим образом распределена между фотоприемником и процессором обработки.
Задача синтеза оптимального алгоритма кодирования источника видеоинформации, обеспечивающего минимальное количество информации при максимуме ее качества, решалась в опоре на основные достижения теории информации и концепцию равновесного согласования источника информации с каналом связи. Такое согласование возможно только при наличии ограничения, сопряженного с априорной информацией и критерием качества. На этом пути было введено понятие сопряженной триады, включающее критерий качества, априорную информацию и ограничение как основные элементы внутреннего и внешнего проектирования, входящие в методологию системотехники. В теоретической части диссертации показано, что в смешанной системе связи может достигаться информационное равновесие при определенной комбинации априорной информации, критерия качества и ограничения. Обобщение концепции равновесного согласования на источники видеоинформации, обладающие нестационарностью, возможно путем использования в алгоритме кодирования процедуры адаптации к свойствам сюжета. Использование адаптации как меры борьбы с нестационарностью имеет целью выравнивание вероятностей вторичных символов, и при использовании в качестве критерия качества максимума модуля ошибки, а в качестве ограничения - совокупного усиление кодера, обеспечивается равенство скорости создания информации источником и пропускной способности канала связи. Реализация указанной стратегии равновесного согласования приводит к необходимости разработки адаптивного алгоритма сжатия, который должен учитывать ограничения на сложность, обусловленную его реализацией в системах на кристалле.
На этом пути автором разработан адаптивный алгоритм кодирования видеоинформации на основе трехмерного ДКП с адаптацией к скорости движения объектов в поле зрения телевизионной камеры (совместно с Ш. С. Фахми) и методика оценки его эффективности на компактной представительной выборке сюжетов (совместно с А. К. Цыцулиным, TIT. С. Фахми), сформированной автором из статических изображений и видео (с учетом разработанной автором методики оценки нестационарности по времени для видео), на основе обобщенного показателя эффективности кодера.
Итак, по диссертации можно сделать следующие выводы:
1. Разработан адаптивный алгоритм сжатия телевизионных сигналов в прикладных телевизионных системах на основе трехмерного ДКП, обеспечивающий максимальную эффективность согласно введенному обобщенному показателю эффективности кодера и учитывающий нестационарность и априорную неопределенность кодируемых телевизионных сигналов.
Алгоритм характеризуется следующими показателями:
• эффективность, определяемая с точки зрения предложенного обобщенного показателя кодера (учитывающего потери полезной информации, скорости передачи и сложности кодера) превышает эффективность кодера MPEG-2 в два раза, кодера MPEG-4 в три раза;
• для видеоданных с малой скоростью движения коэффициент сжатия лежит в диапазоне от 300 до 400, что соответствует скорости передачи, равной 0,02 бит/пиксел, при примерно одинаковым с кодером MPEG-4 относительно хорошем качестве восстановления видеоданных;
• для видеоданных с большой скоростью движения коэффициент сжатия лежит в диапазоне от 80 до 150 (алгоритм динамически приспосабливается к скорости движения, сохраняя высокое качество и относительно высокий коэффициент сжатия);
• алгоритм не уступает по качеству MPEG-4 и методу кодирования на основе трехмерного ДКП без адаптации, но обеспечивает вычислительную сложность, на несколько порядков меньшую по сравнению с кодером MPEG-4.
2. Введено понятие сопряженной триады (априорной информации, критерия качества и совокупности ограничений), обеспечивающей равновесие в уравнении связи, т. е. равенство скорости создания информации телекамерой и пропускной способности канала связи. На основе введенного понятия с учетом введенной А. Н. Колмогоровым эпсилон-энтропии с ограничением максимума отклонения принимаемого сигнала от передаваемого показано, что в смешанной системе связи с непрерывным источником и дискретным каналом возможно информационное равновесие.
3. При кодировании с преобразованием доступную сложность следует распределять между числом базисных функций и разрядностью их отсчетов таким образом, чтобы обеспечить минимум СКО передачи сигналов. При распределении доступной сложности существует оптимум разрядности и числа базисных функций.
4. Переход от ограничения числа передаваемых спектральных компонент сигнала к ограничению сложности кодера при кодировании с преобразованиями в ходе параметрического синтеза при учете ограничения сложности меняет приоритет при выборе базисных функций: в первом случае, когда сложность базисных функций не учитывается, выбираются те разложения, которые имеют максимальную скорость сходимости ряда (например, Карунена-Лоэва), во втором случае выбираются разложения с более простыми базисными функциями (например, Уолша-Адамара).
5. Ограничение сложности кодера не может назначаться произвольно, а должно учитывать соотношение полезной и шумовой информации в кодируемом сигнале и назначается исходя из правила усечения спектральных коэффициентов, начиная с того номера, где полезная информация меньше шумовой информации. Чем больше в кодируемом сигнале отношение полезной информации к шумовой информации, тем больше требуемая оптимальная сложность кодера, обеспечивающего максимальное качество кодирования в смысле минимума информационного риска.
6. Введено понятие обобщенного показателя эффективности кодера, включающее вектор концепции кодера и совокупность частных информационных показателей качества кодера: потери полезной информации, скорости передачи, сложности кодера.
7. Разработана методика объективной оценки эффективности алгоритмов кодирования изображений, основанная на введенном обобщенном показателе эффективности и компактной представительной выборке сюжетов, сформированной с учетом широкополосности и предложенной меры нестационарности. Данная методика позволяет оперативно получать формализованные оценки эффективности кодирования нестационарных сигналов изображений различными алгоритмами и выбрать наилучший.
Разработанный адаптивный алгоритм кодирования видеоинформации нашел применение в ОКР «Цифра-СФ» (ФГУП «НИИТ») и «Цифра-ЗБ-ЛЭТИ» (СПбГЭТУ «ЛЭТИ»), о чем имеется 2 акта о внедрении.
Совокупность сделанных выводов позволяет утверждать, что поставленная в диссертации задача разработки равновесного адаптивного алгоритма кодирования источника видеоинформации решена.
Библиография Зубакин, Игорь Александрович, диссертация по теме Радиотехника, в том числе системы и устройства телевидения
1. Цифровое телевидение / Под ред. М. И. Кривошеева. М.: Связь, 1980.-264 с.
2. Цифровое кодирование телевизионных изображений / Под ред. И. И. Цуккермана. М.: Радио и связь, 1981. - 240 с.
3. Цифровая обработка телевизионных и компьютерных изображений / Под ред. Ю. Б. Зубарева, В. П. Дворковича. 2-е изд., перераб. и доп. М.: HAT, 1997.-255 с.
4. Красильников Н. Н. Теория передачи и восприятия изображений: Теория передачи изображений и ее приложения. М.: Радио и связь, 1986. -248 с.
5. ПрэттУ. Цифровая обработка изображений. Т. 1. М.: Мир, 1982. -312 с.
6. Методы передачи изображений. Сокращение избыточности // Сб. статей / Под ред. ПрэттаУ. К.; Пер. с англ. под ред. JI. С. Виленчика. М.: Радио и связь, 1983. - 264 с.
7. Александров В. В., Горский Н. Д. Представление и обработка изображений: рекурсивный подход. — JL: Наука, 1985. 192 с.
8. Быков Р. Е., Гуревич С. Б. Анализ и обработка цветных и объемных изображений. М.: Радио и связь, 1984. - 248 с.
9. Цифровое преобразование изображений: Учебное пособие для вузов / Р. Е. Быков, Р. Фрайер, К. В. Иванов, А. А. Манцветов; Под ред. Р. Е. Быкова. М.: Горячая линия - Телеком, 2003. - 228 с.
10. ГонсалесР., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2006. - 1072 с.
11. Сэл омон Д. Сжатие данных, изображений и звука. — М.: Техносфера, 2004. 368 с.
12. Ричардсон Я. Видеокодирование. Н.264 и MPEG-4 — стандарты нового поколения. М.: Техносфера, 2005. - 366 с.
13. Воробьев В. И., ГрибунинВ.Г. Теория и практика вейвлет-преобразования. СПб: ВУС, 1999. - 290 с.
14. Твердотельное телевидение: телевизионные системы с переменными параметрами на ПЗС и микропроцессорах / Л. И. Хромов, Н. В. Лебедев, А. К. Цыцулин, А. Н. Куликов. М.: Радио и связь. 1986. - 184 с.
15. Хромов Л. И., Цыцулин А. К., Куликов А. Н. Видеоинформатика: передача и компьютерная обработка видеоинформации. М.: Радио и связь, 1991.- 192 с.
16. Хромов Л. И. Теория информации и теория познания. СПб, РФО, 2006.-200 с.
17. Цыцулин А. К. Телевидение и космос. СПб, СПбГЭТУ «ЛЭТИ», 2003.-228 с.
18. Твердотельная революция в телевидении / Под ред. А. А. Умбиталиева, А. К. Цыцулина. М.: Радио и связь, 2006. - 312 с.
19. Грязин Г. Н. Системы прикладного телевидения: Учеб. пособие для вузов. СПб.: Политехника, 2001. - 277 с.
20. Гуревич С. Б. Теория и расчет невещательных систем телевидения. -Л.: Энергия, 1970. 236 с.
21. Гуревич С. Б., Гуревич Б. С., Жумалиев К. М. Проблемы информационной оптоэлектроники. СПб: Наука. 2008. - 210 с.
22. Гласман К. Ф. Современное состояние и перспективы развития систем видеокомпрессии. Научно-технический журнал «625». 2009, Вып. 1, 2, 4, 7.
23. Быков Р. Е., Шиманский Е. Ю. Сокращение временной избыточности цифровых сигналов в системах вещательного телевидения. Известия высших учебных заведений России. Радиоэлектроника. 2002. №1. С. 62-67.
24. Статистическая теория связи и ее практические приложения / Под ред. Б. Р. Левина. М.: Связь, 1979. - 288 с.
25. Маригодов В. К., Бабуров Э. Ф. Синтез оптимальных радиосистем с адаптивным предыскажением и корректирование сигналов. М.: Радио и связь, 1985.-248 с.
26. Левин Б. Р., Шварц В. Вероятностные модели и методы в системах связи и управления. М., Радио и связь, 1985. — 312 с.
27. Стратонович Р. Л. Принципы адаптивного приема. — М.: Сов. радио, 1973.- 144 с.
28. Репин В. Г., Тартаковский Г. П. Статистический синтез при априорной неопределенности и адаптация информационных систем. — М.: Сов. радио, 1977.-432 с.
29. Помехоустойчивость и эффективность систем передачи информации / Зюко А. Г., Фалько А. И., Панфилов И. П. и др. М.: Радио и связь, 1985.-272 с.
30. Pat. WIPO IPC7 H04N 7/30. Method of selecting among N "spatial video codes" the optimum codec for a same input signal / Reichel J., Ziliani F. Publ. 01.07.2004.
31. НемудровВ., Мартин Г. Системы-на-кристалле. Проектирование и развитие. Основные принципы, методы, программные средства. — М.: Техносфера, 2004. 216 с.
32. Сверхбольшие интегральные схемы и современная обработка сигналов. Под ред. С. Гуна, X. Уайтхауса, Т. Кайлата. М.: Мир, 1989. - 472 с.
33. Антипин М. В. Интегральная оценка качества телевизионного изображения. — Л.: Наука, 1970. 154 с.
34. Recommendation ITU-R ВТ.500-11. Methodology for the subjective assessment of the quality of television pictures.
35. Recommendation ITU-R BS.1284-1. General methods for the subjective assessment of sound quality.
36. EBU Technical Recommendation R90-2000. The subjective evaluationof the quality of sound programme material.
37. EBU document Tech. 3286 (1997). Assessment methods for the subjective evaluation of the quality of sound programme material — Music.
38. Recommendation ITU-T P.911. Subjective audiovisual quality assessment methods for multimedia applications.
39. Макфарлейн. Дискретная передача изображений пятьдесят лет назад // ТИИЭР. 1972. Т. 60, № 7. С. 15-18.
40. Huffman D. A Method for the Construction of Minimum Redundancy Codes // Proceedings of the IRE. 1952. Vol. 40, № 9. - P. 1098-1101.
41. Knuth D. E. Dynamic Huffman Coding // Journal of Algorithms. 1985. Vol. 6.-P. 163-180.
42. Vitter J. S. Design and Analysis of Dynamic Huffman Codes // Journal of the ACM. 1987. Vol. 34, № 4. - P. 825-845.
43. RissanenJ., Langdon G. G. Arithmetic coding // IBM J. Res. Dev. -1979. Vol. 23, №2.-P. 149-162.
44. Langdon G. G., Rissanen J. Compression of black-white images with arithmetic coding // IEEE Trans. Commun COM. 1981. Vol. 29, № 6. - P. 858867.
45. Langdon G. G. An introduction to arithmetic coding // IBM J. Res. Dev. 1984. Vol. 28, № 2. - P. 135-149.
46. Howard P. G., Vitter J. S. Analysis of Arithmetic Coding for Data Compression // Information Processing and Management. 1992. Vol. 28. - P. 749-763.
47. Moffat A., Neal R., Witten I. H. Arithmetic Coding Revisited // ACM Transactions on Information Systems. 1998. Vol. 16, № 3. - P. 256-294.
48. Ziv J., Lempel A. A Universal Algorithm for Data Compression // IEEE Transactions on Information Theory. 1977. Vol. IT-23, № 3. - P. 337-343.
49. Ziv J., Lempel A. Compression of Individual sequences via Variable-Rate Coding // IEEE Transactions on Information Theory. 1978. Vol. IT-24, № 5.-P. 530-536.
50. Phillips D. LZW Data Compression // The Computer Application Journal, Circuit Cellar Inc. 1992. Vol. 27. - P. 36-48.
51. Rao R. M., Bopardikar A. S. Wavelet Transforms: Introduction to Theory and Application, Reading, MA, Addison-Wesley. 1998. 310
52. Фахми Ш. С. Пирамидально-рекурсивный метод кодирования и декодирования видеоинформации. Вопросы радиоэлектроники, сер. Техника телевидения, 2007, вып. 2, с. 43-51.
53. Ahmed N., Natarajan Т., Rao R. К. (1974) Discrete Cosine Transform // IEEE Transactions on Computers. 1974. Vol. 23. - P. 90-93.
54. Akansu Ali, Haddad R. Multiresolution Signal Decomposition, San Diego, С A, Academic Press. 1992.
55. AneddaC., Felician L. P-Compressed Quadtrees for Image Storing // The Computer Journal. 1988. Vol. 31, № 4. - P. 353-357.
56. Feig E. N., Linzer E. Discrete Cosine Transform Algorithms for Image Data Compression // Proceedings Electronic Imaging '90 East. 1990. Boston, MA. P. 84-87.
57. Chen Y.-L., Siu W.-C. Variable temporal length 3-D Discrete Cosine Transform coding // IEEE Tran. Image Proc. 1997. Vol. 6, № 5. - P. 758-763.
58. Lee M., Chan R., Adjieroh D. Quantization of 3D-DCT coefficients and scan order for video compression // J. Vis. Commun. Image Represent. 1997. Vol. 8.-P. 405-422.
59. WestwaterR., FurhtB. Real-time video compression. Norwell, MA: Kluwer Academic Publishers, 1997. 165 p.
60. Westwater R., Furht B. The XYZ algorithm for real-time compression of full-motion video // Real-time imaging J. 1996. Vol. 2. - P. 19-34.
61. Chan Y-L., Siu W.-C. Variable temporal-length 3-D discrete cosine transform coding // IEEE Trans, on image proc. 1997. Vol. IT-6, № 5. - P. 758763.
62. Abousleman G. P., Marcellin M. W., Hunt B. R. Compression of hyperspectral imagery using the 3-D DCT and hybrid DPCM/DCT // IEEE Trans, of geoscience and remote sensing. 1995. Vol. GRS-33, № 1. - P. 26-34.
63. Шеннон К. Работы по теории информации и кибернетике. М.: Иностранная литература, 1963. — 832 с.
64. Колмогоров А. Н. Теория информации и теория алгоритмов. — М.: Наука, 1987.-304 с.
65. Колесник В. Д., ПолтыревГ. Ш. Курс теории информации. — М.: Наука, 1982.-416 с.
66. Винер Н. Кибернетика или управление и связь в животном и машине. М., Сов. радио, 1968. - 328 с.
67. Котельников В. А. Теория потенциальной помехоустойчивости. -М., Энергоиздат, 1956 152 с.
68. Verdu S. Fifty years Shannon theory // IEEE Transaction on information theory. 1998. Vol. 44, №6. - P. 2057-2078.
69. Быховский M. А. Пионеры информационного века. История развития теории связи. М., Техносфера, 2006. - 376 с.
70. Чисар И., Кернер Я. Теория информации. М., Мир, 1985.
71. Кузнецов Н. А. Информационное взаимодействие в технических и живых системах. Информационные процессы. Т. 1, №1, с. 1-9.
72. Хромов JI. И., Ковригин А. Б., Мартынихин А. В. Принцип равновесного согласования в теории информации. ДАН, т. 344, №1, с. 30, 31.
73. Хромов JI. И. Теоретические аспекты передачи информации в реальном масштабе времени. Телевизионная техника и связь, 1995, с. 21—27.
74. Идеальное линейное кодирование / Хромов JI. И., Ковригин А. Б., Цыцулин А. К., Мартынихин А. В. // Техника средств связи, сер. Техника телевидения, 1987, вып. 4, с. 3 10.
75. Пилипчук Н. И., Яковлев В. П. Адаптивная импульсно-кодовая модуляция. М.: Радио и связь, 1986. - 296 с.
76. Николаев Б. И. Последовательная передача дискретных сообщений по непрерывным каналам с памятью. М.: Радио и связь, 1988. — 264 с.
77. Галлагер Р. Теория информации и надежная связь. — М.: Сов. Радио, 1974.-720 с.
78. Costas J. P. Coding with linear systems // Proceeding IRE. 1952. Vol. 40. -P. 1101-1103.
79. Френке JT. Теория сигналов. М., Мир, 1974. - 344 с.
80. Цыбаков Б. С. Линейное кодирование сообщений. Радиотехника и электроника, 1962, т. 7, вып. 1, с. 375-385.
81. КошелевВ. Н. Квантование с минимальной энтропией. Проблемы передачи информации, 1963, вып. 3, с. 151—156.
82. Витерби А. Д., Омура Дж. К. Принципы цифровой связи и кодирования. — М.: Радио и связь, 1982. 536 с.
83. Величкин А. И. Передача аналоговых сообщений по цифровым каналам связи. М.: Радио и связь, 1983. — 240 с.
84. Gray R. М., Neuhoff D. L. Quantization. IEEE Transaction, on information theory, vol.44, №6, October 1998, pp. 2325-2383.
85. Горбунов А. К., Пинскер M. С. Эпсилон-энтропия с задержкой гауссовского зашумленного сигнала. Проблемы передачи информации, 1988, вып. 3, с. 18-23.
86. Добрушин Р. Л., Цыбаков Б. С. Передача информации с дополнительным шумом. Проблемы передачи информации, 1963, вып. 14, с. 21-42.
87. Хромов Л. И., Литвинчук Л. А. Оценка пропускной способности телевизионного канала с учетом линейных искажений и нескольких источников шума. Техника средств связи, сер. Техника телевидения, 1981, вып. 1, с. 3-10.
88. Вудворд Ф. М. Теория вероятностей и теория информации с приложением к радиолокации. М., Сов. Радио, 1965. - 128 с.
89. Kolmogorov А. N. On the Shannon theory of information transmissionin the case of continuous signals I I IEEE Trans. Inform. Theory. — 1956. Vol. IT-2. -P. 102-108.
90. Талер В. Теоретические ограничения скорости передачи информации / Теория информации и ее приложения. М.: ГИФ-MJI, 1959. -328 с.
91. Черри К. Человек и информация. М.: Связь, 1972. - 368 с.
92. Ахмед Н., Рао К. Р. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980. — 248 с.
93. Аксенов О. Ю., Борисов Ю. И. К разрядности вычисления БПФ при его реализации на процессоре Л1879ВМ1 (NM6403). // Цифровая обработка сигналов, 2004, №2, с. 40-43.
94. Солодовников В. В., Тумаркин В. И. Теория сложности, системный синтез и автоматизация проектирования. В сб. Информатика, управление, вычислительная техника. М.: Машиностроение, 1987. - 272 с.
95. Клир Дж. Системология. М.: Радио и связь, 1990. - 544 с.
96. Успенский В. А., Семенов А. Л. Теория алгоритмов: основные открытия и приложения. М.: Наука, 1987. - 288 с.
97. Новик Д. А. Эффективное кодирование. М.-Л.: Энергия, 1965. -236 с.
98. Оливер Б. Эффективное кодирование // Теория информации и ее приложения. — М.: Физматгиз, 1959. С. 158-191.
99. Свириденко В. А. Анализ систем со сжатием данных. — М.: Связь, 1977.- 184 с.
100. БлейхутР. Быстрые алгоритмы цифровой обработки сигналов. — М.: Мир, 1989.-448 с.
101. НуссбаумерГ. Быстрое преобразование Фурье и алгоритмы вычисления сверток. Пер. с англ. Ю. Ф. Касимова и И. П. Пчелинцева под ред. чл.-кор. АН КазССР В. А. Амербаева и Т. Э. Кренкеля. М.: Радио и связь, 1985.-248 с.
102. Левит А. Б. Введение в общую теорию телевидения. М.: Советское радио, 1967. - 116 с.
103. ОкуневЮ. Б., Плотников В. Г. Принципы системного подхода к проектированию в технике связи. 1976. М.: Связь, 1976, — 183 с.
104. Казаринов Ю. М. Радиотехнические системы. Учебное пособие для вузов специальности «Радиотехника». М.: Academia, 2008. - 590 с.
105. ГуткинЛ. С. Оптимизация радиоэлектронных устройств по совокупности показателей качества. М.: Сов. Радио, 1985. — 368 с.
106. Моисеев Н. Н. Математические задачи системного анализа. — М.: Наука, 1981.-487 с.
107. Вайнштейн Л. А., ЗубаковВ. Д. Выделение сигналов на фоне случайных помех. М.: Сов. Радио, 1960. - 448 с.
108. Миленький А. В. Классификация сигналов в условиях неопределенности. М.: Сов. радио, 1975. — 328 с.
109. Умбиталиев А. А. Перспективы развития цифрового телерадиовещания: комплексное решение внедрения цифрового телевидения в регионах // Вопросы радиоэлектроники. Сер. Техника телевидения. 2008. Вып. 2. С. 3-8.
110. Грушвицкий Р. И., Мурсаев А. X., Угрюмов Е. П. Проектирование систем на микросхемах программируемой логики. — СПб.: БХВ-Петербург, 2002. 606 с.
111. Авторский список литературы
112. Публикации в изданиях, рекомендованных ВАК России:
113. А1. Зубакин, И. А. Адаптивный алгоритм кодированиявидеоинформации на основе трехмерного дискретного косинусного преобразования Текст. / И. А. Зубакин, Ш. С. Фахми // Известия вузов. Сер. Радиоэлектроника. 2010. - Вып. 1. - С. 49-54.
114. Другие статьи и материалы конференций'.
115. А5. Зубакин, И. А. Влияние вида ограничения на линейное кодирование Текст. / И. А. Зубакин, А. К. Цыцулин // Вопросы радиоэлектроники. Сер. Техника телевидения. 2006. - Вып. 1. - С. 79-87.
116. А6. Зубакин, И. А. Моделирование влияния ограничения сложности кодера на качество кодирования изображений с преобразованием Текст. / И. А. Зубакин, А. К. Цыцулин // Вопросы радиоэлектроники. Сер. Техника телевидения. — 2006. — Вып. 2. С. 32-40.
117. А7. Зубакин, И. А. Обзор методов кодирования и декодирования изображений Текст. / И. А. Зубакин, Ш. С. Фахми // Вопросы радиоэлектроники. Сер. Техника телевидения. — 2008. — Вып. 1. С. 13—41.
118. А8. Зубакин, И. А. Решения уравнения связи Текст. / И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // Вопросы радиоэлектроники. Сер. Техника телевидения. — 2008. Вып. 2. - С. 9—27.
119. All. Зубакин, И. А. Решения уравнения связи Текст. / И. А. Зубакин, Ш. С. Фахми, А. К. Цыцулин // Научно-технические проблемы в промышленности: Труды конф., г. С.-Петерб., 12-14 ноября 2008 г. СПб.: Политехника-сервис, 2008. - С. 374-379.
-
Похожие работы
- Модели, методы и алгоритмы кодирования изображений в устройствах систем на кристалле
- Управление параметрами алгоритма сжатия видеоинформации при передаче данных в системах мобильной связи
- Вероятностные методы экономного кодирования видеоинформации
- Алгоритмы маскирующих преобразований видеоинформации
- Разработка быстродействующих алгоритмов компрессии видеоданных с использованием дельта-преобразований второго порядка
-
- Теоретические основы радиотехники
- Системы и устройства передачи информации по каналам связи
- Радиотехника, в том числе системы и устройства телевидения
- Антенны, СВЧ устройства и их технологии
- Вакуумная и газоразрядная электроника, включая материалы, технологию и специальное оборудование
- Системы, сети и устройства телекоммуникаций
- Радиолокация и радионавигация
- Механизация и автоматизация предприятий и средств связи (по отраслям)
- Радиотехнические и телевизионные системы и устройства
- Оптические системы локации, связи и обработки информации
- Радиотехнические системы специального назначения, включая технику СВЧ и технологию их производства