автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.18, диссертация на тему:Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных
Автореферат диссертации по теме "Интегральная оценка качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных"
На правах рукописи
Гриненко Евгения Николаевна
ИНТЕГРАЛЬНАЯ ОЦЕНКА КАЧЕСТВА АУДИОВИЗУАЛЬНЫХ ПРОГРАММ В ЦИФРОВЫХ ТЕЛЕВИЗИОННЫХ СИСТЕМАХ С КОМПРЕССИЕЙ ДАННЫХ
Специальность: 05.11.18 - Приборы и методы преобразования изображений и
звука (технические науки)
Автореферат диссертации на соискание ученой степени кандидата технических наук
15 янз 2015
Санкт-Петербург
2014
005557380
005557380
Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего образования «Санкт-Петербургский государственный университет кино и телевидения».
Научный руководитель:
Константин Францевич Гласман, кандидат технических наук, доцент
Официальные оппоненты:
Николай Николаевич Красильников,
заслуженный деятель науки и техники РФ,
доктор технических наук, профессор,
Санкт-Петербургский государственный университет
аэрокосмического приборостроения,
профессор кафедры информационно-сетевых технологий
Дмитрий Александрович Ткаченко кандидат технических наук, доцент, ОАО "МАРТ", научный руководитель
Ведущая организация:
ЗАО «МНИТИ»
Защита диссертации состоится «22» января 2015 г. в 12.00 часов на заседании диссертационного совета Д 210.021.01 на базе Санкт-Петербургского государственный университета кино и телевидения по адресу: 191119, г. Санкт-Петербург, ул. Правды д.13.
С диссертацией можно ознакомиться в библиотеке и на сайте СПбГУКиТ Автореферат разослан «У^» ^¿.¡ССС^. 2014 г.
И.о. ученого секретаря диссертационного совета Д 210.021.01
И.Г.Чезлов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Телевизионное вещание претерпевает сегодня радикальные трансформации, связанные с использованием информационных и сетевых технологий. Телевизор перестает быть единственным устройством воспроизведения аудиовизуальных материалов. Телевизионные программы могут быть воспроизведены на экране стационарного компьютера, ноутбука, карманного компьютера, мобильного телефона. Телевизионный зритель скоро захочет получать в любом месте и в любое время не просто телевизионную программу, фильм или аудиовизуальный материал, а персонализированный зрительный и слуховой опыт, впечатления, эмоции, переживания.
Прогресс во всех приложениях техники цифрового телевизионного вещания неразрывно связан с совершенствованием методов и средств компрессии, или сжатия потоков цифровых видео и звуковых данных. Именно компрессия делает экономически реализуемыми все новые телевизионные службы, поскольку она позволяет экономно расходовать самый дорогой ресурс систем коммуникаций и информационных систем - пропускную способность каналов связи. Применение компрессии требует решения задачи оптимизации, направленной на достижение максимального уровня качества воспроизведения изображения и звука при удовлетворении технических ограничений, связанных с пропускной способностью каналов связи.
Определение оптимальных значений параметров кодеков видео и звуковых данных обычно решается раздельно для изображения и звука, хотя уже много лет назад были проведены первые исследования, которые показали, что оценки качества воспроизведения изображения и звука в аудиовизуальных программах не являются независимыми. Методы раздельной оценки качества воспроизведения и изображения и звука достаточно хорошо разработаны в телевидении и звукотехнике. Раздельная оптимизация параметров систем обработки изображения и звука действительно целесообразна в системах телевидения без компрессии и в системах с небольшой компрессией данных. В таких системах скорость потока данных определяется практически скоростью видеопотока.
Пропускная способность каналов связи систем телевизионного вещания, мобильных и сетевых аудиовизуальных служб значительно меньше суммарной скорости потоков некомпрессированных видео- и аудиоданных. Для передачи мультимедийных данных по таким каналам связи необходимо применять компрессию высокой степени. Надо иметь в виду, что сигнал изображения может быть значительно компрессирован без недопустимых искажений. Степень компрессии сигнала звука при сопоставимом уровне качества воспроизведения существенно меньше. При доведении суммарной скорости потока мультимедийных данных до величины, равной пропускной способности канала связи, относительные различия между скоростями потоков видео и аудиоданных значительно уменьшаются. В этих условиях взаимная зависимость оценок качества воспроизведения изображения и звука в аудиовизуальных программах становится значимой. Однако для использования этой взаимозависимости на практике необходим новый подход к оптимизации параметров кодеков компрессии, основанный на интегральной оценке качества в телевидении и учитывающий феномен межсенсорного взаимодействия при восприятии аудиовизуальных программ. Такой подход соответствует принципу
целостности восприятия как процесса формирования целостного образа предмета, возникающего в результате воздействия объективного мира на органы чувств.
Надо признать, что работы, направленные на исследование методов интегральной, или мультимодальной оценки качества аудиовизуальных программ и совместную оптимизацию кодеков видео и аудио сигналов, являются важными и актуальными на современном этапе развития техники телевизионного вещания и сетевых мобильных мультимедийных коммуникаций.
Целью диссертационной работы является разработка методов интегральной оценки качества аудиовизуальных программ в цифровых телевизионных системах с компрессией данных.
Для достижения поставленной цели в диссертационной работе поставлены и решены следующие задачи:
1. Анализ тенденций развития телевизионных систем и актуальных задач в области оценки качества аудиовизуальных программ
2. Разработка методики интегральной, или мультимодальной оценки качества аудиовизуальных программ.
3. Разработка шкалы оценки искажений, обладающей свойствами шкалы отношений.
4. Экспериментальное исследование влияния параметров кодеков компрессии видео и аудио сигналов и содержания аудиовизуальных программ на интегральную оценку качества в цифровых телевизионных системах с компрессией данных.
5. Оценка значимости кросс-модального взаимодействия компонентов аудиовизуальной программы в цифровых телевизионных системах с компрессией данных.
6. Разработка математической модели субъективного восприятия, позволяющей предсказывать интегральную оценку качества аудиовизуальных программ, прошедших цикл компрессии-декомпрессии в цифровых мобильных телевизионных системах с компрессией данных.
7. Применение разработанных методов и моделей для решения задач оптимизации, имеющих целью:
• увеличение уровня качества воспроизведения аудиовизуальных программ при удовлетворении технических ограничений, связанных с пропускной способностью каналов связи в цифровых мобильных телевизионных системах с компрессией данных;
• минимизацию требуемой пропускной способности каналов связи при заданном уровне качества воспроизведения аудиовизуальных программ в цифровых мобильных телевизионных системах с компрессией данных.
Основные методы исследования. Исследования проведены с использованием принятых в телевидении методов планирования и проведения зрительских экспертиз, методов статистической проверки гипотез, дисперсионного и регрессионного анализа.
Научная новизна диссертационной работы состоит в следующем:
1. Разработана методика проведения экспериментов по интегральной оценке качества аудиовизуальных программ, учитывающая восприятие семантической и эстетической информации в цифровых телевизионных системах с компрессией данных. Методика позволяет проводить эксперименты по мультимодальной оценке, интегрирующей зрительное и слуховое восприятие искажений в цифровых телевизионных системах с компрессией данных.
2. Разработана шкала оценки искажений аудиовизуальных программ, в которой в явном виде вводится категория оценки, эквивалентной нулевому значению качества, и которая обладает свойствами шкалы отношений.
3. Показано, что интегральная оценка качества аудиовизуальных программ в значительной степени зависит от жанра и содержания программ. Получены количественные оценки влияния содержания на интегральную оценку качества аудиовизуальных программ.
4. Предложена двухуровневая структура математической модели субъективного восприятия, описывающей интегральную оценку качества аудиовизуальных программ в отношении искажений компрессии: зависимости показателей качества изображения и звука как функции параметров кодеков компрессии видео и аудио сигналов (первый уровень); зависимость интегрального качества мультимедийных программ как функция показателей качества изображения и звука (второй уровень).
5. Экспериментально доказано, что для описания интегральной оценки качества аудиовизуальных программ на втором уровне математической модели субъективного восприятия целесообразно использовать полиномиальную функцию второй степени от двух переменных - показателей качества изображения и звука, причем эффект кросс-модального взаимодействия отображается путем включения мультипликативного члена — произведения показателей качества изображения и звука.
Практическая ценность. Значение результатов диссертационной работы для практики заключается в следующем:
1. Разработанные шкала оценки искажений и методика проведения экспериментов могут использоваться при проведении исследований по интегральной оценке качества аудиовизуальных программ в системах цифрового телевизионного вещания и сетевых мультимедийных коммуникаций.
2. Разработанная математическая модель субъективного восприятия аудиовизуальных программ может использоваться для совместной оптимизации параметров кодеков компрессии видео и аудио данных в системах цифрового мобильного телевизионного вещания и сетевых мультимедийных коммуникаций.
3. Адаптивное распределение пропускной способности канала связи между потоками видео и аудио данных в соответствии с жанром и содержанием аудиовизуальной программы позволяет увеличить уровень интегрального
качества воспроизведения аудиовизуальных программ (на 2-3 балла пятибалльной шкалы в зависимости от жанра программы и скорости потока) при заданной общей скорости потока передаваемых данных.
4. Адаптивное управление скоростями потоков видео и аудио данных в соответствии с жанром и содержанием аудиовизуальных программ позволяет достичь сокращения объема передаваемых данных и средней пропускной способности канала связи на интервале времени более суток при заданном уровне интегрального качества воспроизведения аудиовизуальных программ (на 35-41% в зависимости от уровня качества).
Научные положения, выносимые на защиту:
1. Методика интегральной оценки качества аудиовизуальных программ должна основываться на информационном подходе и учитывать восприятие семантической и эстетической информации.
2. Для получения пятибалльной шкалы оценки искажений, обладающей свойствами шкалы отношений, следует использовать следующие формулировки оценок: 5 - искажения незаметны, 4 - искажения немного заметны, но не мешают, 3 - искажения слегка мешают, 2 - искажения мешают и раздражают, 1 - искажения очень сильно раздражают, 0 - искажения предельно раздражают.
3. Математическую модель субъективного восприятия, позволяющую предсказывать интегральную оценку качества аудиовизуальных программ, целесообразно строить по двухуровневой схеме. На первом уровне модель должна описывать зависимости показателей качества изображения и звука как функции параметров кодеков компрессии видео и аудио сигналов. На втором уровне модель должна описывать зависимость интегрального качества аудиовизуальных программ как функцию показателей качества изображения и звука.
4. Для описания интегральной оценки качества аудиовизуальных программ на втором уровне математической модели субъективного восприятия достаточно использовать полиномиальную функцию второй степени от двух переменных - показателей качества изображения и звука, причем для отображения эффекта кросс-модального взаимодействия необходимо включение мультипликативного члена — произведения показателей качества изображения и звука.
5. Для увеличения уровня интегрального качества воспроизведения аудиовизуальных программ при заданной пропускной способности канала связи или сокращения объема передаваемых данных и средней пропускной способности канала связи при заданном уровне интегрального качества воспроизведения целесообразно использовать адаптивное распределение пропускной способности канала связи между потоками видео и аудио данных и управление общей скоростью потока данных в соответствии с жанром и содержанием аудиовизуальной программы.
Реализация результатов работы
Разработанные в диссертационном исследовании шкала оценки искажений и методика проведения экспериментов применены при проведении исследований по оценке качества в системах цифрового телевизионного вещания и сетевых мультимедийных коммуникаций и выполнении одной научно-исследовательской и двух опытно-конструкторских работ, направленных на разработку цифровых телевизионных устройств, выполненных по заказу ОАО «Научно-исследовательский институт телевидения»: НИР «Разработка прототипа устройства для экспресс-анализа и оценки качества ТВ изображения», ОКР «Разработка методов оценки качества изображения стереоскопического цифрового телевидения», ОКР «Разработка алгоритмов контроля и мониторинга трактов коммутации и распределения цифровых потоков». Имеется акт о внедрении.
Апробация работы
Основные положения и результаты диссертационной работы докладывались и обсуждались на конференциях Международного съезда вещателей IBC (2008, 2009, 2011, 2014 гг., г. Амстердам, Нидерланды): на Международной конференции по бытовой электронике Института инженеров по электротехнике и радиоэлектронике IEEE ICCE-Berlin 2014 (7-10 сентября 2014г., г. Берлин, Германия); на 14 Международном симпозиуме по бытовой электронике Института инженеров по электротехнике и радиоэлектронике ISCE2010 (7-10 июня 2010г, г. Брауншвайг, Германия); на Международных конференциях «Телевидение: передача и обработка изображений» (2009, 2011 гг., г. Санкт-Петербург); на IV Международной научно-технической конференции: «Запись и воспроизведение объемных изображений в кинематографе и других отраслях» (26-27 апреля 2012г., г. Москва); на VI Всероссийской межвузовской конференции молодых ученых (14 — 17 апреля 2009 г., г. Санкт-Петербург); на Всероссийской научно-практической конференции «Прошлое-настоящее-будущее СПбГУКиТ» (29-30 октября 2013 г., г. Санкт-Петербург); на научно-технических конференциях профессорско-преподавательского состава в рамках Недели науки СПбГУКиТ (2009, 2010, 2011 гг., г. Санкт-Петербург).
Публикации. По материалам диссертации опубликовано 16 печатных работ.
Структура и объём работы. Диссертационная работа состоит из введения, четырёх разделов, заключения и списка литературы, включающего 301 наименование. Текст диссертации изложен на 175 страницах, содержит 32 рисунка и 11 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении содержится обоснование актуальности и практической значимости рассматриваемой проблемы, освещается её современное состояние. Сформулированы задачи исследования и научные положения, выносимые на защиту.
В первой главе выполнен анализ тенденций развития и современного состояния цифровых телевизионных систем, приведен обзор работ, посвященных методам оценки качества впечатления, обоснована необходимость учета феномена межсенсорного взаимодействия при восприятии аудиовизуальных программ.
Особенность современного этапа развития телевизионного вещания как области техники определяют главные тенденции: растущее использование
аудиовизуальной информации в сетях передачи данных на фоне конвергенции телевидения, компьютерной техники и сетевых технологий, возрастающая роль интерактивности и бурное распространение мобильных аудиовизуальных служб.
Задача современных исследований в области оценки качества - принимать во внимание все аспекты создания целостного подхода к оценке качества, который позволит определить интегральное качество с учетом характеристик пользователя, системы и контекста использования. Разработка новых методов оценки качества, ориентированных на пользователя, должна осуществляться с использованием некоторых базовых принципов. Во-первых, восприятие качества — это активный процесс, включающий различные уровни обработки информации человеком. Во-вторых, должен быть учтен принцип целостности впечатления пользователя, основанный на введении единого комплекса, состоящего из пользователя, системы и контекста. В третьих, эксперименты по оценке качества являются частью процесса проектирования и оптимизации параметров телевизионных систем, имеющего целью удовлетворение потребностей пользователя. Проектирование, ориентированное на пользователя, - это процесс, отражающий знания о пользователях и их вовлечение в процесс проектирования как основного заинтересованного участника. Получаемые выгоды от такого проектирования характеризуются увеличением степени удовлетворенности конечного пользователя.
Телевизионные системы сегодняшнего дня доставляют до зрителя программы, воздействующие на органы зрения и слуха. Оценка качества должна быть интегральной (аудиовизуальной, или, мультимодальной, дающей целостное описание впечатления, полученного конечным пользователем в рамках визуальной и аудиальной модальностей). Но телевидение и другие мультимедийные приложения — это не только средства массовой информации, это также области культуры и искусства. Поэтому оценка качества впечатления должна быть распространена и на сферу эстетического восприятия явлений и объектов искусства.
Восприятие телевизионной программы, доставленной системой, зависит от технических параметров системы, жанра программы и контекста, т.е. условий, в которых наблюдается программа, состояния наблюдателя и т.п. В работе ставится задача исследования восприятия пользователем телевизионных программ разных жанров в телевизионной системе с различными параметрами кодеков компрессии (в качестве обобщенных параметров приняты скорости компрессированных потоков видео- и аудиоданных). Для обеспечения воспроизводимости результатов исследований контекст был неизменным. Использовался контекст, принятый в телевидении для лабораторных исследований.
На основе приведенных соображений в работе определено понятие интегрального качества как субъективной величины, отражающей степень удовлетворенности пользователя аудиовизуальной программой разных жанров при неизменном контексте наблюдения.
Вторая глава диссертации посвящена экспериментальному исследованию влияния параметров систем компрессии видео и аудио сигналов и содержания аудиовизуальных программ на интегральную оценку. В главе доказывается существование эффекта кросс-модального взаимодействия двух модальностей (визуальной и аудиальной) в условиях современного телевидения с компрессией данных, когда один из компонентов изменяет субъективное ощущение, формируемое другим компонентом и когда информация, полученная в рамках одной сенсорной
модальности, влияет на восприятие информации, полученной в рамках другой сенсорной модальности, для программ разных жанров и разного содержания.
Существующие методики не отвечают задачам настоящей работы, поэтому одной из задач данной главы является разработка новой методики проведения психофизических экспериментов, которую можно использовать для изучения кросс-модального взаимодействия при оценке качества в системах цифрового телевидения с компрессией данных. Методика проведения эксперимента по оценке качества должна иметь тесную связь с назначением системы. Оценка качества как субъективной величины, характеризующей степень удовлетворенности пользователя, должна учитывать информационную составляющую аудиовизуальной программы. В работе был предложен новый информационный подход, который учитывает наличие в фильмах и телевизионных программах как семантической, или смысловой информации, так и эстетической информации. В новостных и подобных сюжетах — это в основном семантическая, смысловая информация. Донесение этой информации до зрителя приводит к уменьшению степени неопределённости (увеличению количества наших знаний) о каком-либо факте, событии, явлении. В художественных, музыкальных сюжетах содержится преимущественно эстетическая информация. Получение эстетической информации доставляет зрителю эстетическое наслаждение. Ухудшение интегрального качества вследствие искажений компрессии предлагается оценивать по уменьшению количества смысловой (семантической) информации и снижению степени эстетического наслаждения (эстетической информации). В соответствии с предложенным информационным подходом была создана методика оценки качества с двумя стимулами, предполагающая использовать новый вариант шкалы ухудшений, прототип которой описан в Рекомендации 1Т1]-К ВТ.500. Процесс оценки регламентируется разработанной инструкцией, которая используется в процессе экспериментов.
Важным аспектом при проведении субъективных экспертиз является выбор эталона измерения, то есть выбор шкалы и определение её свойств. Шкалы, предложенные в Рекомендациях, разработанных Международным союзом электросвязи (МСЭ), в том числе шкала ухудшений, являются порядковыми шкалами. Числа на таких шкалах являются рангами, позволяющими упорядочить значения измеряемого качества. Но для возможности использовать полученные в ходе проведения субъективных экспертиз результаты для решения задач оптимизации необходимо иметь шкалу, обладающую свойствами шкалы интервалов или, что более предпочтительно, шкалы отношений.
Для построения шкалы ухудшений, обладающей свойствами шкал интервалов или отношений, был использован метод Терстоуна. Экспертам было предложено 11 суждений - категорий в диапазоне от «Искажения предельно раздражают» до «Искажения незаметны», которые необходимо было расположить на вертикальной линии — графической шкале с двумя опорными точками А и Е: верхняя точка (А) — «Искажений нет», нижняя точка (Е) - «Искажения абсолютно неприемлемы» (нулевая точка шкалы). На шкале на равных интервалах друг от друга нанесены 6 отметок, обозначенных буквами от А до Е. Цель эксперимента по методу Терстоуна — определить те суждения, которые будут расположены экспертами на делениях шкалы, находящихся на равных интервалах друг от друга. Если такие суждения будут найдены, то они определят шкалу качества, обладающую свойствами шкалы интервалов. Если среди равноинтервальных суждений будет найдено суждение.
которое располагается в нулевой точке Е шкалы, то выбранное подмножество суждений определит шкалу качества, обладающую свойствами шкалы отношений.
В психофизической экспертизе в качестве экспертов участвовало 117 студентов СПбГУКиТ. Статистическая обработка данных эксперимента показала, что шкала ухудшений, построенная на основе суждений С1 (Искажения незаметны), СЗ (Искажения немного заметны, но не мешают), С5 (Искажения слегка мешают), С7 (Искажения мешают и раздражают), С9 (Искажения очень сильно раздражают), С11 (Искажения предельно раздражают) обладает свойствами шкалы отношений. Эквивалентами суждений С1, СЗ, С5, С7, С9, С11 являются числа 5, 4, 3, 2, 1, 0, с которыми можно выполнять все математические операции. Шкала может быть рекомендована для использования в исследованиях и оценках уровня качества телевизионных вещательных систем.
С использованием информационного подхода и разработанной шкалы ухудшений проводилась оценка интегрального качества компрессированных телевизионных материалов. Цель экспериментов - доказать существование эффекта кросс-модального взаимодействия. В качестве тестовых материалов были выбраны три разноплановых сюжета, различающиеся характеристиками аудиовизуального ряда: фрагмент программы новостей («говорящая голова»), музыкальный видеоклип и спортивный репортаж. В эксперименте варьировались следующие параметры видеоряда: степень видеокомпрессии и скорость видеопотока, пространственное разрешение. Также изменялись параметры звукового сопровождения: степень аудиокомпрессии и скорость аудиопотока.
Экспериментальным путем было показано существование кросс-модального взаимодействия. Искажения обоих компонентов (изображения и звука), внесенных в результате компрессии видео и аудио сигналов, влияют на решение экспертов при выставлении оценок. Один из компонентов может дополнять и изменять субъективное ощущение, формируемое другим компонентом. Оценка мультимодального качества зависит от содержания (жанра) аудиовизуального произведения. Обе модальности (визуальная и аудиальная) влияют на восприятие качества, но одна из модальностей может иметь преобладающее значение. В насыщенных деталями и высокодинамичных спортивных сюжетах качество изображения имеет относительно больший вес по сравнению со звуковым сопровождением. Напротив, в музыкальных сюжетах более значимо качество звука. Наибольшую значимость качество звукового сопровождения приобретает в новостных программах с изображением диктора («говорящая голова»).
Анализ полученных экспериментальных данных, позволяет сделать предположение, что в цифровых телевизионных системах с компрессией, в том числе в системах мобильного телевидения, целесообразно использовать адаптивное распределение полосы пропускания каналов передачи данных, зависящее от текущего содержания передаваемого контента.
Третья глава посвящена построению математической модели, позволяющей предсказывать интегральную оценку качества аудиовизуальных программ в телевизионных системах с компрессией данных, с учетом эффекта кросс-модального взаимодействия.
Моделирование оценки качества изображения и звука в современных мультимедийных системах является сложной задачей, эффективным способом решения которой является уровневая декомпозиция. В настоящей работе предлагается использовать уровневую декомпозицию при разработке модели
интегральной оценки качества. На первом уровне модель описывает зависимости показателей качества изображения и звука как функции параметров кодеков компрессии видео- и аудиосигналов, причем эти функции будут зависеть также, как можно заключить на основе описанных в главе 2 исследований, от сюжета аудиовизуальной программы. Показатели качества, предсказываемые на первом уровне модели, являются мономодальными. На втором уровне модель описывает зависимость интегрального качества мультимедийных программ как функцию показателей качества изображения и звука, найденных на первом уровне. Интегральное качество, предсказываемое моделью на втором уровне, является мультимодальным.
Параметры модели первого уровня находятся на основе данных экспериментальных исследований, задачи которых состоят в определении закономерностей субъективного восприятия, описывающих влияние скорости потока видеоданных на уровень качества изображения и скорости потока аудиоданных на уровень качества звука раздельно. В эксперименте экспертам предлагалось оценить качество изображения и звука 3-х программ: фрагмент программы новостей («говорящая голова»), музыкальный видеоклип и спортивный репортаж. В первой серии экспериментов звуковое сопровождение отсутствовало, то есть оценивалось только качество изображения. Во второй серии воспроизводилось звуковое сопровождение тех же сюжетов без изображения. На первом уровне экспоненциальная модель субъективного восприятия вида:
<3*У = ку1 + ку2-ехр(куз-УВЯ) (1)
0*д = кА, + кА2-ехр(кАЗ-АВК) (2)
хорошо описывает влияние скорости потока видеоданных УВЯ на уровень качества изображения (1) и скорости потока аудиоданных АВЯ на уровень качества звука (2).
Нахождение параметров модели субъективного восприятия, описывающих влияние скорости потоков аудиоданных и видеоданных на интегральное качество основывается на данных экспериментального исследования, в котором зрителям предлагается оценить интегральное качество тех же трех аудиовизуальных отрывков: программа новостей, спортивный репортаж и музыкальный видеоклип.
На втором уровне целесообразно использовать полиномиальную аппроксимацию вида (3):
е*АУ=со + сА1-е* д+су,-е\ + сАув*Ад*у+сА2-е*А2 + сУ2-в:\2+смгд*л-вV +
са2у-е*а2-(?\ + САЗ-в*А3 + Су3-в*у3+... (3)
для поиска приемлемого компромисса между сложностью модели и точностью описания зависимости интегральной оценки качества 0*ду как функцию показателей качества изображения и звука (3*А и (,) у, полученных на первом уровне.
Число слагаемых в выражении (3) для простоты модели должно быть минимальным, но вместе с этим должна быть обеспечена хорошая корреляция модели с результатами эксперимента. Чем больше ненулевых коэффициентов, тем сложнее модель для практического и наглядного использования. Рассмотрим зависимости между значениями мономодального качества (£?*/( и б*у) и уровнем мультимодального качества (2*ау), которые могут быть получены с использованием модели при различном числе ненулевых коэффициентов в выражении (3). На рисунке 1 представлены зависимости мультимодального качества 0*ау от мономодального качества изображения (?*у и качества звукового сопровождения О*\ при различном числе ненулевых коэффициентов в полиномиальной аппроксимации и
s
Q-av.QAV
1
и ij
~-Qa = 3,13 Q* = 4 78
к""
- —-
U-— Qa = 04>7
1
2
3
a)
Q-V.QV-
-и
qa = 3,13 ■qa = 4 78
ч Qa = 0,97
экспериментально полученные данные для музыкального клипа. Параметры полиномиальной модели субъективного восприятия мультимодального качества получены с использованием метода наименьших квадратов. В качестве параметра для
кривых выбраны соответствующие значения качества звука.
Линейная модель, в которой значения мономодального качества изображения 0*v и качества звукового сопровождения Q*А складываются с весовыми коэффициентами с\i и сА1, в целом описывает зависимости, полученные в ходе экспериментальных исследований. Но по графику (рисунок 1а) можно сделать вывод, что модель не в полной мере соответствует результатам эксперимента и не учитывает взаимодействие двух факторов (линии параллельны для каждого из значений параметра Сосуществование эффекта взаимодействия двух модальностей было доказано в главе 2, оно должно быть учтено при выборе модели. Это означает, что коэффициент cAV при произведении двух факторов, соответствующий эффекту взаимодействия, должен быть ненулевым. Как видно из рисунка 16, прямые линии не параллельны. В этом случае модель будет иметь вид неполной квадратичной модели, в простейшем виде описывающей эффект взаимодействия двух факторов первого порядка. Неполная квадратная модель лучше описывает экспериментальные данные, отражая свойства взаимной компенсации качества компонентов.
Описание экспериментальных
данных будет лучше, если линии модели не будут прямыми (рисунок 1 в), поэтому существенными оказываются
коэффициенты при квадратах факторов Сд2 и cV2. При ненулевых коэффициентах сА2 и Су2 модель превращается в полином второго порядка.
Видом модели, которая может использоваться для аппроксимации экспериментальных данных, является полином третьей степени. В этом случае ненулевыми являются коэффициенты с о, сА1 cvl cAV, Сд2, Cv2, ca2v. с\2а. с аз, cv3, которые находятся аналогичным образом с использованием метода наименьших квадратов. Количество ненулевых коэффициентов увеличивается практически в два раза по сравнению с полиномиальной моделью второго порядка.
4 Q"v,QvS
Q*v,QvS
Рисунок 1 - Описание экспериментальных данных (музыкальный клип) разными моделями:: а - линейная (с0 сА)_ Су1 Ф 0); б-неполная квадратичная (с0.сА|_ С\\ сАу Ф 0); в - квадратичная (с0,сА1. Су1,САу.СА2, СУ2 Ф 0).
Модель третьего порядка нелинейна и также может быть использована для аппроксимации экспериментальных данных. Чем больше ненулевых коэффициентов в уравнении регрессии, тем модель будет ближе проходить к экспериментальным точкам, точность описания будет выше. Однако при этом нарушается монотонность, что нежелательно для моделей, описывающих восприятие качества наблюдателем.
Для поиска оптимального количества ненулевых коэффициентов в полиномиальной модели, выполнена численная проверка адекватности модели с использованием учитывающих требования, предъявляемые к моделям зрительного восприятия, специальных критериев, сформулированных группой экспертов по качеству изображения VQEG (Video Quality Experts Group): точность предсказания, монотонность предсказания, последовательность предсказания. Первое требование, увеличение точности предсказания, выполняется с увеличением числа ненулевых коэффициентов. Второе важное требование, монотонность предсказания, нарушается с возрастанием степени полинома (полином третьей степени), так как линия регрессии приобретает колебательный характер. Приемлемый компромисс между точностью, монотонностью и сложностью модели может быть найден при использовании полиномиальной модели второго порядка.
Значение среднеквадратической ошибки, характеризующей точность предсказания полиномиальной модели второго порядка, равно 0,1568. Коэффициент ранговой корреляции Спирмена, характеризующий монотонность предсказания, равен 0,9883. Значение коэффициента выбросов, отражающее согласованность и непротиворечивость модели, равно 0. Значение метрик, определяющих точность, монотонность и последовательность предсказания достаточно высоки, полиномиальная модель второго порядка может быть использована для описания зависимости интегральной (мультимодальной) оценки качества впечатления как функции показателей мономодального качества изображения и звука.
В четвертой главе выполняется исследование процессов кросс-модального взаимодействия компонентов аудиовизуальной программы, которое становится возможным с использованием разработанной математической модели восприятия. В главе решаются также задачи оптимизации параметров кодеков компрессии.
Важный для практики вопрос о взаимном влиянии друг на друга видео- и аудиокомпонентов в процессе формирования ощущения интегрального качества был поставлен впервые пятнадцать лет назад (Р.Стормс): является ли высокое/низкое качество звукового сопровождения причиной возрастания/снижения воспринимаемого уровня интегрального качества (по отношению к уровню мономодального качества изображения, воспроизводимого без звука)? И наоборот: вызывает ли изображение, воспроизводимое со звуковым сопровождением, изменение восприятия мономодального качества звука? Результаты выполненных ранее экспериментальных исследований давали качественный ответ на вопрос о взаимодействии двух модальностей для некоторых соотношений показателей качества. С использованием разработанной математической модели субъективного восприятия становится возможным получить количественные оценки обменных соотношений между аудиальной и визуальной модальностями и раскрыть закономерности взаимозависимости восприятия аудио- и видеоинформации, для которых было ранее известно только качественное описание.
График на рисунке 2 иллюстрирует зависимость предсказанного по модели уровня интегрального качества и мономодальных показателей качества изображения и звука для трех экспериментальных сюжетов. Качество звука выбрано в качестве
параметра. Анализ представленных характеристик позволяет сделать вывод о существовании так называемых точек нейтральности. В данных точках не наблюдается ни уменьшения, ни увеличения уровня субъективно воспринимаемого интегрального качества по сравнению с мономодальными оценками показателей
качества изображения. Рассмотрим предсказанного по модели уровня
О*
5
1
О
О
0*Л=4.5
5 0"
а)
\ 1,5
рисунок 26, представляющий зависимость интегрального качества от мономодальных показателей качества изображения и звука для музыкального клипа. Например, если значения показателей качества
изображения и звука будут равны (3*у=4 и 0*д=4.5, то уровень интегрального качества будет соответствовать оценке «4», т.е. равняться качеству изображения. Все точки нейтральности лежат на прямой 0*ау=0*у- Для низкого качества изображения (т.е. для низких скоростей потока видеоданных) уровень восприятия интегрального качества будет всегда выше, чем уровень восприятия качества только изображения для всех трех сюжетов. Однако для средних и высоких значений показателей качества
изображения ситуация не столь однозначна и зависит от уровня качества звука.
В телевизионных системах с компрессией данных, в том числе в системах мобильного телевидения, в которых используются наименее широкополосные каналы связи, основная задача — обеспечить приемлемый уровень качества при ограниченной пропускной способности канала. Для выбора оптимальных значений параметров кодирования изображения и звука важно проанализировать требования к качеству на основе человеческого восприятия.
В работе предлагается решить две важных для практики задачи оптимизации.
Первая задача оптимизации, которая решается в рамках работы формулируется следующим образом: получить
максимальное интегральное качество при фиксированной полосе пропускания канала связи. Разработанная модель восприятия интегрального качества используется в качестве целевой функции при решении задачи оптимизации.
5 0*
б)
5<Г
В)
Рисунок 2 - Обменные соотношения между аудиальной и визуальной модальностями для: а - программы новостей; б - музыкального клипа; в -спортивного репортажа.
Качественные рассуждения показывают, что эта задача имеет решение. Оба компонента, изображение и звук, вносят вклад в интегральное восприятие аудиовизуальной программы. В условиях ограниченной фиксированной общей полосы пропускания канала связи при малых скоростях видеопотока интегральное качество аудиовизуальных программ падает из-за плохого качества изображения, хотя качество звука достаточно высокое. С увеличением скорости видеопотока, увеличивается уровень качества изображения, но уменьшается скорость аудиопотока, следовательно, падает уровень качества звука. Уровень интегрального качества впечатления аудиовизуальной программы снижается за счет плохого качества звука.
Следовательно, существует
оптимальное распределение полной скорости потока данных между потоками видео и аудиоданных.
Математическая модель задачи поиска оптимального решения может быть записана следующим образом (4):
(F = QaviABR, VBR) -» тах j ABR + VBR = TBR ( ABR > 0,VBR > 0
(4)
Здесь общая скорость цифрового потока, переносящего аудиовизуальные данные, обозначена как TBR. Она представляет собой сумму скоростей потока аудиоданных ABR и потока видеоданных VBR.
Модель состоит из трех составляющих: целевой функции, ограничения, граничных условий. В данном случае решается задача оптимизации с ограничениями, то есть при условии фиксированной общей скорости цифрового потока. Условие, согласно которому скорости цифрового потока аудио и видеоданных могут быть только положительными величинами, является очевидным, но необходимым для корректного решения задачи.
У поставленной задачи нет аналитического решения, найти максимум целевой функции можно только численными методами. Для рассматриваемой целевой функции производная существует, следовательно, для решения задачи оптимизации имеет смысл применять численные методы с использованием производных.
Для решения задачи оптимизации в работе использовались программные средства анализа данных Microsoft Excel 2011.6 (надстройка Sol ver - «Поиск решения»). Задача условной оптимизации, то есть задача с ограничениями на значения параметров, влияющих на целевую функцию, решалась с использованием метода множителей Лагранжа.
Результаты решения этой задачи представлены на рисунке 3 для новостного сюжета, музыкального клипа и спортивного репортажа при полной скорости потока, равной 200 Кбит/с. Рисунок наглядно иллюстрирует изменение уровня интегрального качества О*av пРи изменении долей полосы канала связи, занимаемой для передачи информации об изображении и звуке, при фиксированной общей скорости потока. На графиках хорошо видны максимумы интегрального качества, которые могут быть
Иршрамма int ihm j t и
Музыка льны ft сюжет
Спортивный репортаж
Общая скорость потока = = 200 Кбит'с
о 50 100 150 200
Скорость видсопоюка, Кбит/с Рисунок 3 - Соотношение между скоростью видеопотока VBR и предсказанным значением интегрального качества О*av для новостного сюжета, музыкального клипа и спортивного репортажа
получены в условиях общей фиксированной полосы пропускания канала связи. При TBR=200 Кбит/с максимум интегрального качества спортивного репортажа, соответствующий значению Q*ду=2,1 балла, достигается при скорости видеопотока 140 Кбит/с и скорости аудиопотока 60 Кбит/с. Такое распределение (140:60) может считаться оптимальным. Для музыкального клипа оптимальное соотношение скоростей видео и аудио составляет 90:110, что соответствует максимальному значению интегрального качества 3,1 балла. Для программы новостей наивысший уровень качества 4,5 может быть достигнут при соотношении скоростей видео- и аудиопотока 70:130 ( га/?=70Кбит/с и Л£Д=130Кбит/с).
Использование оптимального соотношения между скоростями цифрового потока аудио и видеоданных при передаче аудиовизуальных программ позволяет существенно увеличить уровень интегрального качества, особенно в условиях узкой полосы пропускания канала связи. Традиционно в цифровых телевизионных системах с компрессией большая часть общей полосы пропускания канала связи отводится для передачи информации об изображении (например. 90 %, тогда только 10% остается на передачу информации о звуке). Если общая скорость потока равна 400 Кбит/с, применение оптимального соотношения между скоростями цифрового потока аудио и видеоданных при передаче программы новостей типа «говорящая голова» позволяет увеличить уровень интегрального качества на 3,1 балла, при передаче музыкальной программы - на 3,1 балла, и спортивного репортажа — на 2,1 балла, по сравнению с передачей тех же программ с фиксированным соотношением между скоростями цифрового потока аудио и видеоданных, когда 90% пропускной способности канала связи отводится для передачи информации об изображении.
Разработанная математическая модель может быть применена для решения задачи минимизации необходимой пропускной способности канала связи при условии, что интегральное качество будет на уровне заданного значения. Таким образом, может быть сформулирована вторая задача оптимизации, которая решается в рамках данной работы:
Математическая модель задачи поиска оптимального решения может быть записана следующим образом (5):
F = TBR = (ABR + VBR) -> viin Qav(ABR,VBR) = Qav ABR > O.VBR > 0
(5)
Это также задача оптимизации с ограничениями. В качестве начальных условий, т.е. значений скоростей видео и аудиопотока нулевого приближения используются значения скоростей видео и аудио потоков данных, при которых обеспечивается уровень мономодального качества изображения и звука, равный заданному значению интегрального качества. Задача оптимизации также решалась с использованием метода множителей Лагранжа с помощью программных средств анализа данных Microsoft Excel 2011.6 (надстройка Solver - «Поиск решения»).
В таблице 1 представлены значения минимально необходимой полосы пропускания канала связи для передачи программ различного содержания с фиксированным уровнем качества, полученные в результате решения задачи оптимизации.
Например, минимально необходимая общая скорость цифрового потока, переносящего аудиовизуальные данные, при условии, что интегральное качество
составляет 4,5 балла, будет равна 1220.1 Кбит/с для спортивного репортажа (при скорости видеопотока 1058,4 Кбит/с и скорости аудиопотока 161,7 Кбит/с). В то же время минимальная общая скорость цифрового потока данных, необходимая для обеспечения интегрального уровня качества 4,5 балла для музыкального клипа и программы новостей типа «говорящая голова», равна 443,3 Кбит/с и 192,0 Кбит/с соответственно.
Как видно, минимальная общая скорость потока данных, необходимая для передачи трех сюжетов с одним и тем же уровнем интегрального качества различна, причем различия весьма существенны. Следовательно, общая скорость цифрового
потока 1220,1 Кбит/с является избыточной для передачи программы новостей и музыкального клипа при сохранении заданного уровня интегрального качества.
Адаптивное управление
скоростями потоков видео и аудио данных в соответствии с жанром и содержанием аудиовизуальных программ позволит достичь сокращения ооъема передаваемых данных и средней пропускной способности канала связи при заданном уровне интегрального качества воспроизведения аудиовизуальных программ.
В работе был проведен анализ программ передач трех ведущих российских общетематических каналов («1 канал», «Россия 1», «Россия 2»), включенных в стандартный пакет услуг сервиса «Мобильное телевидение». Расчет показал, что усредненная за сутки скорость цифрового потока составит 561 Кбит/с при использовании адаптивного управления скоростями потоков видео- и аудиоданных в соответствии с жанром программы при уровне интегрального качества 4,5 балла. Это значение почти на 54% меньше скорости, необходимой для передачи самого критичного к пропускной способности канала связи спортивного сюжета (1220,1 Кбит/с). Для уровней качества 4,0 и 3,5 баллов такое составляет 48% и 46% соответственно.
Аналогичные расчеты были выполнены для полного пакета программ, предоставляемых оператором мобильного телевидения 8РВ ТУ, одного из самых популярных ТВ-сервисов в России и СНГ. С его помощью более 200 популярных российских и зарубежных телеканалов может быть просмотрено как на мобильных устройствах с любой программной платформой, так и на компьютере. Средняя за сутки скорость передачи составляет в этом случае 720 Кбит/с, что на 41 % меньше скорости, необходимой для передачи самого критичного к пропускной способности канала связи спортивного сюжета с уровнем интегрального качества 4,5 балла. Этот результат означает уменьшение на 41% объема передаваемых за сутки данных, что говорит об экономическом эффекте применения управления общей скоростью потока данных в соответствии с жанром аудиовизуальной программы и адаптивного распределение пропускной способности канала связи между потоками видео- и аудио данных. Для уровня качества 3,5 баллов такое составляет 35%.
Таблица 1. Значения минимально необходимой полосы пропускания канала связи для передачи программ различного содержания
Оау Новости Музыкальный клип Спортивный репортаж
3.0 87,4 189,8 371,8
3.5 110,2 241,4 495,9
4.0 141,1 314,1 693,4
4.5 192,0 443,3 1220,1
В заключении сформулированы основные результаты работы, которые заключаются в следующем:
1. Разработана новая методика проведения психофизических экспериментов по интегральной оценке качества аудиовизуальных программ, основанная на учете восприятия семантической и эстетической информации в телевизионном вещании. Разработанная методика расширяет границы применимости известных методов оценки качества и позволяет исследовать эффект кросс-модального взаимодействия компонентов аудиовизуальной программы. Методика позволяет проводить эксперименты по мультимодальной оценке, интегрирующей зрительное и слуховое восприятие искажений в цифровых телевизионных системах с компрессией данных.
2. Введена и обоснована новая шкала оценки искажений аудиовизуальных программ, в которой в явном виде вводится категория оценки, эквивалентной нулевому значению качества, и которая обладает свойствами шкалы отношений.
3. Показано, что интегральная оценка качества аудиовизуальных программ в значительной степени зависит от жанра и содержания программ. Получены количественные оценки влияния содержания на интегральную оценку качества аудиовизуальных программ.
4. Предложено использовать уровневую декомпозицию при построении математической модели субъективного восприятия, описывающей интегральную оценку качества аудиовизуальных программ в отношении искажений компрессии. Первый уровень оригинальной двухуровневой модели образуют зависимости показателей качества изображения и звука как функции параметров кодеков компрессии видео и аудио сигналов; второй -зависимость интегрального качества мультимедийных программ как функция показателей качества изображения и звука.
5. Доказано, что для описания интегральной оценки качества аудиовизуальных программ на втором уровне математической модели субъективного восприятия достаточно использовать полиномиальную функцию второй степени от двух переменных - показателей качества изображения и звука, причем эффект кросс-модального взаимодействия отображается путем включения мультипликативного члена — произведения показателей качества изображения и звука.
6. Изучен эффект кросс-модального взаимодействия компонентов аудиовизуальной программы, когда один из компонентов изменяет субъективное ощущение, формируемое другим компонентом и когда информация, полученная в рамках одной сенсорной модальности, влияет на восприятие информации, полученной в рамках другой сенсорной модальности, для программ разных жанров и разного содержания. Получены количественные оценки обменных соотношений между аудиальной и визуальной модальностями и раскрыты закономерности взаимозависимости восприятия аудио- и видеоинформации, для которых было ранее известно только качественное описание.
7. Создана система практических рекомендаций для адаптивного распределения пропускной способности канала связи между потоками видео
и аудио данных в соответствии с жанром и содержанием аудиовизуальной программы, которая позволяет увеличить уровень интегрального качества воспроизведения аудиовизуальных программ (на 2-3 балла пятибалльной шкалы в зависимости от жанра программы и скорости потока) при заданной общей скорости потока передаваемых данных.
8. Создана система практических рекомендаций для адаптивного управления скоростями потоков видео и аудио данных в соответствии с жанром и содержанием аудиовизуальных программ, которая позволяет достичь сокращения объема передаваемых данных и требуемой средней пропускной способности канала связи при заданном уровне интегрального качества воспроизведения аудиовизуальных программ (на 35-41% в зависимости от уровня качества).
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ:
Публикации в изданиях, входящих ö перечень рецензируемых научных изданий ВАК:
1. Гриненко, E.H. Оценка качества телевизионных материалов в системах вещания на мобильные терминалы / А.Ф. Перегудов, К.Ф. Гласман, A.B. Белозерцев, E.H. Гриненко // Научно-технический вестник СПбГУ ИТМО,- 2009. № 04 (62). - С. 102108.
Публикации а изоаниях, входящих в перечень рецензируемых научных изданиях, входящих в международную реферативную базу данных Scopus:
2. Grinenko, Е. Multimodal Quality Assessments of Compressed Television Materials for Portable and Mobile Devices / A. Peregudov, K. Glasman, A. Belozertsev, E. Grinenko // SMPTE Motion Imaging Journal.- January/February 2010. -Pp. 42-51.
3. Grinenko, Eugenie. An Audiovisual Quality Model of Compressed Television Materials for Portable and Mobile Multimedia Applications [Электронный ресурс] / Alexander Peregudov, Eugenie Grinenko, Konstantin Glasman, Alexander Belozertsev // Proceedings of 14th IEEE International Symposium on Consumer Electronics. -2010,- 1 электрон, опт. диск (CD-ROM).
Другие статьи и материалы конференций:
4. Гриненко, E.H. Модель оценки мультимодального качества аудиовизуальных программ, транслируемых на мобильные терминалы / А.Ф. Перегудов, К.Ф. Гласман, A.B. Белозерцев, E.H. Гриненко И «Вопросы радиоэлектроники». Серия «Техника телевидения»,- 2010,- Вып. 1.-е. 21-33
5. Гриненко, Е. Н. Мультимодальная оценка качества аудиовизуальных материалов в системах мобнльного телевидения / А.Ф. Перегудов, К.Ф. Гласман, A.B. Белозерцев, E.H. Гриненко // «Вопросы радиоэлектроники». Серия «Техника телевидения»,- 2008,-Вып. 2.-е. 96-105
6. Гриненко, Е. Мультимодальное качество мультимедийных программ: Методы оценки / Е. Гриненко // LAP LAMBERT Academic Publishing GmbH & Co.-2011.- 88 стр. ISBN: 978-3-8433-1809-9
7. Гриненко, E.H. Оптимальное распределение пропускной способности канала связи между сигналами изображения и звука в системах стереоскопического мобильного телевидения / E.H. Гриненко, Ю.С. Поддубная, К.Ф. Гласман, A.B. Белозерцев // Материалы и доклады IV международной научно-технической конференции запись и
воспроизведение объемных изображений в кинематографе и других отраслях,- М.: МКБК.-2013,- с. 219-231.
8. Гриненко, Е.Н. Распределение пропускной способности канала между потоками видео- и аудиоданных в системах вещания на мобильные терминалы / К.Ф Гласман, А.В.Белозерцев, Е.Н. Гриненко // Сборник материалов 8-й Международной конференции «Телевидение: передача и обработка изображений»,- СПб.: Изд-во СПбГЭТУ «ЛЭТИ». - 2011.- с. 93-98
9. Гриненко, Е.Н. Исследование модели оценки мультимодального качества аудиовизуальных материалов, транслируемых на мобильные и портативные терминалы / К.Ф Гласман, А.В.Белозерцев, Е.Н. Гриненко // Сборник материалов Недели науки и творчества. - СПб.: Изд-во СПбГУКиТ. - 2011.-с. 149-150
10. Гриненко, Е.Н. Модель оценки мультимодального качества мультимедийных материалов / А.Ф. Перегудов, К.Ф. Гласман, А.В. Белозерцев, Е.Н. Гриненко // Сборник материалов Недели науки и творчества,- СПб.: Изд-во СПбГУКиТ. - 2010. -с. 88-89
11. Гриненко, Е.Н. Мобильное телевидение: мультимодальная оценка качества аудиовизуальных материалов / А.Ф. Перегудов, К.Ф. Гласман, А.В. Белозерцев, Е.Н. Гриненко // Сборник материалов 7-и Международной конференции «Телевидение: передача и обработка изображений»,- СПб.: Изд-во СПбГЭТУ «ЛЭТИ»,- 2009. - с. 115-122
12. Гриненко, Е.Н. Мультимодальная оценка качества мультимедийных материалов в системах мобильного телевидения / А.Ф. Перегудов, К.Ф. Гласман, А.В. Белозерцев, Е.Н. Гриненко // Сборник материалов Недели науки и творчества.-СПб.: Изд-во СПбГУКиТ. -2009. - с. 83-85
13. Grinenko, Evgenia. Content-adaptive Bitrate Reduction in Mobile Multimedia Applications [Электронный ресурс] / Evgenia Grinenko, Konstantin Glasman, Alexander Belozertsev // Proceedings of 4th IEEE International Conference on Consumer Electronics - Berlin.-2014. - 1 электрон, опт. диск (CD-ROM).
14. Grinenko, E. Optimal Bitrate Allocation between Audio and Video in Mobile 3DTV Application [Электронный ресурс] / E. Grinenko, J. Poddubnaya, K.Glasman, A. Belozertsev // Conference Publication International Broadcasting Convention 2011,- 2011,1 электрон, опт. диск (CD-ROM).
15. Grinenko, E. A multimodal quality model for content adaptive bitrate allocation in mobile multimedia applications [Электронный ресурс] / A. Peregudov, K. Glasman, A. Belozertsev, E. Grinenko // Conference Publication International Broadcasting Convention 2009,- 2009.-1 электрон, опт. диск (CD-ROM)
16. Grinenko, E. Multimodal Quality Assessments of Compressed Television Materials for Portable and Mobile Devices / A. Peregudov, K. Glasman, A. Belozertsev, E. Grinenko // Conference Publication International Broadcasting Convention 2008. -2008. - Pp. 396-404
Подписано в печать 20.11.14 Количество печатных листов 1,0 Формат 145x205 мм Бумага офсетная. Тираж 100 экз. Заказ № 0645 Отпечатано в типографии ООО «РГЖ«АМИГО-ПРИНТ» Санкт-Петербург, ул. Розенштейна, д. 21, офис 789 тел. (812)313-95-76
-
Похожие работы
- Разработка быстродействующих алгоритмов компрессии видеоданных с использованием дельта-преобразований второго порядка
- Исследование и разработка методов и аппаратуры обработки информации в технических комплексах телерадиовещания
- Исследование и разработка методов мониторинга аудиовизуального ряда в телевизионных и кинематографических системах
- Методы и модели энтропийной оптимизации систем обработки, хранения и передачи видеоданных
- Методы сжатия цифрового сигнала без потери информации для телевизионных систем воздушной тактической разведки
-
- Приборы и методы измерения по видам измерений
- Приборы и методы измерения времени
- Приборы навигации
- Приборы и методы измерения тепловых величин
- Приборы и методы измерения электрических и магнитных величин
- Акустические приборы и системы
- Оптические и оптико-электронные приборы и комплексы
- Радиоизмерительные приборы
- Электронно-оптические и ионно-оптические аналитические и структурно-аналитические приборы
- Приборы и методы для измерения ионизирующих излучений и рентгеновские приборы
- Хроматография и хроматографические приборы
- Электрохимические приборы
- Приборы и методы контроля природной среды, веществ, материалов и изделий
- Технология приборостроения
- Метрология и метрологическое обеспечение
- Информационно-измерительные и управляющие системы (по отраслям)
- Приборы, системы и изделия медицинского назначения
- Приборы и методы преобразования изображений и звука