автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Разработка и анализ неэталонного алгоритма оценки качества изображений на основе дискретного преобразования

кандидата технических наук
Павлов, Евгений Александрович
город
Владимир
год
2013
специальность ВАК РФ
05.12.04
Диссертация по радиотехнике и связи на тему «Разработка и анализ неэталонного алгоритма оценки качества изображений на основе дискретного преобразования»

Автореферат диссертации по теме "Разработка и анализ неэталонного алгоритма оценки качества изображений на основе дискретного преобразования"

На правах рукописи

ПАВЛОВ ЕВГЕНИЙ АЛЕКСАНДРОВИЧ

РАЗРАБОТКА И АНАЛИЗ НЕЭТАЛОННОГО АЛГОРИТМА ОЦЕНКИ КАЧЕСТВА ИЗОБРАЖЕНИЙ НА ОСНОВЕ ДИСКРЕТНОГО ПРЕОБРАЗОВАНИЯ

05.12.04 - Радиотехника, в том числе системы и устройства телевидения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Ярославль, 2013

005546873

005546873

Работа выполнена на кафедре динамики электронных систем ФГБОУ ВПО «Ярославский государственный университет им. П.Г. Демидова»

Научный руководитель: кандидат технических наук,

доцент кафедры динамики электронных систем ЯрГУ им. П.Г. Демидова, Хрящев Владимир Вячеславович

Официальные оппоненты: доктор физико-математических наук,

профессор кафедры «Физики и прикладной математики» ФГБОУ ВПО ВлГУ им. А.Г. и Н. Г. Столетовых Pay Валерий Георгиевич

кандидат технических наук, заместитель директора ООО «А-ВИЖН» Саутов Евгений Юрьевич

Ведущая организация: ОАО «Ярославский радиозавод»

Защита диссертации состоится 20 декабря 2013 г. В 14.00 часов на заседании диссертационного совета Д 212.025.04 при ФГБОУ ВПО Владимирском государственном университете имени Александра Григорьевича и Николая Григорьевича Столетовых по адресу: 600000, г. Владимир, ул. Горького, д. 87, ВлГУ, корп. 3, ФРЭМТ, ауд. 301.

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО Владимирского государственного университета имени Александра Григорьевича и Николая Григорьевича Столетовых.

Автореферат разослан «19» ноября 2013 г.

Отзывы на автореферат, заверенные печатью, просим направлять по адресу: 600000, г. Владимир, ул. Горького, д. 87, ВлГУ, ФРЭМТ.

Ученый секретарь диссертационного совета доктор технических наук, профессор

А.Г. Самойлов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы

Цифровая обработка визуальной информации в настоящее время охватывает различные виды инфокоммуникационных приложений и расширяет их спектр. Сюда относятся как традиционные приложения (вещательное, промышленное, охранное телевидение), так и относительно новые приложения (видеоконференцсвязь, техническое зрение, цифровое кино, телевидение высокой и сверхвысокой четкости, 3 D-телевидение).

В соответствии с современной классификацией предложенной В.П. Дворковичем и A.B. Дворковичем цифровая обработка телевизионных и компьютерных изображений включает в себя следующие основные области:

— коррекция изображения, их «препарирование», т.е. сознательное разделение на части цифровыми средствами, видоизменение этих частей и их обратная «сборка»;

— оценка параметров изображений с целью контроля качества их передачи и приема;

— преобразование и кодирование изображений для хранения и передачи по каналам связи;

— компьютерная графика, а также визуализация информации, т.е. представление массивов данных в виде различных изображений, что очень эффективно, так как облегчает решение многих задач, сложных именно своей абстрактностью. Важность разработки подобных алгоритмов также можно объяснить

происходящим в настоящее время переходом к цифровому телевещанию, вызванным развитием в России стандартов DVB первого и второго поколений. Постановлением Правительства Российской Федерации от 3 декабря 2009 г. № 985 утверждена федеральная целевая программа «Развитие телерадиовещания в Российской Федерации на 2009-2015 годы».

Значительный вклад в данную область науки и техники внесли как отечественные ученые М.И. Кривошеев, В.А. Сойфер, М.К. Чобану, A.C. Крылов, Д.С. Ватолин, A.C. Конушин, Б.А. Алпатов, Ю.С. Бехтин, Ю.С. Радченко, так и зарубежные - S. Mitra, R. Gonzalez, R. Woods, Z. Wang, A. Bovik, H. Sheikh, E. Simoncelli, J. Astola, K. Egiazarian, R. Szeliski, R. Lukac и др.

Алгоритмы обработки, сжатия и кодирования визуальной информации неизбежно вносят искажения различного типа, что делает актуальным вопрос об оценке параметров этих искажений и объективного оценивания качества искаженного изображения. На современном этапе развития все методы оценки качества классифицируются на две большие категории.

1. Субъективные критерии оценки качества изображений. Оценка качества изображения в данном случае осуществляется человеком (оценки MOS по рекомендации ITU-R ВТ.500-11).

2. Объективные критерии оценки качества изображений. Оценка качества изображения производится алгоритмически. Такой алгоритм может использовать оригинал изображения для оценки качества, то есть быть эталонным, или может определять качество без наличия неискаженной копии изображения, то есть быть неэталонным.

Исторически сложилось так, что объективные методы для оценки качества основывались на простых математических выражениях, таких как среднеквадратическая ошибка, пиковое отношение сигнал/шум (ПОСШ) и коэффициент структурного подобия (КСП). В связи с необходимостью к унификации исследований в данной области в последние годы были предложены две общедоступные тестовые базы изображений с экспертными оценками MOS: LIVE (LIVE Image Quality Assessment Database, University of Texas at Austin, USA) и TID2008 (Tampere Image Database, Tampere, Finland).

Задача неэталонной оценки качества изображений вызывает в последние годы повышенный интерес исследователей. Большая часть предлагаемых неэталонных алгоритмов разработана для конкретных типов априори известных искажений в изображении (блочность, размытие), что не всегда удобно для использования в практических приложениях. Поэтому разработка неэталонных критериев оценки качества изображений без использования априорной информации о типе искажения сегодня представляет собой актуальную научно-техническую задачу.

Основной целью работы является разработка и исследование универсального неэталонного алгоритма оценки качества изображений, позволяющего контролировать параметры систем обработки и анализа видеоданных.

Объектом исследования являются алгоритмы оценки качества изображений, применяемые в радиотехнических системах фильтрации и сжатия визуальной информации и современных системах охранного телевидения.

Предметом исследования является разработка алгоритма на основе дискретного косинусного преобразования (ДКП), с целью эффективного решения задачи неэталонной оценки качества изображений. Задачи диссертационной работы:

- проведение анализа существующих алгоритмов и методик оценки качества цифровых изображений;

- разработка и реализация неэталонного алгоритма оценки качества изображений на основе дискретного косинусного преобразования;

- проведение исследований по оценке корреляции между разработанным неэталонным алгоритмом и результатами субъективной экспертизы оценки качества;

- проведение анализа использования предложенной метрики оценки качества в задачах фильтрации, сжатия, детектирования и распознавания объектов на изображениях.

Методы исследования. При решении поставленных задач использовались современные методы цифровой обработки изображений, математического анализа, теории вероятностей, математической статистики. Для практической реализации алгоритмов применялись современные численные методы и среда моделирования MATLAB.

Научная новизна полученных результатов

В рамках данной работы получены следующие новые научные результаты.

- Разработан универсальный алгоритм неэталонной оценки качества изображений, основанный на использовании статистики коэффициентов дискретного косинусного преобразования.

- Проведена оценка корреляции предложенной неэталонной метрики качества со средними оценками экспертов. Для тестовой базы изображений LIVE среднее значение коэффициента корреляции равно 0,92, а для базы TID2008 -0,84, что соответствует современным результатам и сопоставимо с популярными эталонными критериями.

- Найдены пороговые значения параметров для ряда задач обработки и распознавания изображений.

Практическая значимость полученных результатов

1. Неэталонный характер работы предложенного алгоритма позволяет использовать его в широком спектре практических приложений, где, как правило, исходное (эталонное) изображение не доступно. При этом достигаемое значение коэффициента корреляции: 0,86-0,98 (LIVE), 0,7-0,9 (TID2008) соответствует используемым на практике эталонным критериям.

2. Разработанный алгоритм основан на использовании дискретного косинусного преобразования, для вычисления которого в настоящее время предложены быстрые алгоритмы. Кроме того, ДКП применяется на этапе кодирования в ряде стандартов сжатия изображений и видеопоследовательностей, таких как JPEG, MotionJPEG, Н.26х и интегрировано в современные аппаратные платформы обработки изображений, что позволяет использовать алгоритм оценки качества на этапе кодирования изображений.

3. Проведенный анализ использования предложенного алгоритма в ряде прикладных задач может быть использован в системах обработки и передачи визуальной информации, цифрового телевидения, классификации и распознавания образов и в других задачах цифровой обработки изображений и технического зрения.

Разработанные методы и алгоритмы требуют для их практической реализации относительно небольших вычислительных ресурсов, что позволяет использовать их для обработки телевизионных изображений в системах реального времени.

Результаты работы внедрены в соответствующие разработки ООО «Проектный сервис», г. Ярославль, ООО «Клаудс механике», г. Москва. Отдельные результаты диссертационной работы внедрены в учебный процесс ЯрГУ им. П.Г. Демидова в рамках дисциплин «Цифровая обработка изображений», «Основы телевидения и видеотехники». Получено свидетельство на программный продукт, зарегистрированное в Реестре программ для ЭВМ.

Личный вклад автора. Выносимые на защиту положения предложены автором в ходе выполнения научно-исследовательских работ на кафедре динамики электронных систем Ярославского государственного университета им. П.Г. Демидова. Практическая реализация методов и моделирование на ЭВМ проводилась коллективом исследователей при личном участии автора.

Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.

Апробация работы. Результаты работы докладывались и обсуждались на следующих научно-технических конференциях:

- 12-15-я международная конференция «Цифровая обработка сигналов и ее применение» DSPA (Москва, 2010-2013);

- 65-66-я научная сессия, посвященная Дню Радио (Москва, 2010-2011);

- 18-я международная научно-техническая конференция «Радиоэлектроника, электротехника и энергетика» (Москва, 2012);

- Всероссийская научная конференция студентов и аспирантов «Молодые исследователи - регионам» (Вологда, 2009-2011);

- 64-я региональная научно-техническая конференция студентов, магистров и аспирантов вузов (Ярославль, 2011).

Публикации. По теме диссертации опубликовано 19 научных работ, из них 2 статьи в журналах, рекомендованных ВАК, 16 докладов на научных конференциях, свидетельство о регистрации программы для ЭВМ.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка использованных источников, содержащего 91 наименование. Она изложена на 120 страницах машинописного текста, содержит 48 рисунков и 10 таблиц.

Основные научные положения и результаты, выносимые на защиту

1. Алгоритм неэталонной оценки качества на основе дискретного косинусного преобразования, среднее значение коэффициента корреляции которого с субъективными экспертными оценками по базе LIVE равно 0,92, а по базе TID2008 - 0,84.

2. Результаты эксперимента по оценке корреляции между разработанной неэталонной метрикой и значениями стандартных эталонных метрик ПОСШ и КСП. Коэффициент корреляции достигает значения в 0,95-0,99 для изображений с различной степенью детализации, при этом его среднее значение составляет 0,98.

3. Зависимости по оценке параметров ряда алгоритмов обработки и распознавания изображений от предложенного неэталонного критерия.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность выбранной темы, сформулированы цель и задачи исследования, изложены основные положения, выносимые на защиту, показаны научная новизна и практическая значимость работы.

В первой главе проведен обзор существующих методов оценки качества изображений, использующих оригинал изображения, и неэталонных методов.

Во второй главе рассмотрен новый алгоритм неэталонной оценки качества изображений на основе дискретного косинусного преобразования.

В предложенном алгоритме неэталонной оценки качества изображений, основанном на использовании статистики коэффициентов дискретного косинусного преобразования (НОдкпС), осуществляется извлечение признаков изображения и их статистическое моделирование. Блок-схема алгоритма НОдкпС приведена на рис. 1.

Рис. 1. Блок-схема предложенного алгоритма оценки качества НОдкпС

На первом этапе изображение разбивается на блоки размером N х N пикселей и над каждым из блоков осуществляется дискретное косинусное преобразование, определяемое выражением:

ч 4 ф)ф) . (2 у +1 )т (2 к + 1)уя

где 0<и<ЛГ-1, 0<у<ЛГ-1 и с(и),ф) = П2' м'у = 0.

[ 1, Ф О

Вычисление коэффициентов выполняется локально в пространственной области, что согласуется с особенностями зрительной системы человека (ЗСЧ). Затем к каждому из полученных блоков ДКП-коэффициентов применяется обобщенная модель Гаусса, т.е. вычисляются параметры обобщенного распределения Гаусса. При этом блок ДКП-коэффициентов разделяется на три области, приведенные на рис. 2а для N = 5 и соответствующие области низких, средних и высоких частот.

Итоговая оценка качества изображения определяется по модели Байеса путем максимизации вероятности того, что данное изображение имеет указанное качество на основе полученных из изображения параметров (максимизация апостериорной вероятности).

Соо С01 С 02 Соз Со4 Соо С01 С02 Соз Сод

Сю Си С12 С13 С14 Сю С„ С12 С,3 Си

С20 С21 С22 С23 С24 С20 С21 С22 С23 С24

Сзо С31 С32 Сзз Сэ4 Сзо Сз1 С 32 Сзз С34

с40 с4, С42 С4З с„ Сад с4, С42 Сдз С44

а) б)

Рис. 2. Матрица ДКП-коэффициентов: а) разбиение блока на частотные диапазоны; б) пространственное разбиение

В разработанном алгоритме предлагается извлечение признаков из изображения производить дважды: первый раз производя преобразования непосредственно над исходным изображением, а второй раз - после низкочастотной фильтрации и уменьшения разрешения.

Для аппроксимации распределения коэффициентов ДКП изображения часто используется распределение Лапласа, которое имеет высокий пик и более «тяжелые» хвосты, нежели нормальное распределение. Однако наличие искажений в целом меняет распределение коэффициентов. Для моделирования искаженных изображений, в частности, может использоваться семейство обобщенных распределений Гаусса, которое позволяет аппроксимировать широкий диапазон ДКП-коэффициентов искаженного изображения.

Введем одномерную плотность вероятности обобщенного распределения Гаусса:

= (2) где (л. - математическое ожидание (параметр сдвига), у - параметр формы, а а и Р — параметры, определяемые выражениями:

Ру

а=Щ77У (3)

Р-ЦШ^. (4)

ст

г(1/у)'

где ст - среднеквадратическое отклонение, а Г - гамма-функция, задаваемая выражением:

со

Г (2) = |/гЛ-'Л. (5)

о

Указанное семейство распределений включает в себя распределение Гаусса (при у = 2) и Лапласа (при у = 1). При у —»со распределение стремится к нормальному. Статистические характеристики любого распределения данного семейства однозначно задаются параметрами у и Р (или ст ). Однако в практических ситуациях параметры распределения, как правило, априорно неизвестны, и потому требуется их оценка.

В настоящей работе предлагается использовать подход, в основе которого лежит метод максимального правдоподобия (ММП). Анализ научно-технических источников показывает, что ММП превосходит другие методы в задаче оценки параметров распределений с тяжелым хвостом, к которым относится семейство обобщенных распределений Гаусса.

Пусть х — случайная величина, соответствующая гистограмме ДКП-коэффициентов. Введем коэффициент изменения частоты, определяемый следующим выражением:

где ст(|х|) и ц(| х|) - среднеквадратическое отклонение и математическое ожидание амплитуды ДКП-коэффициентов | х | соответственно.

Если плотность распределения вероятности случайной величины х определяется выражением (2), то математическое ожидание может быть записано следующим образом:

где значения аир определяются выражениями (3) и (4) соответственно. Подставив значения для а и Р в выражение (7), получим: Г(1/у)Г(3/у)_а2(|х|)

2а '

-I Р2у

(7)

Г2 (2/ у) ц2(М) Отсюда выразим коэффициент изменения частоты:

(8)

а(И)= Г(1/у)Г(3/у) Ц(1х I) Ч Г2(2/у) "

Значение коэффициента частоты Е, вычисляются вначале путем усреднения 10% максимальных значений, а затем — путем усреднения по всем локальным блокам изображения. В физическом смысле знаменатель ц(|х|) определяет центральное значение функции распределения коэффициентов ДКП, а ст(|дг|) -разброс значений.

Вносимые искажения приводят к изменению локальных спектральных характеристик изображения. Для оценки степени искажений определим величину энергии, соответствующую каждому из поддиапазонов ДКП-коэффицентов, приведенному на рис. 2а.

При этом коэффициенты, стоящие в левом углу матрицы, соответствуют низким частотам (в т.ч. постоянной составляющей), а в правом углу - высоким частотам. Определим три диапазона частот таким образом, как это приведено на рис. 2а. Обозначим через С2П набор коэффициентов, соответствующих заданному диапазону частот (п = 1, 2, 3). Затем определим среднее значение энергии коэффициентов в полосе частот п через величину дисперсии а2:

Еп=ъ1- (10)

Рассмотрим матрицу ДКП-коэффициентов размером 5x5 (рис. 2). Значение дисперсии при этом определяется из функции плотности распределения вероятности. Отношение разности между средним значением энергии в частотном диапазоне п и суммой средних значений энергии в предыдущих частотных диапазонах (до п -1 включительно), и суммы указанных величин определяется выражением (для п = 2, 3):

'* 1 1<-Ц

К=-(П)

п — 1 ^^

11 1 1<?п

Величина Яп позволяет определить распределение энергии коэффициентов между различными частотными диапазонами, на которые оказывают влияние определенные типы искажений. Большое значение коэффициента Яп соответствует равномерному частотному распределению энергии внутри изображения. Для определения величины искажений оцениваются значения коэффициентов й2 и й,, усредненные по всем блокам изображения. Как и ранее, усреднение производится по 10% максимальным значениям и по всем полученным значениям.

Искажения, вносимые в изображение, нередко приводят и к пространственному изменению распределения энергии. Для получения информации о пространственных свойствах изображения предлагается разбиение матрицы ДКП-коэффициентов на 3 ориентированных диапазона так, как это представлено на рис. 26. При этом аппроксимация коэффициентов с помощью обобщенной функции Гаусса производится отдельно для каждого из диапазонов. Затем осуществляется вычисление дисперсии коэффициента Е, для каждого из диапазонов. После этого производится усреднение значения дисперсии % по 10% максимальным значениям и по всем полученным значениям.

В алгоритме неэталонной оценки качества предлагается извлечение признаков из изображения производить дважды: первый раз производя преобразования непосредственно над исходным изображением, а второй раз - после низкочастотной фильтрации и уменьшения разрешения изображения с фактором, равным 2. Низкочастотная фильтрация изображения при этом осуществляется дискретным фильтром Гаусса с ядром размером 3x3, представленным на рис. 3.

0,0113 0,0838 0,0113

0,0838 0,6193 0,0838

0,0113 0,0838 0,0113

Рис. 3. Ядро фильтра Гаусса, используемого для низкочастотной фильтрации

Обозначим через X,=[х1,х2,...,хт] вектор коэффициентов (признаков), полученных из изображения (г - номер изображения, т - число признаков). Пусть DMOS, - значение DMOS (Differential Mean Opinion Score, дифференциальная средняя экспертная оценка) для заданного изображения /'.

Для определения параметров вероятностной модели, используемой в рамках работы, указанная модель обучена на подмножестве изображений из тестовой базы данных LIVE, которая включает в себя как сами изображения, так и их субъективные оценки DMOS. Целью обучения являлась максимизация степени корреляции между объективными оценками качества, полученными с помощью предложенного алгоритма, и результатами субъективной экспертизы (значениями DMOS). Данная вероятностная модель использовалась впоследствии для оценки качества изображения путем максимизации условной вероятности PfDMOS^XJ, что эквивалентно максимизации распределения Р(Х, DMOS), т.к. Р(Х, DMOS) = P(DMOS\X)p(X). При этом стоит отметить, что величина обучающей выборки зависит от количества используемых искажений, а также от степени их градации. Для определения параметров функции распределения вероятности обобщенного

распределения Гаусса число обучающих изображений должно на порядок превышать количество неизвестных параметров в используемой вероятностной модели. В приведенном случае данное условие достаточно легко выполнимо.

Для определения степени корреляции между значениями НОДКпС и результатами субъективной экспертизы было проведено исследование по оценке качества изображений базы данных LIVE. Эталонные изображения базы LIVE отображают 5 типов искажений (JPEG - 227 изображений, JPEG2000 - 233 изображения, гауссовское размытие - 174 изображения, аддитивный белый гауссовский шум (АБГШ) - 174 изображения, битовые ошибки JPEG2000-noTOKa -174 изображения). В ходе моделирования и апробации работы алгоритма НОдкпС изображения базы LIVE были разделены на два подкласса: обучающий и тестовый. Каждая обучающая выборка состояла из изображений, соответствующих 23 эталонным (т.е. полученным из 23 эталонных изображений путем внесения искажений), а тестовая — из изображений, соответствующих 6 эталонным: т.о. 80% изображений базы LIVE были использованы для формирования обучающего набора, а 20% - для тестового. Путем случайной выборки было получено 1000 наборов обучающих и тестовых изображений. Диаграммы рассеяния значений НОдкпС для трех представленных в базе LIVE искажений приведены на рис. 4. Указанные диаграммы свидетельствуют о сильной линейной зависимости между значениями DMOS и НОдкпС.

0

1

80

20

J • •

.s

• р

à

1 • г,-

Mi

80

•• • • •

. t •• :

| •

V

20

40 60 DMOS

80

80

20

40 60

DMOS В)

20 40 60 DMOS

а) " б)

Рис. 4. Диаграмма рассеяния между субъективными оценками и величиной НОдкпС для различных типов искажений: а) АБГШ; б) JPEG-сжатие; в) гауссовское размытие

Для дополнительного анализа работы алгоритма оценки качества НОДКпС были рассчитаны коэффициенты линейной корреляции. Аналогичное исследование было проведено для базы изображений TID2008 (при этом обучение алгоритма, как и ранее, производилось на базе LIVE). Полученные значения приведены в табл. 1.

Полученные результаты так же, как и представленные диаграммы рассеяния, позволяют судить о высокой линейной зависимости между значениями DMOS и НОдкпС. Кроме того, практически для всех представленных в табл. 1 случаев, критерий НОдкпС по величине корреляции превосходит эталонные метрики ПОСШ и КСП, что свидетельствует о высокой степени согласованности между результатами объективной и субъективными оценками качества.

Таблица 1

Коэффициенты линейной корреляции между величиной DMOS и значениями объективных метрик для изображений баз LIVE и TID2008 (выделены лучшие результаты)

Тип искажения LIVE TID2008

ПОСШ КСП НОдкпС ПОСШ КСП НОдкпС

JPEG2000 0,86 0,94 0,96 0,82 0,96 0,91

JPEG 0,88 0,94 0,98 0,87 0,94 0,90

АБГШ 0,97 0,97 0,98 0,92 0,81 0,70

Гауссовское размытие 0,78 0,89 0,94 0,94 0,91 0,85

Битовые ошибки 0,88 0,94 0,86 - - -

Среднее значение 0,86 0,90 0,92 0,89 0,90 0,84

Результаты, приведенные в табл. 1, показывают, что для всех типов искажений, за исключением АБГШ, значения коэффициентов корреляции остаются достаточно высокими. Некоторое снижение коэффициентов для базы ТШ2008 обусловлено, прежде всего, различиями в процессе моделирования искажений (при формировании базы изображений). Тем не менее, итоговое значение корреляции в 0,84 по-прежнему свидетельствует о достаточно сильной линейной зависимости между значениями БМОБ и НОдкпС.

В третьей главе работа алгоритма НОдкпС оценивалась в задачах определения качества сжатых и зашумленных изображений.

Рассмотрим подавление АБГШ с нулевым математическим ожиданием и различными значениями ст двумя фильтрами: линейным фильтром Винера и билатеральным фильтром.

Оценку результатов фильтрации будем производить по трем критериям качества: ПОСШ, КСП и предложенной метрикой НОдкпС. Результаты, полученные для набора тестовых изображений, приведены в табл. 2. В ней приводятся значения указанных объективных метрик для изображения «Перцы» с низкой степенью детализации, изображения «Барбара» с высокой степенью детализации, а также усредненные по всем шести тестовым изображениям значения. При этом под номером 1 приводятся значения объективных метрик для зашумленного изображения, 2 - результаты винеровской фильтрации, 3 - результаты билатеральной фильтрации.

Результаты, приведенные в табл. 2, показывают, что для изображений с любой степенью детализации значения, полученные посредством алгоритма НОдкпС, ведут себя монотонно: величина метрики увеличивается с ростом степени зашумления изображения, что позволяет сделать вывод о корректности работы алгоритма. Кроме того, полученные результаты также хорошо согласуются с данными других критериев практически для всех приведенных случаев: максимальному значению ПОСШ и КСП соответствует минимальное значение НОДКпС. Отсюда можно сделать вывод о возможности использования алгоритма НОдКПС в задаче фильтрации полутоновых изображений, зашумленных АБГШ.

Таблица 2

Значения объективных критериев качества при различных значениях а АБГШ (выделены лучшие результаты)

ст Метрика «Перцы» «Барбара» Среднее значение по 6 изображениям

1 2 3 1 2 3 1 2 3

10 ПОСШ, дБ 28.2 33,1 33,9 28,1 31,2 31,3 28,2 32,1 32,4

КСП 0,61 0,85 0,87 0,72 0,89 0,89 0,67 0,87 0,87

НОдкпС 13,5 23,0 26,5 0 0 0 21,1 21,9 22,8

20 ПОСШ, дБ 22,2 29,6 30,6 22,2 26,9 26,7 22,2 28,3 28,8

КСП 0,33 0,75 0,81 0,48 0,77 0,77 0,41 0,76 0,78

НОдкпС 30,0 23,5 28,5 13,0 7,5 9,5 34,8 25,5 28,5

30 ПОСШ, дБ 18,8 27,6 28,5 18,8 24,9 24,7 18,8 26,3 26,9

КСП 0,21 0,67 0,76 0,35 0,68 0,68 0,29 0,67 0,71

НОдкпС 42,0 33,0 28,5 26,0 12,5 17,0 42,5 30,8 31,0

40 ПОСШ, дБ 16,4 26,1 27,2 16,5 23,5 23,8 16,4 24,9 25,7

КСП 0,15 0,60 0,71 0,26 0,59 0,62 0,21 0.59 0,65

НОЖпС 49,0 33,5 29 41,0 19,5 19,5 52,3 34,0 33,8

50 ПОСШ, дБ 14,7 25,2 26,2 14.8 22,5 23,2 14,7 23,9 24,8

КСП 0,11 0,55 0,67 0,20 0,53 0,57 0,16 0,53 0,60

НОЖпС 56,0 32,5 32 49,0 23 28 60,3 35,2 36,7

Из рис. 5 видно, что поведение графика, соответствующего метрике НОДКпС, в целом аналогично метрике ПОСШ: для НОдкпС наблюдается прямая зависимость между значением а АБГШ и величиной метрики, а для ПОСШ - обратная (что обусловлено принципами расчета соответствующих метрик).

а о

а) б)

Рис. 5. Зависимость значений объективных метрик, усредненных по шести тестовым изображениям, от уровня шума: а) ПОСШ; б) НОдкпС

Рассмотрим работу алгоритма НОдкпС в задаче удаления артефактов блочности из изображений, сжатых при помощи стандарта JPEG. Для восстановления будем использовать алгоритм удаления блочности (АУБ) и фильтр на основе адаптивного дискретного косинусного преобразования (А-ДКП). Результаты, полученные для набора тестовых изображений, приведены в табл. 3. Здесь под номером 1

приводятся значения объективных метрик для сжатого изображения, 2 - результаты обработки алгоритмом удаления блочности, 3 - результаты обработки А-ДКП.

Таблица 3

Значения критериев качества для сжатых и восстановленных изображений при различных значениях Ьрр (выделены лучшие результаты)

Ьрр Метрика «Перцы» «Барбара» Среднее значение по 6 изображениям

1 2 3 1 2 3 1 2 3

0,2 ПОС1П, дБ 29,4 29,7 31,0 23,3 23,6 34,5 26,9 27,2 28,1

КСП 0,76 0,80 0,82 0,64 0,67 0,70 0,70 0,72 0,74

НОдкпС 71,0 48,0 48,5 67,5 37,0 38,5 77,2 55,7 55,5

0,4 пост, дБ 33,4 32,9 34,2 26,8 26,8 27,5 30,5 30,4 31,2

КСП 0,85 0,85 0,86 0,81 0,82 0,84 0,82 0,82 0,83

НОдкпС 52,5 46,0 48,0 36,5 29,0 25,5 52,2 44.7 43,5

0,6 ПОСШ, дБ 34,8 34,0 35,3 28,9 28,7 29,5 32,3 32,0 32,7

КСП 0,88 0,87 0,88 0,87 0,87 0,89 0,87 0,86 0,87

НОдкпС 31,0 32,0 42,5 20,5 18,5 18,0 35,3 35,9 38,1

0,8 ПОСШ, дБ 35,7 34,5 36,0 31,5 31,4 32,0 33,7 33,3 34,0

КСП 0,90 0,88 0,89 0,91 0,91 0,92 0,90 0,88 0,90

НОдкпС 16,0 20,0 36,0 15 13,0 14,5 21,4 22,8 31,9

1 ПОСШ, дБ 36,4 35,3 36,5 33,1 32,9 33,6 34,7 34,3 34,9

КСП 0,91 0,89 0,90 0,93 0,92 0,94 0,91 0,90 0,91

НОдкпС 7,5 8,0 33,0 8,5 7,5 11,5 14,5 14,5 24,5

Результаты исследования показывают, что значения НОДКпС хорошо согласуются с оценками качества, полученными с помощью широко используемых эталонных критериев, что свидетельствует о возможности его применения в задаче удаления блочности. Графики, приведенные на рис. 6, свидетельствуют о том, что в целом предложенный алгоритм НОдкпС ведет себя аналогично метрике КСП, но его значения монотонно уменьшаются при увеличении показателя бит на пиксель (Ьрр). Кроме того, все указанные метрики ведут себя единообразно и свидетельствуют о том, что АУБ и фильтр на основе А-ДКП позволяют достичь практически одинакового результата.

Заш. изображение » Алгор. удал, блочности Фильтр на осн. А-ДКП

80

70

60

и

с X 50

Ч

О 40

X

30

20

10

\ —ч— \ — — Заш.изображение ■ Алгор.удал.блочности

V

0.2 0.4 0.6 0.8

Ьрр

б)

Рис. 6. Зависимость значений объективных метрик, усредненных по шести тестовым изображениям, от степени сжатия изображения (величины Ьрр): а) КСП; б) НОдкпС

В четвертой главе работа алгоритма НОдкпС оценивалась в задачах детектирования объектов и распознавания изображений.

Анализ современных источников по вопросам распознавания лиц показывает, что наиболее перспективными для практической реализации являются алгоритмы на основе метода главных компонент, линейного дискриминантного анализа и метода сравнения гистограмм локальных бинарных паттернов (ЛБП). Отдельного внимания заслуживает вопрос робастности алгоритмов распознавания в условиях наличия гауссовских и импульсных помех.

Для определения зависимости способности человека распознавать объекты от степени искажения запоминаемого объекта был проведен эксперимент. На основе тестовой базы РЕЛЕТ было составлено 20 наборов похожих друг на друга людей (рис. 7): 10 мужчин и 10 женщин. Для исключения влияния запоминания фона и характерных объектов все изображения были откадрированы с помощью алгоритма выделения лиц. В каждом наборе было лицо, наиболее похожее на оставшиеся три. Данное изображение было названо якорным (рис. 7а).

Якорные изображения были искажены гауссовским размытием (рис. 8) и импульсным шумом (рис. 9). Для каждого искажения были выбраны четыре степени искажения таким образом, чтобы на двух последних степенях человек мог с трудом запомнить изображение.

б) в)

Рис. 7. Пример набора, состоящий из изображений похожих людей

= 5 б) а =10 в) а =15 г) о = 20

8. Четыре уровня искажений якорного изображения гауссовским размытием

а)р = 0,1

Рис. 9. Четыре

б)р = 0,2 в)р = 0,3 г)р~ 0,4

уровня искажений якорного изображения импульсным шумом

Во время эксперимента испытуемому показывалось якорное изображение в одной из степеней искажения в течение двух секунд. После десятисекундного перерыва на экран выводился весь набор неискаженных изображений. Испытуемый должен был выбрать правильное изображение. Каждому из 100 испытуемых были показаны все 20 наборов в различных комбинациях уровней и типов искажений.

На рис. 10 и рис. 11 приведены результаты проведенного эксперимента.

100

80

60 о 60

40

20 + -- —— — : 20

о

0 5 10 15 20 0 0.1 0.2 0.3 0.4

а р

а) б)

Рис. 10. Зависимость процента правильных ответов экспертов от уровня искажения: а) гауссовское размытие, все изображения; б) импульсный шум, все изображения

■ч N. —1 Эксперимент --ЛБП

Ч

\

60

65 70 НОдкпС

а)

90

г? = 80 X

т 70 ш 5 60 ГО

о 50 | 40

£ зо

О) § 20 о.

> 10

Эксперимент --ЛБП

75

80 НОдкпС

б)

85

90

Рис. 11. Зависимость значений объективной метрики НОдкпС от уровня распознавания при гауссовским размытии: а) гауссовское размытие; б) импульсный шум

Проведённое исследование по способности человека распознавать лица в зависимости от качества приведенных тестовых изображений позволяет сделать вывод, что процент правильных ответов в эксперименте мало зависит от типа лица (мужчина или женщина), изображённого на изображении, и во всех случаях при увеличении степени искажения процент правильных ответов уменьшался: для гауссовского размытия - вплоть до 40% при о = 20, для импульсного шума - до 50% при вероятности появления импульса р = 0,4.

Использование предложенного алгоритма нелинейной фильтрации на базе модифицированного медианного фильтра позволяет существенно повысить уровень распознавания лиц методом ЛБП на изображениях, зашумлённых импульсным шумом до вероятности р = 0,2.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Разработан h реализован неэталонной алгоритм оценки качества изображений на основе дискретного косинусного преобразования.

2. Исследовано применение разработанного алгоритма оценки качества в задачах фильтрации и сжатия изображений, детектирования и распознавания объектов.

3. Для разработанного алгоритма оценки качества среднее значение коэффициента корреляции с субъективными экспертными оценками по базе LIVE равно 0,92, а по базе TID2008 - 0,84.

4. Проведен эксперимент по оценке корреляции между разработанной неэталонной метрикой и значениями стандартных эталонных метрик ПОСШ и КСП. Коэффициент корреляции достигает значения в 0,95-0,99 для изображений с различной степенью детализации, при этом его среднее значение составляет 0,98.

5. Неэталонный характер работы предложенного алгоритма позволяет использовать его в широком спектре практических приложений, где, как правило, исходное (эталонное) изображение не доступно.

6. Дискретное косинусное преобразование применяется на этапе кодирования в ряде стандартов сжатия изображений и видеопоследовательностей, таких как JPEG, Motion JPEG, Н.26х и интегрировано в современные аппаратные платформы обработки изображений, что позволяет использовать алгоритм оценки качества на этапе кодирования изображений.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Статьи в журналах из перечня ВАК

1. Павлов, Е.А. Алгоритмы оценки качества видеопоследовательностей, сжатых по стандарту Motion JPEG2000 / A.JI. Приоров, И.В. Апальков, Н.Б. Герасимов, Е.А. Павлов // Успехи современной радиоэлектроники. - 2012. - № 10. - С.59-65. -ISSN 2070-0784.

2. Павлов, Е.А. Оценка качества цветных изображений при подавлении импульсного шума / A.JI. Приоров, В.В. Хрящёв, Е.А. Павлов, Н.Б. Герасимов, A.M. Шемяков // Радиотехника. - 2013. - № 5. - С.41-49. - ISSN 0033-8486.

Свидетельство о государственной регистрации программы для ЭВМ

3. Павлов, Е.А. PicLab.SQA - программа для проведения субъективной экспертизы оценки качества изображений / И.В. Апальков, Н.Б. Герасимов, О.Н. Гущина, Е.А.Павлов. - №2011612002. - зарегистрировано в Реестре программ для ЭВМ 18 мая 2011.

Материалы российских н международных конференций

4. Павлов, Е.А. Нейросетевой переключающийся медианный фильтр для удаления импульсного шума / В.В. Хрящев, Д.К. Куйкин, Е.А. Павлов // Вестник Ярославского государственного университета. Серия Физика. Радиотехника. Связь. - 2008. - № 1. -С.128—132.

5. Павлов, Е.А. Анализ нелинейных алгоритмов удаления шума из изображений / С.С. Бухтояров, Н.Б. Герасимов, Е.А. Павлов, В.В. Хрящёв // Доклады 9-й Международной конференции «Цифровая обработка сигналов и ее применение». -М„ 2007.-Т. 2. -С.378-381.

6. Павлов, Е.А. Анализ алгоритмов сжатия изображений в среде Piclab / В.А. Бекренев, Е.А. Павлов // Тезисы докладов XV международной студенческой школы-семинара. — М„ 2007. — С.214—215.

7. Павлов, Е.А. Удаление импульсного шума из изображений / Е.А. Павлов, A.A. Студёнова // XI Всероссийская научная конференция студентов-радиофизиков: тезисы докладов - СПб.: Изд-во Политехи, ун-та, 2007. - С.95-97.

8. Павлов, Е.А. Сравнение алгоритмов удаления шума из цифровых изображений / Н.Б. Герасимов, Д.К. Куйкин, Е.А. Павлов // Материалы VI Всероссийской научно-технической конференции «Динамика нелинейных дискретных электротехнических и электронных систем». - Чебоксары, 2007. - С. 151-152.

9. Павлов, Е.А. Удаление импульсного шума со случайными значениями импульсов из изображений / Д.К. Куйкин, Е.А. Павлов, A.A. Студёнова // Доклады 10-й международной конференции «Цифровая обработка сигналов и ее применение». -М., 2008. - Т. 2. - С.511-514.

10. Павлов, Е.А. Удаление импульсного шума со случайными значениями импульсов из изображений / Д.А. Зараменский, A.A. Студёнова, Е.А. Павлов // Тезисы докладов 14-ой международной научно-технической конференции «Радиоэлектроника, электротехника и энергетика». - М., 2008. — Т. 1. — С.102—103.

11. Павлов, Е.А. Среда обработки изображений - PICLAB / A.A. Абдуллоев, Е.А. Павлов, A.A. Студёнова // Тезисы докладов 14-ой межд. научно-технической конференции «Радиоэлектроника, электротехника и энергетика». - М., 2008. - Т. 1. - С.290-291.

12. Павлов, Е.А. Направленный взвешенный медианный фильтр для удаления импульсного шума из изображений / Д.К. Куйкин, Е.А. Павлов, A.A. Студёнова // Материалы 15-ой международной научно-технической конференции «Проблемы передачи и обработки информации в сетях и системах телекоммуникаций». -Рязань, 2008. - Т. 2. - С.122-123.

13. Павлов, Е.А. Исследовательская среда для обработки изображений PicLab / Н.Б. Герасимов, Е.А. Павлов, Д.К. Куйкин // Труды науч.-тех. конф. «Проблемы автоматизации и управления в технических системах». - Пенза, 2008. - С.315-318.

14. Павлов, Е.А. Использование адаптивного дискретного косинусного преобразования для удаления гауссова шума из изображений / Н.Б. Герасимов, О.Н. Гущина, Е.А. Павлов // Труды LXV научной сессии, посвященной Дню Радио. - М., 2010. -С.361-363.

15. Павлов, Е.А. Метод неэталонной оценки качества изображений на основе статистической модели искажений / Н.Б. Герасимов, О.Н. Гущина, Е.А. Павлов // Труды LXVI научной сессии, посвященной Дню Радио. - М., 2011. - С. 347-350.

16. Павлов, Е.А. Разработка и анализ методов неэталонной оценки качества изображений / Н.Б. Герасимов, О.Н. Гущина, Е.А. Павлов // Материалы всероссийской научной конф. «Молодые исследователи - регионам». - Вологда, 2011. - Т. 1. — С.67-69.

17. Павлов, Е.А. Слепая оценка качества изображений с неизвестным типом искажения / Е.А.Павлов // Тезисы докладов 18-ой межд. научно-технической конференции «Радиоэлектроника, электротехника и энергетика». -М., 2012. - Т. 1. - С. 118.

18. Павлов, Е.А. Фильтрация гауссова шума и оценка качества полноцветных изображений / Е.А. Павлов, В.А. Павлов, A.M. Шемяков, O.A. Кисельникова // Доклады 14-й международной конференции «Цифровая обработка сигналов и ее применение». - М., 2012. - Т. 2. - С.292-294.

19. Павлов, Е.А. Неэталонная оценка качества сжатых, зашумленных и размытых изображений / Е.А. Павлов, A.JI. Приоров, A.A. Студёнова, A.M. Шемяков // Доклады 15-ой международной конференции «Цифровая обработка сигналов и ее применение». - М„ 2013. - Т. 2. - С.104-106.

Павлов Евгений Александрович

РАЗРАБОТКА И АНАЛИЗ НЕЭТАЛОННОГО АЛГОРИТМА ОЦЕНКИ КАЧЕСТВА ИЗОБРАЖЕНИЙ НА ОСНОВЕ ДИСКРЕТНОГО ПРЕОБРАЗОВАНИЯ

Автореферат диссертации на соискание ученой степени кандидата технических наук

Подписано в печать 18.11.2013 Формат 60x84 1/16. Тираж 100 экз. Отпечатано в печатном салоне «Спринт Пресс» (ИП Платонова И.В.) 150000, Ярославль, ул. Б. Октябрьская, 37

Текст работы Павлов, Евгений Александрович, диссертация по теме Радиотехника, в том числе системы и устройства телевидения

ЯРОСЛАВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ им. П.Г. ДЕМИДОВА

04201 456350 На правах рукописи

Евгений Александрович Павлов

Разработка и анализ неэталонного алгоритма оценки качества изображений на основе дискретного преобразования

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата технических наук по специальности 05.12.04 «Радиотехника, в том числе системы и

устройства телевидения»

Научный руководитель - к.т.н., доцент Хрящев Владимир Вячеславович

Владимир - 2013

СОДЕРЖАНИЕ

ВВЕДЕНИЕ............................................................................................................................................4

ГЛАВА 1. ОЦЕНКА КАЧЕСТВА ЦИФРОВЫХ

ИЗОБРАЖЕНИЙ..........................................................................................................................12

1.1. Субъективные критерии качества..........................................................................................12

1.2. Объективные критерии качества..............................................................................................14

1.2.1. Эталонные критерии оценки качества изображений............................16

1.2.2. Неэталонные критерии оценки качества изображений....................21

1.3. Краткие выводы....................................................................................................................................................24

ГЛАВА 2. НЕЭТАЛОННЫЙ АЛГОРИТМ ОЦЕНКИ КАЧЕСТВА

ИЗОБРАЖЕНИЙ............................................................................................................................................26

2.1. Алгоритм неэталонной оценки качества изображений 26 НОдкпС.........................................................................................

2.1.1. Общая схема алгоритма..........................................................................................................................26

2.1.2. Оценка параметров обобщенного распределения Гаусса............29

2.1.3. Распределение энергии коэффициентов по частоте..............................34

2.1.4. Пространственные искажения......................................................................................................36

2.1.5. Извлечение признаков................................................................................................................................37

2.1.6. Оценка качества изображения......................................................................................................38

2.1.7. Оценка корреляции разработанного неэталонного алгоритма с результатами субъективной экспертизы..........................39

2.2. База изображений LIVE......................................................................................................39

2.3. Расчет коэффициентов корреляции....................................................................................43

2.4. Апробация работы метрики НОдкпС ..............................................................................44

2.5. Краткие выводы....................................................................................................................................................48

ГЛАВА 3. АНАЛИЗ РАБОТЫ ПРЕДЛОЖЕННОГО

НЕЭТАЛОННОГО АЛГОРИТМА В ЗАДАЧАХ ОЦЕНКИ КАЧЕСТВА ВОССТАНОВЛЕННЫХ И

СЖАТЫХ ИЗОБРАЖЕНИЙ....................................................................................................5 О

3.1. Тестовые изображения..............................................................................................................................50

3.2. Модели искажений..........................................................................................................................................52

3.2.1. Гауссовский шум................................................................................................................................................52

3.2.2. Сжатие изображений с использованием алгоритма JPEG............53

3.3. Применение неэталонной оценки

в задаче фильтрации полутоновых изображений........................................56

3.4. Применение неэталонной оценки в задаче подавления артефактов блочности................................................................................................................................61

3.5. Применение неэталонной оценки в задаче фильтрации цветных изображений..................................................................................................................................65

3.6. Краткие выводы....................................................................................................................................................70

ГЛАВА 4. АНАЛИЗ РАБОТЫ ПРЕДЛОЖЕННОГО

НЕЭТАЛОННОГО АЛГОРИТМА В ЗАДАЧАХ ДЕТЕКТИРОВАНИЯ И РАСПОЗНАВАНИЯ ОБЪЕКТОВ НА ТЕЛЕВИЗИОННЫХ

ИЗОБРАЖЕНИЯХ........................................................................................................................................71

4.1. Вводные замечания..........................................................................................................................................71

4.2. Анализ алгоритма в задачах детектирования....................................................73

4.2.1. Алгоритм детектирования лиц Виолы-Джонса..............................................73

4.2.2. База изображений для эксперимента детектирования лиц..........80

4.2.3. Подготовка данных для эксперимента..........................................................................80

4.2.4. Оценка изображений....................................................................................................................................87

4.2.5. Проведение исследований по внешней базе изображений .... 89

4.3. Анализ алгоритма в задаче распознавания лиц............................................91

4.3.1. Алгоритмы распознавания людей на основе информации о лице..............................................................................................................................................................................................91

4.3.1.1. Алгоритм на основе метода главных компонент........................................91

4.3.1.2. Алгоритм на основе линейного дискриминантного анализа. 93

4.3.1.3. Метод сравнения гистограмм локальных бинарных паттернов..........................................................................................................................................................................94

4.3.2. Модификация прогрессивного переключающегося медианного фильтра......................................................................................................................................96

4.3.3. Эксперимент по способности человека распознавать лица... 99

4.4. Результаты тестирования алгоритмов распознавания........................103

4.5. Краткие выводы....................................................................................................................................................106

ЗАКЛЮЧЕНИЕ......................................................................... 107

СПИСОК ЛИТЕРАТУРЫ....................................................... 110

ВВЕДЕНИЕ

Актуальность темы. Цифровая обработка визуальной информации в настоящее время охватывает различные виды инфокоммуникационных приложений и расширяет их спектр. Сюда относятся как традиционные приложения (вещательное, промышленное, охранное телевидение), так и относительно новые приложения (видеоконференцсвязь, техническое зрение, цифровое кино, телевидение высокой и сверхвысокой четкости, 3D-телевидение) [1-7].

В соответствии с современной классификацией предложенной В.П. Дворковичем и A.B. Дворковичем цифровая обработка телевизионных и компьютерных изображений включает в себя следующие основные области [6]:

- коррекция изображения, их «препарирование», т.е. сознательное разделение на части цифровыми средствами, видоизменение этих частей и их обратная «сборка»;

- оценка параметров изображений с целью контроля качества их передачи и приема;

- преобразование и кодирование изображений для хранения и передачи по каналам связи;

- компьютерная графика, а также визуализация информации, т.е. представление массивов данных в виде различных изображений, что очень эффективно, так как облегчает решение многих задач, сложных именно своей абстрактностью.

Важность разработки подобных алгоритмов также можно объяснить происходящим в настоящее время переходом к цифровому телевещанию, вызванным развитием в России стандартов DVB первого и второго поколений. Постановлением Правительства Российской Федерации от 3

декабря 2009 г. № 985 утверждена федеральная целевая программа «Развитие телерадиовещания в Российской Федерации на 2009-2015 годы» [4-6].

Задача неэталонной оценки качества изображений вызывает в последние годы повышенный интерес исследователей. Большая часть предлагаемых неэталонных алгоритмов разработана для конкретных типов априори известных искажений в изображении (блочность, размытие), что не всегда удобно для использования в практических приложениях. Поэтому разработка неэталонных критериев оценки качества изображений без использования априорной информации о типе искажения сегодня представляет собой актуальную научно-техническую задачу [1, 3, 7, 11, 13, 19, 20, 24-28].

Причины возникновения шумов на изображении различны. Например, в процессе получения изображения с помощью фотокамеры с ПЗС матрицей основными факторами, влияющими на величину шума, являются уровень освещенности и температура сенсоров [1,2]. В процессе передачи изображения могут искажаться помехами, возникающими в каналах связи. Например, при передаче изображения с использованием беспроводной связи оно может быть искажено в результате разряда молнии или других возмущений в атмосфере. Аддитивный гауссовский шум, рассматриваемый в работе, характеризуется добавлением к каждому пикселю изображения случайной величины, имеющей нормальное распределение, как правило, с нулевым средним значением [1]. Такой тип шума обычно возникает на этапе получения изображений.

Кроме того, цифровые изображения требуют для хранения довольно большого объема памяти, а для их передачи требуется значительное время, поэтому для уменьшения размера изображений нередко используются алгоритмы сжатия, которые также приводят к возникновению определенных артефактов (блочность, звон, размытие). К методам линейных ортогональных преобразований, которые в последнее время широко применяются в области цифровой обработки изображений, относится метод дискретного

5

косинусного преобразования (ДКП) [1], основанный на использовании ортогональной системы дискретных косинусных функций возрастающих частот. ДКП применяется на этапе кодирования в ряде стандартов сжатия изображений и видеопоследовательностей, таких как JPEG, Motion JPEG и Н-265 [6, 7, 43].

Кроме того, для обработки и восстановления изображений в настоящее время используется широкий диапазон систем и устройств. При этом на практике нередко возникает необходимость производить сравнение указанных систем и устройств (при разработке, оптимизации), но в то же время современные системы передачи характеризуются отсутствием стороннего наблюдателя, который мог бы оценить качество получаемого изображения [3]. Поэтому на сегодняшний день наиболее актуальной задачей является разработка объективных алгоритмов оценки качества изображений. В то же время обычно исследователи исходят из некоторых естественных идей и используют простые критерии, которые па практике, как правило, недостаточно хорошо согласуются с субъективными экспертными оценками [19,20].

Значительный вклад в данную область науки и техники внесли как отечественные ученые М.И. Кривошеев, В.А. Сойфер, М.К. Чобану, A.C. Крылов, Д.С. Ватолин, A.C. Конушин, Б.А. Алпатов, Ю.С. Бехтин, Ю.С. Радченко, так и зарубежные - S. Mitra, R. Gonzalez, R. Woods, Z. Wang, A. Bovik, H. Sheikh, E. Simoncelli, J. Astola, K. Egiazarian, R. Szeliski, R. Lukac и др. [1-44].

В настоящее время экспертами в области цифровой обработки изображений предложено большое число критериев оценки качества, однако большинство разработанных методов имеют существенный недостаток - они требуют наличия изображения-оригинала (эталона), необходимого для проведения оценки. IIa практике же зачастую приходится сталкиваться с ситуациями, когда эталонное изображение недоступно. В этом случае

6

возникает необходимость в создании неэталонных критериев, способных оценивать качество изображения «вслепую».

До последнего времени в цифровой обработке сигналов в основном использовались неэталонные алгоритмы, работающие только с определенным, априорно известным типом искажений (например, блочностью или размытием). Однако в настоящее время разработаны также метрики, не ограниченные каким-либо одним типом повреждений в изображении. В данных критериях используется процедура обучения алгоритма на одной или нескольких базах изображений и/или классификаторы искажений задачу [11-13, 19, 20, 24-28].

Дополнительно способствует разработке неэталонных алгоритмов оценки качества бурное развитие мультисервисных сетей передачи информации, наблюдающееся в России в последние годы. В таких сетях неэталонные критерии могут использоваться для определения качества сжатых изображений и видеопоследовательностей [1-6].

Обзор существующих критериев оценки качества изображений и видеопоследовательностей показал, что универсальных решений в данной области па настоящий момент не существует. Однако ряд альтернативно развиваемых проектов показал правильность и высокую значимость выбранного направления исследований [1, 3, 7, 11, 13, 19, 20, 24-28].

Все вышеперечисленное доказывает, что разработка неэталонных критериев оценки качества представляет собой актуальную научно-техническую задачу.

Основной целью работы является разработка и исследование универсального неэталонного алгоритма оценки качества изображений, позволяющего контролировать параметры систем обработки и анализа видеоданных.

В соответствии с указанной целью в рамках диссертационной работы были поставлены следующие задачи:

- проведение анализа существующих алгоритмов и методик оценки качества цифровых изображений;

- разработка и реализация неэталонного алгоритма оценки качества изображений на основе дискретного косинусного преобразования;

- проведение исследований по оценке корреляции между разработанным неэталонным алгоритмом и результатами субъективной экспертизы оценки качества;

- проведение анализа использования предложенной метрики оценки качества в задачах фильтрации, сжатия, детектирования и распознавания объектов на изображениях.

Объектом исследования являются алгоритмы оценки качества изображений, применяемые в радиотехнических системах фильтрации и сжатия визуальной информации и современных системах охранного телевидения.

Предметом исследования является разработка алгоритма на основе дискретного косинусного преобразования (ДКП), с целью эффективного решения задачи неэталонной оценки качества изображений.

Методы исследования. При решении поставленных задач использовались современные методы цифровой обработки изображений, математического анализа, теории вероятностей, математической статистики. Для практической реализации алгоритмов применялись современные численные методы и среда моделирования МАТЬДВ.

Достоверность полученных научных результатов обусловлена применением адекватного математического аппарата, подтверждается их согласованностью с результатами проведенного компьютерного моделирования и сопоставлением полученных результатов с научными данными, известными из российской и зарубежной литературы.

Научная новизна. В рамках данной работы получены следующие новые

научные результаты:

1. Разработан универсальный алгоритм неэталонной оценки качества изображений, основанный на использовании статистики коэффициентов дискретного косинусного преобразования.

2. Проведена оценка корреляции предложенной неэталонной метрики качества со средними оценками экспертов. Для тестовой базы изображений LIVE среднее значение коэффициента корреляции равно 0,92, а для базы TID2008 - 0,84, что соответствует современным результатам и сопоставимо с популярными эталонными критериями.

3. Найдены пороговые значения параметров для ряда задач обработки и распознавания изображений.

Практическая значимость полученных результатов

1. Неэталонный характер работы предложенного алгоритма позволяет использовать его в широком спектре практических приложений, где, как правило, исходное (эталонное) изображение не доступно. При этом достигаемое значение коэффициента корреляции: 0,86-0,98 (LIVE), 0,70,9 (TID2008) соответствует используемым на практике эталонным критериям.

2. Разработанный алгоритм основан на использовании дискретного косинусного преобразования, для вычисления которого в настоящее время предложены быстрые алгоритмы. Кроме того, ДКП применяется на этапе кодирования в ряде стандартов сжатия изображений и видеопоследовательностей, таких как JPEG, MotionJPEG, Н.26х и интегрировано в современные аппаратные платформы обработки изображений, что позволяет использовать алгоритм оценки качества на этапе кодирования изображений.

3. Проведенный анализ использования предложенного алгоритма в ряде прикладных задач может быть использован в системах обработки и передачи визуальной информации, цифрового телевидения, классификации и распознавания образов и в других задачах цифровой обработки изображений и технического зрения.

Основные научные положения, выносимые на защиту:

1. Алгоритм неэталонпой оценки качества на основе дискретного косинусного преобразования, среднее значение коэффициента корреляции которого с субъективными экспертными оценками по базе LIVE равно 0,92, а по базе TID2008 - 0,84.

2. Результаты эксперимента по оценке корреляции между разработанной неэталонной метрикой и значениями стандартных эталонных метрик ПОСШ и КСП. Коэффициент корреляции достигает значения в 0,95-0,99 для изображений с различной степенью детализации, при этом его среднее значение составляет 0,98.

3. Зависимости по оценке параметров ряда алгоритмов обработки и распознавания изображений от предложенного неэталонного критерия.

Апробация работы. Результаты работы докладывались и обсуждались

на следующих научно-технических конференциях:

- 12-15-я международная конференция «Цифровая обработка сигналов и ее применение» DSPA (Москва, 2010-2013);

- 65-66-я научная сессия, посвященная Дню Радио (Москва, 2010-2011);

- 18-я международная научно-техническая конференция «Радиоэлектроника, электротехника и энергетика» (