автореферат диссертации по радиотехнике и связи, 05.12.04, диссертация на тему:Разработка и исследование метода объективной оценки качества кодеков с компрессией цифровых аудиоданных
Автореферат диссертации по теме "Разработка и исследование метода объективной оценки качества кодеков с компрессией цифровых аудиоданных"
На правах рукописи
ИВАНОВ Андрей Сергеевич
РАЗРАБОТ1СА И ИССЛЕДОВАНИЕ МЕТОДА ОБЪЕКТИВНОЙ ОЦЕНКИ КАЧЕСТВА КОДЕКОВ С КОМПРЕССИЕЙ ЦИФРОВЫХ АУДИОДАННЫХ
Специальность 05 12 04 - Радиотехника, в том числе системы и устройства телевидения
Автореферат диссертации на соискание ученой степени кандидата технических наук
Санкг-Петероург 2007
003070533
Работа выполнена в Санкт-Петербургском государственном университете телекоммуникаций им проф М А Бонч-Бруевича на кафедре Радиоприема, вещания и
электромагнитной совместимости
Научный руководитель здн РФ, д т н , проф
Ковалгин Юрий Алексеевич
Официальные оппоненты д т н, проф
Алдошина Ирина Аркадьевна
к т н , доц
Харитонов Владимир Борисович
Ведущая организация ФГУП «ЛОНИИС»
Защита диссертации состоится «¿"С/» Ь&ОьС' 2007 г в < /К часов на заседании диссертационного совета Д 219 004 01 при Санкт-Петербургском государственном университете телекоммуникаций им проф М А Бонч-Бруевича по адресу 191186, Санкт-Петербург, наб реки Мойки, д 61
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского государственного университета телекоммуникаций им проф М А Бонч-Бруевича
Отзыв на автореферат в двух экземплярах, заверенных печатью учреждения, просим направлять по адресу 191186, Санкт-Петербург, наб реки Мойки, д 61, на имя ученого секретаря диссертационного совета
Автореферат разослан
«с^З »
Ученый секретарь диссертационного
совета Д 219 004 01
доктор технических наук, профессор
В.Ю. Волков
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Передача аудиосигналов играет все более возрастающую роль как в общественной и социальной жизни людей, так и в экономике В настоящее время для передачи, записи и хранения аудиосигналов широко используется огромное количество различных алгоритмов и соответствующих им устройств Все эти устройства, начиная от микрофонов и громкоговорителей и заканчивая сложнейшими системами кодирования аудиосигналов, в той или иной степени, вносят искажения в аудиосигнал Естественно, что при выборе конкретного устройства для решения определенной задачи необходимым становится проведение сравнения предлагаемого оборудования Оно производится по целому ряду характеристик, не последнее место среди которых занимает оценка качества оборудования
Если при работе с аналоговыми устройствами проблема оценки качества традиционно решалась путем измерения ряда таких характеристик, как отношение сигнал-шум, коэффициент гармоник и т п, то при переходе к цифровой технике ситуация значительно усложнилась В первую очередь это связано с тем, что при реализации таких устройств широкое применение стали находить алгоритмы компрессии цифровых аудиоданных, например MPEG-1 ISO/1EC 11172-3 Layer I, II, III; MPEG-2 ISO/IEC 13818-3, MPEG-2 ISO/IEC 13818-7 AAC, MPEG-4 ISO/IEC FCD 14496-3, Dolby AC-3 Данные алгоритмы ориентированы не на уменьшение количества обусловленных кодированием искажений, а на то, чтобы сделать эти искажения менее заметными для слушателя Это достигается за счет учета психоакустических свойств слуховой системы человека, наиболее важными из которых являются эффекты маскировки. Единственно приемлемым в данном случае способом оценки качества такого цифрового оборудования является субъективно-статистическая экспертиза Она строится, как правило, на основе парного прослушивания сигналов экспертами Данная процедура подразумевает наличие специального помещения для прослушивания аудиосигналов, достаточно большой группы квалифицированных экспертов и значительного времени, необходимого как для непосредственного проведения прослушиваний, так и для последующей статистической обработки их результатов Все это делает субъективно-статистическую экспертизу сложной, трудоемкой, дорогостоящей и, как следствие, непригодной для оперативного контроля качества Надо отметить, что и традиционные методы оценки качества, основанные на измерениях отдельных характеристик аудиоаппаратуры, не всегда позволяют организовывать контроль качества без выведения таковой из эксплуатации
Такое состояние дел в области оценки качества цифрового канапообразующего оборудования привело к тому, что в настоящее время все более актуальной становится задача разработки универсального, удобного, информативного и достоверного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных, используемых в трактах распределения программ радиовещания и звукового сопровождения телевидения Этот метод должен делать возможным организацию оперативного контроля качества, а получаемые с его помощью оценки должны с необходимой точностью совпадать с результатами субъективно-статистической экспертизы
Таким образом, актуальность диссертационной работы обусловлена необходимостью разработки удобного в использовании метода объективной оценки качества кодеков с компрессией цифровых аудиоданных, позволяющего не только осуществлять оперативный контроль качества такого оборудования, но также отслеживать и достоверно оценивать заметность вносимых им искажений
Изучению психоакустических свойств слуха и разработке алгоритмов компрессии цифровых аудиосигналов посвящены работы ученых- Scott N. Levine, Е F Schröder, W. Voessing, J Johnston, K. Brandenburg, E Zwicker, M Schröder, N. Jayant, А С Грудинина, Ю А Ковалгина, В А Леонова, С Г. Рихтера, А М Синильникова и других Оценка качества звучания рассмотрена в работах Н Fletcher, W В Snow, D К Gannet, J Кегпу, Gilbert А Soulodre, Theorder Grusec, Michel Lavoie, Louis Thibault, J Johnston, И А Ал-дошиной, Г Б Аскинази, Н И Веселовой, А С Галембо, И Е Горона, В Д Грибова, В П Гученко, Ж Я Дубовик, Ю А Ковалгина, Т П Мещанской, C.JI Мишенкова, А А. Понукалина, В В Ремизова, М JI. Сурова, В К Уварова, А А. Фадеева, Е А Хрянина.
Целью диссертационной работы является разработка метода объективной оценки качества кодеков с компрессией цифровых аудиоданных и создание на его основе программного обеспечения, позволяющего организовывать оперативный контроль качества
Для достижения поставленной цели необходимо
1 Провести анализ современных методов кодирования звуковых сигналов, стандартов и рекомендаций ITXJ, посвященных данной проблеме, оценить эффективность моделирования свойств слуховой системы человека, учитываемых при кодировании аудиосигналов, классифицировать и описать искажения, возникающие при компрессии цифровых аудиоданных, проанализировать современные способы объективной оценки качества и выделить наиболее перспективные, сформулировать научные и прикладные требования, предъявляемые к современным методам объективной оценки качества кодеков с компрессией цифровых аудиоданных,
2 Разработать алгоритм объективной оценки качества кодеков с компрессией цифровых аудиоданных сформулировать концепцию и выбрать механизмы оценки влияния величин и видов возникающих при этом искажений на обобщенную слуховую оценку качества кодированного аудиосигнала,
3 Сформулировать научно-исследовательские и практические требования к создаваемой программе оценки качества кодеков с компрессией цифровых аудиоданных На их основе разработать концепцию, структуру и интерфейс программы, выбрать язык программирования,
4 Написать и отладить программу оценки качества,
5 Выбрать способ проверки достоверности результатов, получаемых с помощью разработанной программы оценки качества Сформировать набор тестовых сигналов для проведения испытаний,
6 Провести испытания Обработать результаты, и сделать заключение о степени достоверности полученных объективных оценок качества и правильности выбора тех или иных научно-исследовательских и прикладных решений
Методы проведения исследований Для решения поставленных задач использовались методы цифровой обработки звуковых сигналов, программирование на языках С и С++, программное обеспечение «Mathcad», математическая статистика, математический анализ и субъективно-статистические экспертизы
Научная новизна и новые полученные результаты
1 Показано, что имеющееся метрологическое оборудование не всегда позволяет осуществлять оперативный и достоверный контроль качества оборудования, используемого для передачи, записи и воспроизведения цифровых аудиосигналов Наиболее остро данная проблема стоит в области объективной оценки качества кодеков с компрессией цифровых аудиоданных Обоснована целесообразность ее решения с помощью перцепционных методов1, построенных на основе моделирования свойств слуховой системы и процессов восприятия искажений человеком,
2 Рассмотрены различные способы построения перцепционных методов объективной оценки качества кодеков с компрессией цифровых аудиоданных Осуществлен обоснованный выбор методов оценки величины отдельных видов искажений, обусловленных компрессией цифровых аудиоданных В результате доработки и уточнения, лежащих в их основе процедур, разработана модель психоакустического анализа для многомерной оценки качества звучания и выбрана искусственная нейронная сеть для последующего перехода к обобщенной его оценке одним числом в соответствии с пятибалльной шкалой, рекомендуемой ГШ-Я при проведении субъективно-статистических экспертиз,
3 На основе выполненных в работе исследований закономерностей слухового восприятия разработан алгоритм перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных, объединивший в себе наиболее достоверные способы оценки, как отдельных типов искажений, так и их совокупного влияния на обобщенную оценку качества,
4 Разработана и реализована программа оценки качества кодеков с компрессией цифровых аудиоданных Структура программы, а также использованный при ее написании язык С, сделали возможным ее применение не только в научно-исследовательских, но и в сугубо прикладных целях, т е как законченный программный продукт,
5 Сформулирован способ проверки достоверности результатов, получаемых с помощью программы оценки качества Сформирован набор тестовых сигналов Проведены испытания, доказывающие правильность принятых научных и технических решений
Практическая значимость работы заключается в следующем
1 Разработан метод объективной оценки качества кодеков с компрессией цифровых аудиоданных, позволяющий осуществлять оперативный контроль качества данных кодеков и с достаточной для практики точностью (не превышающей доверительный интервал субъективно-статистической экспертизы) предсказывать результаты субъективно-статистической экспертизы,
2 На основе предложенного метода разработано и внедрено программное обеспечение, позволяющее организовывать автоматический контроль качества кодеков с компрессией цифровых аудиоданных,
Перцепционный — относящийся к восприятию Перцепция (от лат perception — понимание, познавание) — отражение непосредственно воздействующих на органы чувств предметов и явлений реального мира В данном случае имеется в виду восприятие человеком звуковых сигналов
3 Сформирован набор «критических» с точки зрения слухового восприятия звуковых сигналов, рекомендуемых для проверки качества кодеков с компрессией цифровых аудиоданных,
4 Проведены испытания, подтверждающие достоверность получаемых с помощью разработанной программы результатов оценки качества кодеков с компрессией цифровых аудиоданных
Внедрение результатов исследований Результаты исследований использовались в ФГУП «Ленинградский отраслевой научно-исследовательский институт связи» (ЛОНИИС) и в ОАО НПП «Дигитон» при испытаниях кодеков с компрессией цифровых аудиоданных, а также в учебном процессе СПбГУТ при подготовке инженеров по специальностям 210405 - «Радиосвязь, радиовещание и телевидение» и 210312 - «Аудиовизуальная техника», что подтверждено соответствующими актами внедрения.
Положения, выносимые на защиту:
1 В основу оценки качества кодеков с компрессией цифровых аудиоданных положен разработанный в диссертации алгоритм перцепционного метода объективной оценки качества Совместное использование в нем наиболее эффективных способов оценки величины, как отдельных видов искажений, так и их совокупности позволяет получать обобщенные оценки качества, совпадающие (в пределах доверительного интервала) с результатами субъективно-статистических экспертиз,
2 Психоакустическая модель, в которой учитывается передаточная функция слуха, собственные шумы слуховой системы и эффекты маскировки, а также рассчитываются величины отдельных видов искажения, возникающих при компрессии цифровых аудиоданных, и искусственная нейронная сеть, предназначенная для перехода от многомерного показателя качества к его обобщенной оценке одним числом, сделали возможным создание адекватного слуховому восприятию перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных,
3 Программа оценки качества кодеков с компрессией цифровых аудиоданных, созданная на основе разработанного метода, является пригодной как для проведения научных исследований, так и для решения конкретных практических задач, т е. представляет собой законченный программный продукт,
4 Результаты объективной оценки качества кодеков с компрессией цифровых аудиоданных, полученные с помощью разработанного программного продукта, лежат внутри доверительного интервала субъективно-статистических экспертиз, рассчитанного для значения вероятности 0,95 Данный результат свидетельствует об успешном решении поставленных в рамках диссертационной работы задач, а также и о перспективности перцепционных методов объективной оценки качества
Апробация результатов работы и публикации. Полученные в работе результаты докладывались и обсуждались на научно-технических конференциях профессорско-преподавательского состава СПбГУТ им проф M А Бонч-Бруевича в Санкт-Петербурге
По тематике диссертационной работы опубликовано 6 печатных работ, включая 4 публикации в виде тезисов докладов и 2 статьи в журнале «Труды учебных заведений связи»
Структура и объём диссертационной работы.
Работа содержит 206 страниц, 47 рисунков, 4 таблицы, 158 формул В списке литературы приведено 150 наименований Приложение размещено на компакт диске
СОДЕРЖАНИЕ РАБОТЫ
Работа состоит из введения, четырех глав, заключения, списка литературы и приложения
Во введении перечислены проблемы, связанные с объективной оценкой качества аудиоаппаратуры Приведены основные способы контроля качества, указаны их сильные и слабые места Выделена одна из наиболее актуальных на сегодняшний день проблем - объективная оценка качества кодеков с компрессией цифровых аудиоданных
Огромное разнообразие и широкое распространение алгоритмов компрессии аудиосигналов, трудности, связанные с оценкой качества данного вида аппаратуры, приводят к необходимости проведения дополнительных исследований с целью разработки нового метрологического оборудования, позволяющего организовывать дешёвую, достоверную, удобную и оперативную оценку качества кодеков с компрессией цифровых аудиоданных
Первая глава является вводной В ней определена общая область исследований -оценка качества аппаратуры, используемой для записи, передачи и воспроизведения аудиосигналов, сделан обзор соответствующих публикаций, изложены существующие методы объективной оценки качества данного вида оборудования, перечислены существующие проблемы и указаны возможные пути их разрешения, сформулированы цели и задачи научных исследований, проведенных в рамках диссертационной работы
Любая аудиоаппаратура вносит искажения в обрабатываемый ею сигнал Актуальным при этом становится вопрос о способе оценки заметности вносимых ею искажений, т е вопрос оценки качества, как самой аппаратуры, так и обрабатываемых в ней сигналов Применяемые для такой оценки методы традиционно разделяют на объективные, построенные на основе измерения некоторых характеристик аудиоаппаратуры, и субъективные, в основе которых лежат субъективно-статистические экспертизы
Типичным представителем объективных методов является ГОСТ 11515-91 "Каналы и тракты звукового вещания Основные параметры качества Методы измерений" В нем на основе тональных сигналов осуществляется количественная оценка ряда объективных характеристик каналов Полученные значения сравниваются с имеющимися нормами на отдельные виды искажений, в результате чего делается заключение о качестве аппаратуры Основными недостатками данного метода являются невозможность достоверной оценки совокупного влияния разнотипных искажений, одновременно присутствующих в сигнале, на общее ухудшение качества, полная непригодность для тестирования перцепционных кодеков, в которых используется компрессия цифровых аудиоданных на основе учета психоакустических свойств слуха Единственно достоверным способом оценки качества упомянутых кодеков является субъективно-статистическая экспертиза
Субъективно-статистическая экспертиза обычно строится на основе парного прослушивания экспертами эталонного и исследуемого сигналов (рис 1) Основными ее недостатками являются трудоемкость, дороговизна, сложность и совершенная непригодность для организации оперативного контроля качества
Широкое распространение кодеков с компрессией цифровых аудиоданных сделало актуальной проблему разработки для них принципиально новых перцепционных методов объективной оценки качества, позволяющих не только предсказывать результаты
субъективно-статистических экспертиз, но и осуществлять оперативный контроль качества При разработке данных методов в полной мере должны учитываться свойства слухового восприятия человека Это же определило цели и задачи диссертационной работы, сформулированные выше.
Рис 1 Общая схема оценки качества
Во второй главе рассматриваются вопросы, связанные с разработкой перцепционных методов объективной оценки качества кодеков с компрессией цифровых аудиоданных- свойства слуха, модели восприятия отдельных видов искажений и их совокупности, а также психоакустические модели, положенные в основу перцепционных методов, различные способы построения данных методов, существующие на сегодняшний день разработки в области перцепционной оценки качества.
Одним из наиболее перспективных направлений разрешения сформулированной выше проблемы оперативной оценки качества кодеков с компрессией цифровых аудиоданных является разработка перцепционных методов объективной оценки качества В основу данных методов положена идея моделирования различных физиологических и психофизических процессов, протекающих в слуховой системе человека при оценке им качества аудиосигналов Одной из обязательных составных частей любого перцепционного метода является психоакустическая модель Основополагающим отличием наиболее успешно зарекомендовавших себя психоакустических моделей, предложенных Б Муром и Э Цвикером (В Moore, Е Zwicker), является использование в них различных шкал оценки высоты тона и, соответственно, различных по форме, расположению и количеству слуховых фильтров До тех пор, пока не будут четко установлены причины различий используемых шкал высоты тона, и последние не будут учтены в общей психоакустической модели, обоснованный выбор лучшей из двух моделей является затруднительным Из анализа общепризнанных экспериментальных данных можно сделать заключение, что при задании параметров слуховых фильтров надо использовать шкалу критических полос слуха, но при этом ширина полос этих фильтров должна быть меньше 1 Барка, то есть охватывать лишь часть критической полосы слуха
Составной частью психоакустических моделей являются процедуры учета передаточной функции слуха, собственных шумов слуховой системы, маскировки и т п Используемые при их описании различные варианты аппроксимаций тех или иных экспериментально полученных зависимостей отличаются друг от друга точностью и сложностью вычислений. Выбор конкретного варианта аппроксимации необходимо осуществлять как компромисс между сложностью и точностью, с учетом имеющегося разброса экспериментальных данных
Необходимо отметить, что в ряде случаев используемые в перцепционных методах модели являются весьма далекими от тех процессов, которые в действительности протекают в слуховой системе человека Однако это значительное упрощение является вполне уместным и обоснованным Дело в том, что конечной целью перцепционного метода является предсказание результатов субъективно-статистической экспертизы, а
не точное моделирование слуховой системы В таких условиях соответствие используемых моделей психоакустическим экспериментам отходит на второй план Главное — чтобы упрощенные модели в совокупности позволяли бы достаточно точно предсказывать результаты субъективно-статистической экспертизы
Имеющиеся в области перцепционных измерений, на сегодняшний день, разработки (DIX - Disturbance Index, PEAQ - Perceptual Evaluation of Audio Quality (ITU-R Ree BS 1387-1) и т п ) зарекомендовали себя как достаточно точные механизмы оценки качества, способные оценивать заметность не только отдельных (типичных) искажений, но и совокупности разнотипных искажений, одновременно присутствующих в сигнале
Метод DIX построен на основе подробной слуховой модели, характеризующейся достаточной гибкостью и приемлемой вычислительной сложностью В ней используются развертывающие функции (level dependent spreading fonction), форма которых зависит от уровня субполосных сигналов и частоты. Они позволяют достаточно точно моделировать одновременную маскировку, ее зависимость от уровня и частоты сигнала В данном методе реализована также и модель временной маскировки Кроме этого, осуществляется учет ряда слуховых явлений за счет дополнительного анализа субполосных сигналов Основной вычисляемой в DIX выходной величиной является громкость частично маскированных аддитивных искажений При этом производится расчет ряда вспомогательных величин, позволяющих оценивать линейные искажения, а также изменения в модуляционной структуре аудиосигналов
Метод PEAQ задумывался и разрабатывался как метод, объединяющий в себе все известные на сегодняшний день достижения в области объективной оценки качества кодеков с компрессией цифровых аудиоданных Его разработчикам удалось на основе объединения различных вариантов перцепционных измерений (концепция порога маскировки и концепция сравнения «внутренних представлений») создать более эффективный и достоверный метод оценки качества В нем учтены все наиболее существенные особенности восприятия человеком аудиосигналов, такие как передаточная функция слуха, собственные шумы слуховой системы, эффекты одновременной и временной маскировки и т п Здесь реализована динамическая модель функционирования слухового аппарата человека, включающая в себя все этапы обработки звуковых колебаний как в наружном, среднем и внутреннем ухе, так и в нервной системе
Несмотря на хорошие результаты, достигнутые разработчиками DIX и PEAQ, все же остается ряд искажений, которые должным образом не регистрируются данными методами Среди причин их возникновения выделим следующие многократное применение в каналах передачи аудиокодеков с компрессией цифровых данных, введение избыточной модуляции, обусловленное частым изменением длины кодируемой выборки аудиосигнала (частым переключением оконных функций), наличие в широкополосных аудиосигналах фрагментов речи, искажения, возникающие на участках сигналов малой длительности Еще одной проблемой, касающейся уже реализации PEAQ, является неоднозначность изложения алгоритма, что затрудняет понимание существа дела, а зачастую, приводит и к неоднозначности при его реализации
Все это делает актуальным задачу проведения дополнительных научных исследований с целью уточнения и улучшения имеющихся, а также разработки новых перцепционных методов, позволяющих организовывать более достоверные, дешевые и оперативные испытания
В третьей главе описывается заключительный этап научных исследований, проведённых в рамках диссертационной работы, — разработка и реализация программы оценки качества кодеков с компрессией цифровых аудиоданных. Здесь формулируются требования к создаваемой программе оценки качества и рассматривается реализованный в ней алгоритм перцепционного метода оценки качества кодеков с компрессией цифровых аудиоданных.
На основе анализа достижений в области перцепционных измерений принято решение использовать при разработке перцепционного метода наиболее успешно зарекомендовавшие себя способы оценки качества (оценка порога маскировки, сравнение «внутренних представлений», спектральный анализ) (рис. 2). Выбраны, обоснованы и
Входные сигналы ;':ионный, исследуемый)
Обработка выборки сигнала
Выборка сигнала
Вычисление энергетического спектра
Спектральный анализ искажен и К
Опенка ширины полосы частот
Оценка гармонической составляющей искажений
Оценка порос а маскировки
Вычисление сигнала искажений
Отошение шум-маска (ЦМЮ
Сравнение внутренних представлении
УчСт передаточной функции слуха
Переход к масштабу критических полос слу*а
Учйт собственных шумов слуховой системы
Вычисление возбуждения (учет частотной и временной маскировки)
X
Громкость аддитивных шумов _
Оценка отличия
модуляции входных сигналов
Оценка вероятности обнаружения искажений
Усреднение по частоте
Усреднение по выборкам сигнала (вычисление многомерного показателя качества)
+ - —
Искусственная нейронная сеть -----------?--------
Объективная оценка качества
Рис. 2. Алгоритм программы оценки качества
уточнены процедуры оценки величины отдельных видов искажений, вызванных компрессией цифровых аудиоданных. Проведена частичная доработка данных методов, обусловленная их совместным использованием в рамках единой нсихоакустической модели. С помощью уточнённой психоакустической модели в разработанном методе осуществляется расчёт многомерного показателя качества, представляющего собой набор величин, численно характеризующих вероятность слуховой заметности искажений,
отношение шум-маска (NMR - Noise-to-Masked-Ratio), громкость частично маскированных искажений, отличие модуляции эталонного и исследуемого сигналов, их полосы частот и гармоническую составляющую сигнала искажений В качестве способа пересчета многомерного показателя качества лф] к обобщенной объективной оценке качества ODG была выбрана наиболее успешно зарекомендовавшая себя при решении подобных задач искусственная нейронная сеть, уже обученная по результатам субъективно-статистических экспертиз ODG = Ътт + (Ътах - Ътт )
' Г 1 -Wf Г 1 ( Г 1 £? г 1 *[']-* И ^
sig
У
j=o
(1)
=0 «max[']-amm[f]J,
В (1) I - количество входов, i - индекс входа, J - количество узлов в скрытом слое, j - индекс узла, amm\i\, атах[;] и [/,./]- входные масштабные и весовые коэффициенты, bmm, Ьтах и - выходные масштабные и весовые коэффициенты, ODG
- объективная оценка качества, которая может принимать значения от 0 до -4, где 0 соответствует незаметному искажению, а -4 соответствует искажению, оцененному как очень раздражающее (что соответствует пятибалльной шкале оценки качества рекомендации ITU-R BS 562) Активационной функцией в искусственной нейронной сети является гиперболический тангенс (сигмоидальная функция)
Цг (2)
1 + е *
В качестве математического аппарата для реализации кратковременного спектрального анализатора было выбрано быстрое преобразование Фурье (БПФ) Данное решение позволило создать программу оценки качества, позволяющую организовывать измерения в режиме реального времени При вычислении многомерного показателя качества применены различные стратегии усреднения, как по полосам частот, так и по времени Выбор конкретных параметров для тех или иных процедур обработки и сравнения сигналов делался на основе данных, полученных из психоакустических экспериментов
Вычисляемые средние значения полосы частот входных сигналов позволяют отследить и оценить искажения, вызванные ограничением полосы частот сигнала в тестируемом устройстве (см рис 1) Полоса частот входного сигнала оценивается как относительное значение ширины низкочастотной области его спектра, выраженное в количестве спектральных коэффициентов БПФ Нижняя граница данной области соответствует постоянной составляющей, а верхняя определяется при переборе индексов коэффициентов БПФ в сторону уменьшения частоты, как индекс первого коэффициента, значение которого превышает заданный порог
Величина тональных искажений, вносимых в исследуемый сигнал тестируемым устройством (см рис 1) и характеризующихся высокой степенью заметности на слух, оценивается посредством анализа гармонической составляющей сигнала искажений (Error Harmonic Structure (EHS)) Данная процедура подразумевает поиск максимального пика в спектре автокорреляционной функции, вычисленной для разности спектров эталонного и исследуемого сигналов
Оценка громкости частично маскированных аддитивных шумов осуществляется согласно общему алгоритму, предложенному Э Цвикером В соответствии с ним осуществляется переход от «воздействия», оказываемого на слуховой аппарат звуковым сигналом, к «возбуждению» - величине, характеризующей состояние органа слуха, обусловленное звуковым воздействием На данном этапе учитываются такие свойства слухового аппарата человека как передаточная функция слуха (3), собственные шумы слуховой системы (5) и эффекты маскировки (см рис 2)
Для оценки заметности аддитивных искажений используется широко применяемая и хорошо зарекомендовавшая себя величина отношение шум-маска При ее вычислении используется спектр искажений, представляющий собой разность амплитудных спектров эталонного и исследуемого сигналов, а также значение маски, получаемое в соответствии с методикой, сформулированной Э Цвикером, как произведение возбуждения и коэффициента маскировки
Выражение, используемое в качестве передаточной функции слуха (3), получено из психоакустических экспериментов, в ходе которых оценивался порог слышимости в покое Оно используется в качестве весовой функции для спектров входных сигналов В формуле (3) передаточная функция слуха A{f) имеет размерность дБ, а частота / кГц
А(/) = -06 3 64 • (/)~° 8 + 6 5 • е~° 6 -10"3 (/)4 (3)
Переход к масштабу критических полос слуха необходим для учёта собственных шумов слуховой системы и эффектов маскировки При этом осуществляется расчет энергии субполосных сигналов, т е энергии, приходящейся на полосы шириной 0,25 Барк (всего таких полос анализа 109) Параметры данных полос (граничные и центральные частоты) рассчитывались с помощью аппроксимации (4), полученной MP Шредером (М R Schroder) В (4) / - частота, Гц, 2 - высота тона, Барк
/ = 650-sh(jj (4)
Уровень собственных шумов слуховой системы (Е, дБ), обусловленных кровообращением и мышечными движениями тела человека и зависящих от частоты (/, кГц), рассчитывается по формуле (5) Данные шумы рассматриваются как аддитивные искажения и учитываются посредством добавления их к субполосным сигналам
£ = 0 4 3 64 (/)"°8 (5)
В качестве дополнительной оценки величины аддитивных искажений вычисляется отличие модуляции эталонного и исследуемого сигналов, рассчитываемое как относительная разница величин модуляции этих сигналов При этом под модуляцией здесь понимается относительное изменение уровня возбуждения от одной выборки сигнала к другой в каждой из упомянутых выше субполос
Процедура вычисления вероятности обнаружения искажений построена на основе сравнения разницы уровней возбуждения, вычисленых для исследуемого и эталонного сигналов, с порогом различимости слуха по амплитуде (JND- just noticeable differenc) Величина данного порога s рассчитывается по формуле (6), представляющей собой полиномиальную аппроксимацию результатов психоакустических экспериментов, проведенных Э Цвикером
и
Jife-wbt (¿J
L> 0 L< 0
c0 =-0 198719 с, =0 0550197 c3 =5 05622 10"6 c4 =9.01033 10 d2=6 39468 / = 1 71332 ¿ = 03- шах(ЁгеГ, Etest)+ 0 7 Etest
,-6
test
test
,-n
c2 =-0 00102438 d, = 5 95072
(7)
В формулах (6) и (7) ж - порог различимости слуха по амплитуде, дБ, Ь-уровень возбуждения, используемый при расчёте б, ЕгеГ и Е,ся - уровни возбуждения, соответственно для эталонного и исследуемого сигналов, дБ, с0, ^, с2, с3, с4, , и у - коэффициенты, полученные в результате полиномиальной аппроксимации экспериментальных данных
Широкая область возможного применения созданной программы оценки качества, многообразие и противоречивость требований, предъявляемых к ней пользователями, не позволяют однозначно сформулировать ее технические характеристики В таких условиях единственно верным решением является рассмотрение всех возможных вариантов реализации программы оценки качества, выявление сходств и различий, с последующим их учетом при реализации Конечно, такой подход не позволяет разрешить всех противоречий, но позволяет создать программу, которая, при необходимости, путем несложных дополнительных программных и аппаратных решений может быть адаптирована к конкретным требованиям пользователя Придерживаясь этого подхода, были сформулированы основные требования к разрабатываемой программе оценки качества
С целью расширения области применения данной программы было решено разработать ее в виде независимой библиотеки перцепционного метода объективной оценки качества с максимально упрощенным и универсальным пользовательским интерфейсом В качестве языка программирования был выбран С, ибо написанное на нем программное обеспечение является переносимым практически на любую платформу При выборе типа интерфейса для программы оценки качества было решено создать два отдельных варианта Первый —• «консольный» — вариант предназначен сугубо для целей отладки и тестирования созданной библиотеки Второй вариант интерфейса предназначен для операционной системы ^Утс1о\У5 и позволяет любому пользователю самостоятельно ознакомиться с программой и провести оценку качества исследуемого цифрового устройства (см рис 1), в нашем случае кодека В целом, при написании программы оценки качества было использовано процедурное программирование Данный стиль написания программы значительно упрощает ее отладку, а структура программы позволяет легко вносить изменения в отдельные процедуры, не изменяя программы в целом Еще одним положительным моментом использования процедурного программирования является возможность отслеживания промежуточных значений, получаемых на разных стадиях обработки сигналов (см рис 2) Это может оказаться полезным разработчикам подобного рода программного обеспечения
Реализация программы оценки качества в виде независимой библиотеки позволила сделать ее пригодной для различных вариантов применения Взаимодействие пользователя с библиотекой происходит с помощью четырех основных функций сге-а1е_тейюс10 осуществляет создание метода, теНюёО выполняет — на основе анализа очередной порции эталонного и исследуемого сигналов (см. рис 1), передаваемых в нее в качестве параметров — вычисление новых значений выходных величин перцепционного метода, с!е1е1е_тейю(10 освобождает ресурсы, задействованные при создании и работе метода, £е1_оЬу"есЦуе_с11£Гегепсе_|р-ас1еО производит окончательный расчет объективной оценки качества обработанного на текущий момент времени фрагмента аудиосигнала
Набор перечисленных выше функций, предоставляемых пользователю, делает библиотеку достаточно универсальной для широкой области применения Она позволяет организовывать параллельные измерения для нескольких пар эталонного и исследуемого (кодированного) сигналов (см рис 1) В библиотеке, являющейся основой разработанной программы оценки качества, реализован способ получения аудиосигналов (эталонного и исследуемого), позволяющий при необходимости, путем несложных программных решений, адаптировать программу для работы с различными источниками аудиосигналов (файлы, порты или комбинация различных источников сигналов) Размер буферов, используемых для передачи аудиосигналов от внешней программы в соответствующую функцию, может быть произвольным и меняться от одного вызова функции к другому. Все это позволяет оптимизировать конечную программу с учетом имеющихся ресурсов памяти После обработки очередной части входных сигналов становится возможным вычисление текущего значения многомерного показателя качества и соответственно обобщенной оценки качества (см рис. 2). Таким образом, возможно получение оценки качества не только для сигнала целиком, но и для отдельных его участков Это позволяет организовывать мониторинг оценки качества сигнала на всем его протяжении и находить (выделять) интервалы времени, где искажения, вызванные компрессией цифровых аудиоданных, максимально заметны
Итак, разработанный в рамках диссертационной работы перцепционный метод объединил в себе все имеющиеся на сегодняшний день достижения в этой области, что позволяет осуществлять всестороннюю оценку качества кодеков с компрессией цифровых аудиоданных Реализация данного метода в виде независимой библиотеки, написанной на языке С, расширяет область его применения и делает возможным использование программы оценки качества для проведения разносторонних научных исследований, например, при отладке и разработке кодеков с компрессией цифровых аудиоданных
В четвертой главе приводятся результаты испытаний разработанной программы оценки качества и делаются выводы о достоверности получаемых с ее помощью оценок
Достоверность оценок качества, получаемых с помощью созданной в рамках диссертационной работы программы оценки качества, может быть подтверждена только их совпадением с соответствующими результатами субъективно-статистических экспертиз Объективная оценка качества считается совпадающей с результатом субъективно-статистической экспертизы, если она лежит в пределах доверительного интервала оценки, полученной с помощью субъективно-статистической экспертизы Проведение субъективно-статистических экспертиз в рамках диссертационной работы представля-
ется весьма затруднительным, вследствие очень большой стоимости Поэтому было принято решение воспользоваться результатами субъективно-статистических экспертиз, полученными ранее для кодеков (MPEG-1 стандарта ISO/IEC 11172-3 Layer 2 и Layer 3) и опубликованными в авторитетных источниках Gilbert A Soulodre, Theorder Grusec, Michel Lavoie, and Louis Thibault «Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs» J Audio Eng Sos, Vol 46, No 3, 1998, March Данный выбор обусловлен тем, что упомянутые кодеки широко распространены на сети распределения программ и в них используется компрессия данных, учитывающая психоакустические свойства слуха человека Отметим, что возможность тестирования именно подобного рода аудиоаппаратуры является основным достоинством разработанной программы оценки качества
Для проведения испытаний сформирован набор критических аудиосигналов (всего около 100 сигналов), которые выбирались из числа звуковых отрывков, рекомендуемых группой MPEG для проведения субъективно-статистических экспертиз С помощью данных сигналов и программы оценки качества были проведены испытания следующих кодеков CDQPRima-230 фирмы CCS SN 020669 (реализация кодеков MPEG-1 Layer 2 и Layer 3 для скоростей цифрового потока 64, 96, 128, 192 и 384 кбит/с для стереопередачи, предоставлен ФГУП ЛОНИИС), программная модель кодека MPEG-1 Layer 2 (для скоростей цифрового потока 64, 128, 192, 256, 320 и 384 кбит/с для стереопередачи, предоставленная ФГУП ЛОНИИР) Полученные зависимости деградации качества кодеков от скорости цифрового потока представлены на рис 3 ивтабл 1.
-0 3 -0 5 -0,7 .-0 9 ¡-1 1 Î--13 i-15
U.I7
-i
S-19 5-21 X -23
-2 9 -3 1 -3 3
-Л
-> ï—t
/Ó-
г
-4
--4-
i
64 96 128 160 192 224 256 288 320 352 384 Скорость (кбит/с для стереопередачи) - О - ПОК MPEG L2 —□—ССЭ MPEG L2 -Л- ПОК MPEG L3 —О—ССЭ MPEG L3 Рис 3 Деградация качества кодеков семейства MPEG-1 Layer 2 и Layer 3
Таблица 1
Оценки качества кодеков
Кодек МРЕО-1 Layer 2 Layer 3
Скорость, кбит/с 64 96 128 192 224 256 320 384 64 96 128 192 224 384
Оценка, полученная с помощью ПОК, балл -2,74 -2,31 -2,28 -1,06 -0,70 -0,55 -0,44 -0,46 -3,16 -2,50 -1,80 -0,70 -0,58 -0,32
Оценка, полученная с помощью ССЭ, балл -2,14 -1,18 -1,73
Абсолютное отклонение оценок, балл 0,14 0,12 0,07
Расхождение оценок качества (абсолютная ошибка), полученных с помощью программы оценки качества (ПОК), с соответствующими оценками субъективно-статистических экспертиз (ССЭ) составляет 0,12 балла (для кодека MPEG-1 Layer 2, стерео, 192 кбит/с) и 0,07 балла (для кодека MPEG-1 Layer 3, стерео, 128 кбит/с) и лежит в пределах доверительного интервала субъективно-статистической экспертизы 0,12 балла Значение 0,14 балла, полученное для кодека MPEG-1 Layer 2, stereo, 128 кбит/с, выходит за пределы доверительного интервала результатов субъективно-статистической экспертизы на 0,02 балла (17 %) (см табл 1), что допустимо (не допустимым является расхождение оценок более чем на удвоенный доверительный интер-
вал) Среднее квадратичное отклонение сравниваемых оценок составило 0,11 балла, что также в полной мере соответствует доверительному интервалу оценок, полученных с помощью субъективно-статистических экспертиз (0,12 балла)
Приведенные данные (см рис 3 и табл 1) позволяют сделать заключение о достоверности результатов, получаемых с помощью разработанной в рамках диссертационной работы программы оценки качества и, соответственно, о правильности самого алгоритма, выбранного для объективной оценки качества кодеков с компрессией цифровых аудиоданных
В заключении перечисляются основные результаты исследований, проведенных в рамках диссертационной работы
1 Подобраны, проработаны и проанализированы публикации и нормативные документы, посвященные объективной оценке качества кодеков с компрессией цифровых аудиоданных Выявлены наиболее существенные проблемы, имеющие место при оперативном контроле качества каналов передачи аудиосигналов Подробно рассмотрены современные способы кодирования аудиосигналов, построенные на основе учета психоакустических свойств слуха
2 Из имеющихся в области оценки качества аудиооборудования проблем выделена одна из наиболее актуальных в настоящее время — проблема объективной оценки качества кодеков с компрессией цифровых аудиоданных Ее исследование и разрешение выбрано в качестве основного направления научных исследований данной работы Сформулированы цели диссертационной работы, выбраны средства для их достижения
3 Всесторонне рассмотрены различные варианты оценки качества кодеков с компрессией цифровых аудиоданных Сделан аргументированный выбор в пользу перцепционных методов объективной оценки качества, как единственных методов, которые позволяют оперативно оценивать величину разнотипных искажений и судить об их слуховой заметности в целом
4 Описаны, проанализированы, исследованы и подвергнуты сравнению различные перцепционные методы объективной оценки качества кодеков с компрессией цифровых аудиоданных В качестве основы для разрабатываемого перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных предложена и обоснована идея их уточнения, дополнения и совместного использования при разработке метода объективной оценки качества Данный подход позволяет улучшить достоверность получаемых объективных оценок качества за счет объединения всех имеющихся на сегодняшний день достижений в области перцепционной оценки качества
5 Рассмотрены психоакустические модели слуха, используемые не только в перцепционных методах оценки качества, но и в алгоритмах компрессии цифровых аудиосигналов Изложены наиболее успешно зарекомендовавшие себя механизмы количественной оценки как величины отдельных видов искажений, вызванных компрессией цифровых аудиоданных, так и их совместного влияния на формирование у слушателя обобщенной оценки качества
6 Предложен алгоритм перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных Он представляет собой симбиоз различных перцепционных методов, включающих оценку порога маскировки, сравнение «внутренних представлений» и спектральный анализ В нем реализованы кратковременный спектральный анализ эталонного и «искаженного» сигналов на основе быстро-
го преобразования Фурье, учет эффектов одновременной и временной маскировки, собственных шумов и передаточной функции слуховой системы человека Количественной оценке подвергаются изменение полосы частот, гармоническая составляющая сигнала искажений, отношение шум-маска, громкость частично маскированных аддитивных шумов, отличие модуляции эталонного и исследуемого сигналов и вероятность обнаружения искажений В разработанном перцепционном методе использованы различные стратегии усреднения величин отдельных видов искажений, обусловленных компрессией цифровых данных, и искусственная нейронная сеть, уже обученная по результатам субъективно-статистических экспертиз и наиболее подходящая для получения обобщенной оценки при решении данной задачи
7 Разработанный алгоритм реализован в виде программы оценки качества, включающей независимую библиотеку, написанную на языке С, реализующую основные операции, связанные с оценкой качества, и являющуюся переносимой практически на любую платформу, «консольное» приложение, созданное на основе упомянутой библиотеки, имеющее интерфейс в виде командной строки и позволяющее организовывать большие серии испытаний, программа оценки качества для операционной системы Windows, наглядно демонстрирующая процесс вычисления и работоспособность разработанной программы оценки качества
8 Для проверки созданной программы оценки качества были выбраны звуковые кодеки MPEG-1 стандарта ISO/IEC 11172-3 Layer 2 и Layer 3 с различными скоростями передачи цифровых данных Сформирован набор тестовых сигналов, содержащий около 100 различных звуковых элементов, а также спроектирована, собрана и настроена испытательная установка
9 С помощью испытательной установки проведена оценка качества реальных кодеков Полученные результаты подвергнуты статистической обработке и представлены в виде таблиц и графиков Сравнение полученных объективных оценок с соответствующими результатами субъективно-статистических экспертиз позволило судить о степени их достоверности Средняя квадратичная ошибка составила 0,11 балла, что не превышает доверительный интервал оценок, полученных с помощью субъективно-статистических экспертиз, который равен 0,12 балла Случаев явного расхождения оценок (на величину, превышающую удвоенный доверительный интервал) не зафиксировано
10 По результатам испытаний сделано заключение о достоверности оценок качества, получаемых с помощью разработанной программы оценки качества Это, в свою очередь, свидетельствует о правильном выборе, как общей концепции реализации перцепционных измерений, так и отдельных частей алгоритма, разработанного для объективной оценки качества кодеков с компрессией цифровых аудиоданных
В приложении приводится список материалов, прилагаемых к диссертации в электронном виде на компакт диске
1 Полный отчет о проведенных испытаниях аудиокодеков,
2 Рабочие материалы, используемые при проведении испытаний программное обеспечение, испытательные сигналы, результаты испытаний,
3 Текст исходного файла программы оценки качества, демонстрирующий последовательность вызова упоминаемых в тексте диссертации функций,
4 Электронная версия диссертации и автореферата
СПИСОК ПУБЛИКАЦИЙ
1 Иванов А С Метод объективной оценки качества аудиосигналов// Труды учебных заведений связи -СПб СПбГУТ, 2003 -№169 -С 82-89
2 Иванов А С Особенности реализации метода объективной оценки качества аудиосигналов//Труды учебных заведений связи -СПб СПбГУТ, 2005 -№172 -С 147155
3 Иванов А С Программное обеспечение для распознавания речи диктора // 54-я НТК материалы / СПб ГУТ - СПб, 2002 - С 65
4 Иванов А С Метод объективной оценки качества кодеков с компрессией цифровых аудиоданных // 55-я НТК материалы / СПб ГУТ - СПб, 2003 - С 49
5 Иванов А С Об аспектах моделирования свойств слуха при оценке качества кодеков с компрессией цифровых аудиоданных// 56-я НТК материалы / СПб ГУТ -СПб, 2004 - С. 53
6 Иванов А С Методы оценки качества устройств обработки аудиосигналов// 57-я Юбилейная НТК материалы / СПб ГУТ - СПб, 2005 - С 63
Отпечатано в ЗАО «Луга-Принт» Лен обл , г Луга, ул Луговая, д 5-а Подписано в печать 12 04 2007 Тираж 100 экз
Оглавление автор диссертации — кандидата технических наук Иванов, Андрей Сергеевич
Оглавление.
Введение.
Глава 1. Методы оценки качества аудиоаппаратуры.
1.1. Введение.
1.2. Публикации.
1.3. Классификация.
1.4. Методы объективной оценки качества.
1.5. Перцепционные методы объективной оценки качества.
1.6. Постановка задачи и цель диссертационной работы.
Глава 2. Исследование перцепционных методов оценки качества.
2.1. Введение.
2.2. Перцепционные методы оценки качества.
2.3. Психоакустические модели.
2.3.1. Модель Е. Zwicker.
2.3.2. Модель В. Moore.
Введение 2007 год, диссертация по радиотехнике и связи, Иванов, Андрей Сергеевич
3.2. Требования.144
3.3. Алгоритм.146
3.3.1. Кратковременный спектральный анализ.148
3.3.2. Анализ спектров входных сигналов.149
3.3.3. Учёт передаточной характеристики слуха.154
3.3.4. Сигнал искажений.155
3.3.5. Вычисление распределения энергии по полосам частот.155
3.3.6. Учет собственных шумов слуховой системы.156
3.3.7. Вычисление распределения возбуждения по высоте тона.157
3.3.8. Оценка отдельных характеристик искажений.157
3.3.9. Усреднение.160
3.3.10. Вычисление обобщённой оценки качества.162
3.4. Программная реализация.163
3.4.1. Библиотека метода объективной оценки качества.163
3.4.2. Консольное приложение.166
3.4.3. Приложение для операционной системы Windows.166
3.5. Выводы.172
Глава 4. Тестирование.177
4.1. Введение.177
4.2. Испытания.179
4.3. Результаты.183
4.4. Выводы.189
Заключение.191
Литература.196
Приложение.206
ВВЕДЕНИЕ
Передача аудиосигналов играет большую и всё более возрастающую роль как в общественной и социальной жизни людей, так и в экономике. Не мыслимым становится представить себе современный мир без таких уже привычных услуг сферы телекоммуникаций как радиовещание, телефония, телевидение и т.п. Использование современной компьютерной техники, разработка и внедрение новых и всё более эффективных способов записи информации, а также возможность передачи цифровых аудиосигналов по различным каналам связи сделали услуги данных областей телекоммуникации широко доступными для потребителей. Это, в свою очередь, привело к тому, что сильно возрос объём обрабатываемых, записываемых и передаваемых аудиосигналов.
В настоящее время для передачи, записи и хранения аудиосигналов разработано, разрабатывается и широко используется огромное количество различных алгоритмов и соответствующих им устройств. Аппаратура, применяемая для сжимания и расширения динамического диапазона, кодирования, компрессии и т.п. стала неотъемлемой составной частью современных каналов передачи аудиосигналов.
Все эти устройства, начиная от микрофонов и громкоговорителей и заканчивая сложнейшими системами кодирования аудиосигналов, в той или иной степени вносят искажения в аудиосигнал.
Естественно, что при выборе конкретного устройства для решения определенной задачи, необходимо произвести сравнение предлагаемого оборудования. Такое сравнение производится по целому ряду характеристик, не последнее место из которых занимает субъективная оценка величины вносимых в аудиосигнал искажений, т.е. результаты субъективно статистических экспертиз (ССЭ). Это обусловлено тем, что каковы бы ни были устройства обработки аудиосигналов, будь-то обычный телефон или же сложнейший многоканальный звукотехнический комплекс, монопольным потребителем предоставляемых ими услуг является человек, которого в первую очередь интересует качество аудиосигналов.
Если при работе с аналоговыми аудиосигналами проблема оценки качества традиционно решалась путем измерения ряда таких характеристик, как отношение сигнал-шум, коэффициент гармоник и т.п. [1], то при переходе к цифровой технике ситуация значительно усложнилась. В первую очередь это связано с тем, что очень широкое применение при передаче и хранении аудиосигналов стали находить современные алгоритмы компрессии цифровых аудиоданных: MPEG-1 ISO/IEC 11172-3 Layer I, II, III; MPEG-2 ISO/IEC 13818-3, MPEG-2 ISO/IEC 13818-7 AAC, MPEG-4 ISO/IEC FCD 1449-3, Dolby AC-3. Данные алгоритмы ориентированы не на уменьшение количества обусловленных кодированием искажений, а на то, чтобы сделать эти искажения менее заметными для слушателя. Это достигается за счёт учёта психоакустических свойств слуховой системы человека, наиболее важными из которых являются эффекты маскировки [8]. Так как основным критерием оценки качества таких кодеков является степень заметности вносимых ими в сигнал искажений, то к ним уже не могут быть применены традиционные методы оценки качества, упоминавшиеся выше. Единственно приемлемым в данном случае способом оценки качества, как самих кодеков, так и передаваемых с их помощью аудиосигналов, является ССЭ [16]. Однако данная процедура подразумевает наличие специального помещения для прослушивания аудиосигналов, достаточно большой группы квалифицированных экспертов и значительного времени, необходимого как для проведения непосредственно прослушиваний, так и для статистической обработки результатов. Всё это делает метод субъективной оценки качества (МСОК) сложным, трудоёмким, дорогостоящим и, как следствие, непригодным для оперативного контроля качества. Надо отметить, что и традиционные методы оценки качества, упоминавшиеся выше, не всегда позволяют организовывать контроль качества аппаратуры без выведения её из эксплуатации.
Такое состояние дел в области оценки качества аудиоаппаратуры привело к тому, что в настоящее время всё более актуальной становится задача создания универсального, удобного, информативного и достоверного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных (МООК). Этот метод должен позволять организовывать оперативный контроль качества, а его результаты должны с необходимой точностью совпадать с результатами, полученными с помощью ССЭ.
Таким образом, актуальность диссертационной работы обусловлена необходимостью разработки удобного в использовании метода объективной оценки качества кодеков с компрессией цифровых аудиоданных, позволяющего не только осуществлять оперативный контроль качества такого оборудования, но также отслеживать и достоверно оценивать заметность вносимых им искажений.
Изучению психоакустических свойств слуха и разработке алгоритмов компрессии цифровых аудиосигналов посвящены работы учёных: Scott N. Le-vine, E.F. Schröder, W. Voessing, J. Johnston, K. Brandenburg, E. Zwicker, M. Schröder, N. Jayant, A.C. Грудинина, Ю.А. Ковалгина, B.A. Леонова, С.Г. Рихтера, A.M. Синильникова и других. Оценка качества звучания рассмотрена в работах Н. Fletcher, W.B.Snow, D.K. Gannet, J. Kerny, Gilbert A. Soulodre, Theorder Grusec, Michel Lavoie, Louis Thibault, J. Johnston, И.А. Алдошиной, Г.Б. Аскина-зи, Н.И. Веселовой, A.C. Галембо, И.Е. Горона, В.Д. Грибова, В.П. Гученко, Ж.Я. Дубовик, Ю.А. Ковалгина, Т.П. Мещанской, C.JI. Мишенкова, A.A. Пону-калина, В.В. Ремизова, M.JI. Сурова, В.К. Уварова, A.A. Фадеева, Е.А Хрянина.
Целью диссертационной работы является разработка метода объективной оценки качества кодеков с компрессией цифровых аудиоданных и создание на его основе программного обеспечения, позволяющего организовывать оперативный контроль качества.
Для достижения поставленной цели необходимо: 1. Провести анализ современных методов кодирования звуковых сигналов, стандартов и рекомендаций ITU, посвященных данной проблеме; оценить эффективность моделирования свойств слуховой системы человека, учитываемых при кодировании аудиосигналов; классифицировать и описать искажения, возникающие при компрессии цифровых аудиоданных; проанализировать современные способы объективной оценки качества и выделить наиболее перспективные; сформулировать научные и прикладные требования, предъявляемые к современным методам объективной оценки качества кодеков с компрессией цифровых аудиоданных;
2. Разработать алгоритм объективной оценки качества кодеков с компрессией цифровых аудиоданных: сформулировать концепцию и выбрать механизмы оценки влияния величин и видов возникающих при этом искажений на обобщённую слуховую оценку качества кодированного аудиосигнала;
3. Сформулировать научно-исследовательские и практические требования к создаваемой программе оценки качества кодеков с компрессией цифровых аудиоданных. На их основе разработать концепцию, структуру и интерфейс программы, выбрать язык программирования;
4. Написать и отладить программу оценки качества;
5. Выбрать способ проверки достоверности результатов, получаемых с помощью разработанной программы оценки качества. Сформировать набор тестовых сигналов для проведения испытаний;
6. Провести испытания. Обработать результаты, и сделать заключение о степени достоверности полученных объективных оценок качества и правильности выбора тех или иных научно-исследовательских и прикладных решений.
Методы проведения исследований. Для решения поставленных задач использовались методы цифровой обработки звуковых сигналов, программирование на языках С и С++, программное обеспечение «МаШсас!», математическая статистика, математический анализ и субъективно-статистические экспертизы.
Научная новизна и новые полученные результаты:
1. Показано, что имеющееся метрологическое оборудование не всегда позволяет осуществлять оперативный и достоверный контроль качества оборудования, используемого для передачи, записи и воспроизведения цифровых аудиосигналов. Наиболее остро данная проблема стоит в области объективной оценки качества кодеков с компрессией цифровых аудиоданных. Обоснована целесообразность её решения с помощью перцепционных методов1, построенных на основе моделирования свойств слуховой системы и процессов восприятия искажений человеком;
2. Рассмотрены различные способы построения перцепционных методов объективной оценки качества кодеков с компрессией цифровых аудиоданных. Осуществлен обоснованный выбор методов оценки величины отдельных видов искажений, обусловленных компрессией цифровых аудиоданных. В результате доработки и уточнения, лежащих в их основе процедур, разработана модель психоакустического анализа для многомерной оценки качества звучания и выбрана искусственная нейронная сеть для последующего перехода к обобщённой его оценке одним числом в соответствии с пятибалльной шкалой, рекомендуемой 1Ти-Я при проведении субъективно-статистических экспертиз;
3. На основе выполненных в работе исследований закономерностей слухового восприятия разработан алгоритм перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных, объединивший в себе наиболее достоверные способы оценки, как отдельных типов искажений, так и их совокупного влияния на обобщённую оценку качества;
4. Разработана и реализована программа оценки качества кодеков с компрессией цифровых аудиоданных. Структура программы, а также использованный при её написании язык С, сделали возможным её применение не только в научно-исследовательских, но и в сугубо прикладных целях, т.е. как законченный программный продукт;
5. Сформулирован способ проверки достоверности результатов, получаемых с помощью программы оценки качества. Сформирован набор тестовых
Перцепционный — относящийся к восприятию. Перцепция (от лат. perception — понимание, познавание) — отражение непосредственно воздействующих на органы чувств предметов и явлений реального мира. В данном случае имеется в виду восприятие человеком звуковых сигналов. сигналов. Проведены испытания, доказывающие правильность принятых научных и технических решений.
Практическая значимость работы заключается в следующем:
1. Разработан метод объективной оценки качества кодеков с компрессией цифровых аудиоданных, позволяющий осуществлять оперативный контроль качества кодеков с компрессией цифровых аудиоданных и с достаточной для практики точностью (не превышающей доверительный интервал субъективно-статистической экспертизы) предсказывать результаты субъективно-статистической экспертизы;
2. На основе предложенного метода разработано и внедрено программное обеспечение, позволяющее организовывать автоматический контроль качества кодеков с компрессией цифровых аудиоданных;
3. Сформирован набор «критических» с точки зрения слухового восприятия звуковых сигналов, рекомендуемых для проверки качества кодеков с компрессией цифровых аудиоданных;
4. Проведены испытания, подтверждающие достоверность получаемых с помощью разработанной программы результатов оценки качества кодеков с компрессией цифровых аудиоданных.
Внедрение результатов исследований. Результаты исследований использовались в ФГУП «Ленинградский отраслевой научно-исследовательский институт связи» (ЛОНИИС) и в ОАО НИИ «Дигитон» при испытаниях кодеков с компрессией цифровых аудиоданных, а также в учебном процессе СПбГУТ при подготовке инженеров по специальностям 210405 - «Радиосвязь, радиовещание и телевидение» и 210312 - «Аудиовизуальная техника», что подтверждено соответствующими актами внедрения.
Положения, выносимые на защиту:
1. В основу оценки качества кодеков с компрессией цифровых аудиоданных положен разработанный в диссертации алгоритм перцепционного метода объективной оценки качества. Совместное использование в нём наиболее эффективных способов оценки величины, как отдельных видов искажений, так и их совокупности позволяет получать обобщённые оценки качества, совпадающие (в пределах доверительного интервала) с результатами субъективно-статистических экспертиз;
2. Психоакустическая модель, в которой учитывается передаточная функция слуха, собственные шумы слуховой системы и эффекты маскировки, а также рассчитываются величины отдельных видов искажения, возникающих при компрессии цифровых аудиоданных, и искусственная нейронная сеть, предназначенная для перехода от многомерного показателя качества к его обобщённой оценке одним числом, сделали возможным создание адекватного слуховому восприятию перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных;
3. Программа оценки качества кодеков с компрессией цифровых аудиоданных, созданная на основе разработанного метода, является пригодной как для проведения научных исследований, так и для решения конкретных практических задач, т.е. представляет собой законченный программный продукт;
4. Результаты объективной оценки качества кодеков с компрессией цифровых аудиоданных, полученные с помощью разработанного программного продукта, лежат внутри доверительного интервала субъективно-статистических экспертиз, рассчитанного для значения вероятности 0,95. Данный результат свидетельствует об успешном решении поставленных в рамках диссертационной работы задач, а также и о перспективности перцепционных методов объективной оценки качества.
Апробация результатов работы и публикации. Полученные в работе результаты докладывались и обсуждались на научно-технических конференциях профессорско-преподавательского состава СПбГУТ им. проф. М.А. Бонч-Бруевича в Санкт-Петербурге.
По тематике диссертационной работы опубликовано 6 печатных работ, включая 4 публикаций в виде тезисов докладов и 2 статьи в журнале «Труды учебных заведений связи».
Структура и объем диссертационной работы. Работа состоит из введения, четырех глав, заключения, списка принятых сокращений, списка литературы и приложения. Первая глава является вводной. В ней определена область исследований - оценка качества кодеков с компрессией цифровых аудиоданных; сделан обзор соответствующих публикаций; приведена разносторонняя классификация методов оценки качества; перечислены существующие проблемы и указаны возможные пути их разрешения; сформулированы цель и задачи научных исследований, проводимых в рамках данной диссертационной работы. Во второй главе осуществляется изложение идеи построения метода оценки качества на основе моделирования работы слуховой системы человека (перцепционные методы объективной оценки качества). Описываются различные способы построения перцепционных методов. Приводится хронология развития данных методов. Рассматриваются и анализируются различные свойства слуха, модели восприятия искажений и психоакустические модели. Перечисляются достоинства и недостатки существующих перцепционных методов объективной оценки качества. Третья глава посвящена разработке и программной реализации перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных Здесь формулируются требования к создаваемой программе оценки качества и рассматривается реализованный в ней алгоритм перцепционного метода оценки качества кодеков с компрессией цифровых аудиоданных. В четвертой главе приводятся результаты испытаний разработанной программы оценки качества и делаются выводы о достоверности получаемых с её помощью оценок.
Заключение диссертация на тему "Разработка и исследование метода объективной оценки качества кодеков с компрессией цифровых аудиоданных"
4.4. Выводы
1. О достоверности ООК, получаемых с помощью разработанной ПОК, можно судить только на основе сравнения их с соответствующими результатами ССЭ. Поскольку проведение ССЭ является крайне трудоёмким, а главное очень дорогостоящим мероприятием, было принято решение воспользоваться уже имеющимися данными, полученными и опубликованными другими исследователями при оценке качества кодеков MPEG-1 стандарта ISO/IEC 11172-3 Layer 2 и Layer 3 [150].
2. Для проведения измерений сформирован набор испытательных сигналов (около 100 «критических» звуковых сигналов), отобранных из числа отрывков звучаний, рекомендуемых группой MPEG для оценки качества кодеков с компрессией цифровых аудиоданных. Данные сигналы были подвергнуты процедуре кодирования и декодирования с помощью двух реализаций кодека MPEG-1 Layer 2 и одной реализации кодека MPEG-1 Layer 3: программная модель MPEG-1 Layer 2 (скорости цифрового потока 64, 128, 192, 256, 320 и 384 кбит/с для работы в режиме «стерео»), предоставленная ЛОНИИР; кодек CDQPRima-230 фирмы CCS (реализация кодеков MPEG-1 Layer 2 и Layer 3, скорости цифрового потока 64, 96, 128, 192 и 384 кбит/с для режима работы «стерео»), предоставленный ЛОНИИС. В результате были получены 16 наборов (для 16 различных реализаций кодеков) исследуемых сигналов, общее количество которых составило около 900.
3. С помощью дополнительно созданного в рамках данной работы программного обеспечения была осуществлена синхронизация соответствующих эталонных и исследуемых сигналов. А посредством разработанной ПОК проведено испытание указанных выше кодеков для различных скоростей цифрового потока. На основе полученных объективных оценок для отдельных сигналов были вычислены их средние значения, которые представляют собой объективные оценки качества соответствующих кодеков.
4. Из экспериментальных данных (табл.4.4 и рис.4.3) следует, что полученные с помощью ПОК ООК в должной мере совпадают с СОК, а их отклонения (средняя квадратичная ошибка 0,11 балла) не выходят за пределы доверительного интервала СОК (0,12). Это позволяет сделать заключение о достоверности результатов, получаемых с помощью разработанной в рамках диссертационной работы ПОК и соответственно о правильности выбранного алгоритма ПОК для решения задачи объективной оценки качества кодеков с компрессией цифровых аудиоданных.
ЗАКЛЮЧЕНИЕ
1. Подобраны, проработаны и проанализированы публикации и нормативные документы, посвященные проблеме оценки качества профессионального звукового оборудования. Изучены современные субъективные и объективные способы контроля качества передачи, записи и воспроизведения звуковых сигналов, а также наиболее распространенные варианты их реализаций. Выявлены наиболее существенные проблемы, имеющие место при организации оперативного контроля качества каналов передачи звуковых сигналов. Подробно рассмотрены современные способы кодирования звуковых сигналов. Особое внимание уделено получившим в настоящее время широкое распространение алгоритмам компрессии звуковых сигналов, построенным на основе учета психоакустических свойств слуха.
2. Из имеющихся в области оценки качества звукового оборудования проблем, выделена наиболее актуальная в настоящее время - проблема объективной оценки качества кодеков с компрессией цифровых аудиоданных. Её изучение и разрешение выбраны в качестве основного направления научных исследований, проводимых в рамках написания данной работы. Сформулированы цели диссертационной работы и выбраны средства для их достижения. Основной целью работы является изучение методов объективной оценки качества звукового оборудования с компрессией цифровых данных, разработка перцепционного метода его объективной оценки и реализация последнего в виде компьютерной программы. Заключительным этапом научных исследований является испытание созданной программы оценки качества на соответствие получаемых с её помощь объективных оценок результатам субъективно-статистических экспертиз.
3. Всесторонне рассмотрены различные варианты организации объективных измерений при оценке качества звукового оборудования. Сделан аргументированный выбор в пользу перцепционных методов объективной оценки качества, как единственных методов, которые позволяют оперативно оценивать величину разнотипных искажений и судить об их слуховой заметности в целом. В основу перцепционных методов положена идея предсказания результатов субъективно-статистических экспертиз, реализуемая посредством разностороннего учета психоакустических свойств слуха человека.
4. Выявлены и сформулированы сильные и слабые места существующих перцепционных методов оценки качества, указаны наиболее перспективные направления их усовершенствования. Описаны, изучены, проанализированы и подвергнуты сравнению различные концепции построения перцепционных методов объективной оценки качества звукового оборудования. В качестве основы для разрабатываемого перцепционного метода объективной оценки качества была предложена и обоснована идея совместного использования существующих способов построения перцепционных методов. Данный подход позволяет улучшить достоверность получаемых объективных оценок качества за счёт объединения всех имеющихся на сегодняшний день достижений в области перцепционной оценки качества.
5. Рассмотрены психоакустические модели слуха, используемые не только в перцепционных методах оценки качества, но и в различных алгоритмах компрессии цифровых аудиоданных. Описаны наиболее успешно зарекомендовавшие себя механизмы количественной оценки величины различных искажений. Подробно освещена проблема отображения отдельных показателей качества к обобщённой оценке заметности всей совокупности искажений. Перечислены различные варианты организации процедуры кратковременного спек-» трального анализа звуковых сигналов, моделирующего процесс частотно- ;, временной декомпозиции сигналов в слуховой системе человека.
6. На основе всестороннего изучения проблемы объективной оценки качества звукового оборудования предложен алгоритм перцепционного метода объективной оценки качества. Он представляет собой симбиоз различных способов построения перцепционных методов, включая оценку порога маскировки, сравнение «внутренних представлений» и спектральный анализ. В нем реализованы: механизм кратковременного спектрального анализа сигналов с помощью
БПФ, что позволяет проводить измерения в масштабе реального времени; учёт эффектов маскировки, собственных шумов и передаточной характеристики слуховой системы человека. Количественной оценке подвергаются: изменение полосы частот, гармоническая составляющая сигнала искажений, соотношение шум-маска, громкость частично маскированных аддитивных шумов, отличие модуляции и вероятность обнаружения искажений. Кроме этого в предложенном перцепционном методе объективной оценки качества используются различные стратегии усреднения и искусственная нейронная сеть, уже обученная по результатам субъективно-статистических экспертиз.
7. Предложенный алгоритм перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных реализован в виде программы оценки качества. На начальном этапе были определены возможные области и условия использования данной программы. На их основе сформулированы главные требования, предъявляемые пользователями к подобного рода программному обеспечению. Вся эта информация была учтена при выборе структуры программы, языка программирования и вида интерфейса.
8. Разработано программное обеспечение для оценки качества звуковых устройств. Оно включает в себя:
- независимую библиотеку, написанную на языке С, реализующую основные операции связанные с оценкой качества и являющуюся переносимой практически на любую платформу;
- «консольное» приложение, созданное на основе упомянутой библиотеки, имеющее интерфейс в виде командной строки и позволяющее организовывать большие серии испытаний;
- программа оценки качества для Windows, наглядно демонстрирующая процесс вычисления и работоспособность разработанной в рамках диссертационной работы программы оценки качества.
9. Рассмотрены различные варианты организации процедуры испытаний созданной в рамках диссертационной работы программы оценки качества. Сформулирован критерий достоверности объективных оценок, получаемых с / помощью созданной программы. Единственным доказательством достоверности получаемых объективных оценок качества является их совпадение (в пределах доверительного интервала) с соответствующими субъективными оценками.
10. Для проверки программы оценки качества были выбраны звуковые кодеки MPEG-1 стандарта ISO/IEC 11172-3 Layer 2 и Layer 3 с различными скоростями передачи цифровых данных. Данный выбор был обусловлен не только тем, что для указанных кодеков имеются результаты субъективно-статистических экспертиз, но и тем, что они являются типичными устройствами, в которых используется компрессия аудиоданных на основе учёта психоакустических свойств слуха человека. Возможность тестирования именно подобного рода звукового оборудования является основным преимуществом созданной программы оценки качества. Для проведения испытаний сформирован набор тестовых сигналов, содержащий около 100 различных звуковых элементов, а также спроектирована и собрана испытательная установка.
11. С помощью испытательной установки была проведена оценка качества реальных кодеков. Полученные результаты подвергнуты статистической обработке и отображены в виде таблиц и графиков. Сравнение объективных оценок с соответствующими результатами субъективно-статистических экспертиз позволило судить о степени их достоверности. Коэффициент корреляции между субъективными и объективными оценками качества составил около 0,92, а средняя квадратичная ошибка 0,11 балла, что не превышает доверительный интервал субъективных оценок качества, который равен 0,12 балла. Случаев явного расхождения объективных и субъективных оценок качества (на величину, превышающую удвоенный доверительный интервал) не зафиксировано.
12. По результатам испытаний (полученные объективные оценки качества в пределах доверительного интервала совпадают с соответствующими субъективными) можно сделать заключение о достоверности оценок качества, получаемых с помощью разработанной в рамках диссертационной работы программы оценки качества. Это, в свою очередь, свидетельствует о правильном выборе, как общей концепции организации перцепционных измерений, так и отдельных частей предложенного алгоритма перцепционного метода объективной оценки качества кодеков с компрессией цифровых аудиоданных.
Библиография Иванов, Андрей Сергеевич, диссертация по теме Радиотехника, в том числе системы и устройства телевидения
1. ГОСТ 11515-91. Каналы и тракты звукового вещания. Основные параметры качества. Методы измерения. М.: 1991.
2. Recommendation ITU-R BS. 1116 (Rev. 1), Methods for the Subjective Assessment of Small Impairments in Audio Systems including Multichannel Sound Systems, 1997.
3. Исследование заметности искажений в радиовещательных каналах. Под ред. И. Е. Горона. М.: Связьиздат, - 1959.
4. П.В. Ананьев. «Об эквивалентных по качеству акустических трактах с различной неравномерностью и шириной пропускаемой полосы частот». Радиотехника, т.4, №1, 1949.
5. Н. Fletcher. "Hearing the determing factor for high fidelity transmission". Proc. IRE, June 1942.
6. W.B.Snow. "Audible frequency ranges of music, speech and noise". JASA, July 1931.
7. D.K. Gannet, J. Kerny. The discernibility of changes in program band width. Bell Syst. Те hn. J, January 1944.
8. Цвикер Э., Фельдкеллер P. Ухо как приемник информации. М.:Связь, 1971.
9. BS. 1387-1. Method for objective measurements of perceived audio quality. Rec. ITU-R, (1998-2001).
10. ITU-T Recommendation P.800, Methods for subjective determination of transmission quality, 1996.
11. ITU-R Recommendation BS. 1116-1, Methods for the Subjective Assessment of small Impairments in Audio Systems including Multichannel Sound Systems, 1997.
12. ITU-T Recommendation P.861, Objective Quality measurement of telephone-band (300 3400 Hz) speech codecs, 1996.
13. ITU-T Recommendation P.862, PESQ an objective method for end-to-end speech quality assessment of narrowband telephone networks and speech codecs, February 2001.
14. Минц Б.С. Новый способ автоматического контроля радиовещательных трактов. — Вестник связи, 1958, №9, с.8-10.
15. Rantzen Н.В., Peachey F.A., Gunn-Russel М.А. The Broad Principles in the design of Automatic Monitors. — Electronic Engineering, v. XXIII, January, 1951, 275, p.19-26.
16. Recommendation ITU-R BS.562-3, Subjective assessment of sound quality, 1990.
17. M.R. Schroder, B.S. Atal, and J.L. Hall, Optimizing digital speech coders by exploiting masking properties of the human ear. Journal of the Acoustical Society of America, Vol. 66, pages 1647-1652, December 1979.
18. M. Karjalainen, A new auditory model for the evaluation of sound quality of audio system, Proceedings of the ICASSP, Tampa, Florida, pages 608-611, March 1985.
19. K. Brandenburg, Evaluation of quality for audio encoding at low bit rates, Contribution to the 82niAES Convention, London 1987, preprint 2433
20. B.C. Moore, An introduction to the psychology of hearing, Academic Press, London, 1989.
21. M.R. Schröder, B.S. Atal, and J.L. Hall, Optimizing digital speech coders by exploiting masking properties of the human ear, J. Acoust. Soc. Am., Vol. 66, pages 1647-1652, December 1979.
22. ISO 532, Acoustics Method for calculating loudness levels, 1975.
23. E. Zwicker and H. Fasti, Psychoacoustics, Facts and Models. Berlin; Heidelberg: Springer Verlag, 1990.
24. Голд Б., Рейдер Ч. Цифровая обработка сигналов. М.: Советское радио, 1973
25. Е. Terhardt, "Calculating Virtual Pitch", Hearing Research, vol. 1, pp. 155182,1979.
26. F. Baumgarte and A. Lerch, Implementation of Recommendation ITU-R BS. 1387, Delayed Contribution, Document 6Q/18-E, Feb. 2001.
27. Электроакустика и звуковое вещание: Учебное пособие для вузов/ И.А. Алдошина, Э.И. Вологдин, А.П. Ефимов, Г.П. и др.; Под ред. Ю.А. Ковалгина -М.: Горячая линия Телеком, Радио и связь, 2007. - 872 е.: ил.
28. G. A. Soulodre, Adaptive Methods for Removing Camera Noise from Film Soundtracks, Ph.D. Thesis, Dept. Electrical Eng., McGill University, Nov. 1998.
29. Recommendation ITU-R BS.1284-1 2003, General methods for the subjective assessment of sound quality.
30. Paillard В., Mabilleau P., Morissette S. PERCEVAL: Perceptual Evaluation of the Quality of Audio Signals. Journal of the Audio Engineering Society, Vol. 40 (1/2), January/February 1992, pp. 21-31.
31. Beerends J.G, Stemerdink J.A. A Perceptual Audio Quality Measure Based on a Psychoacoustic Sound Representation. J. Audio Eng. Soc , Vol 40, No. 12, 1992 December, p.963-973.
32. Colomes C., Lever M., Rault J.B., Deheiy Y.F. A perceptual model applied to audio bit-rate reduction. — J. Audio Eng. Soc., Vol. 43, pp. 233-240,1995.
33. Möller S., Berger J. Describing Telephone Speech Codec Quality Degradations by Means of Impairment Factors. — J. Audio Eng. Soc., Vol. 50, No. 9 , 2002
34. Herre J., Eberlein E., Schott H., Schmidmer Ch. "Analysis Tool for Realtime Measurements using Perceptual Criteria". — Proc. of the 11th International AES Conference on Audio Test and Measurement, Portland 1992, pp. 180-190.
35. Keyhl M, Schmidmer Ch., Herre J, Hilpert J. Maintaining Sound Quality -Experiences and Constraints of Perceptual Measurements in Today's and Future Networks". — 98th AES Convention, Paris, 1995, Preprint #3946.
36. Keyhl M., Schmidmer Ch., Wachter H. A Combined Measurement Tool for the Objective, Perceptual Based Evaluation of Compressed Speech and Audio Signals. — 106th AES Convention, Munich, 1999, Preprint #4931.
37. Sporer Th. Objective Audio Signal Evaluation Applied Psychoacoustics for Modeling the Perceived Quality of Digital Audio. — 103rd AES Convention, New York, 1997 Preprint #4512.
38. Thiede Th., Kabot E. A New Perceptual Quality Measure for Bit Rate Reduced Audio. — Contribution to the 100th Convention of the Audio Engineering Society, Copenhagen, May 1996, Preprint #4280.
39. T. Thiede, Perceptual Audio Quality Assessment Using a Non-Linear Filter Bank, Ph.D. Thesis, Fachbereich Electrotechnik, Technical University of Berlin, 1999.
40. Иоффе М.Г. Автоматический контроль трактов звукового вещания. — М.: Связь, 1980.
41. Руководство по настройке и паспортизации каналов вещания. М.: Связь, 1970.
42. Zwicker Е. Psychoakustik. Springer-Verlag, Berlin Heidelberg - New York, 1982.
43. Лихницкий А. Качество звучания. Ст. Петербург: - РДК, -1998, с.72.
44. ISO 6189-1983, "Pure Tone Air Conduction Threshold Audiometry for Hearing Conservation Purposes", International Organization for Standardization, Geneva, Switzerland (1983).
45. ISO 7029-1984, "Threshold of Hearing Air Conduction as a Function of Sex and Age for Otologically Normal Persons", International Organization for Standardization, Geneva, Switzerland (1984)
46. OCT 4.202.003-84 Методы экспертной оценки качества звучания. М.: Стандарты. 1984.
47. AES-20-96 "AES Recommended practice for professional audio-subjective evaluation of Loudspeaker". N.Y. 1996.
48. S. Bech," Selection and Training of Subjects for Listening Tests on Sound-Reproducing Equipment", J. Audio Eng. Soc., vol. 40 pp.590-610 (1992 July/Aug.).
49. Moore B.C .J., Glasberg B.R., Baer Т. A Model for the Prediction of Thresholds, Loudness, and Partial Loudness. J. Audio Eng. Soc , Vol 45, No. 4,1997 April, p.224-240.
50. Soulodre G.A., Grusec Т., Lavoie M., Thibault L. Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs. J. Audio Eng. Soc , Vol 46, No. 3, 1998 March, p. 164-177.
51. Sporer Th. Evaluating Small Impairments with the Mean Opinion Scale Reliable or Just a Guess? — 101st AES Convention 1996, Preprint 4396 (E-l).
52. Cabot R. C. "Audio Measurements," J. Audio Eng. Soc., vol. 35 pp.476-499 (1987 June).
53. Нюренберг В.А. Параметры вещательных сигналов в каналах передачи. -М.: ВЗЭИС, 1969.
54. Нюренберг В.А. Технический контроль в звуковом вещании. М.: Связь, 1963.
55. Шитов JI.B., Белкин Б.Г. Статистические характеристики сигналов, представляющих натуральные звучания, и их применение при исследовании электроакустических систем. — Труды НИКФИ, 1970. - вып. 56., - стр. 77173.
56. Альпер М. Устройство для контроля некоторых показателей передатчиков. Румынское радио и телевидение. — Радио и телевидение ОИРТ, 1969, №4, с.36-38.
57. А.с. 90158 (СССР). Способ измерения нелинейных искажений. Вольф В.М.
58. Вольф В.М. Динамический метод исследования нелинейных искажений. — Радиотехника, 1953, т.8, №2, с.27-37.
59. А.с. 149474 (СССР). Устройство для автоматического контроля работы радиовещательных установок. Аскинази Г.Б.
60. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи, под ред. О.И. Шелухина. — М.: Радио и связь, 2000. — 456 с.
61. Beerends J.G, Stemerdink J.A. A Perceptual Audio Quality Measure Based on a Psychoacoustic Sound Representation. J. Audio Eng. Soc , Vol 42, No.3, pp. 115-123,1994.
62. Beerends J. G., Rix A. W., Hollier M. P., Hekstra A. P. Perceptual Evaluation of Speech Quality (PESQ) The New ITU Standard for End-to-End Speech Quality Assessment, Part I Time-Delay Compensation. — J. Audio Eng. Soc., Vol. 50, No. 10, 2002.
63. Beerends J. G., Rix A. W., Hollier M. P., Hekstra A. P. Perceptual Evaluation of Speech Quality (PESQ) The New ITU Standard for End-to-End Speech Quality Assessment, Part II Psychoacoustic Model. — J. Audio Eng. Soc., Vol. 50, No. 10,2002.
64. Brandenburg K., Sporer Th.: 'NMR' and 'masking flag': Evaluation of Quality using Perceptual Criteria. — Proc. of the 11th International AES Conference on Audio Test and Measurement, Portland 1992, pp. 169-179.
65. Keyhl M., Herre J., Schmidmer Ch. NMR Measurements of Consumer Recording Devices Which Use Low Bit-Rate Audio Coding. — 94th AES Convention, Berlin 1993, Preprint #3616.
66. Keyhl M., Herre J., Schmidmer Ch. NMR Measurements on Multiple Generations Audio Coding. — 96th AES Convention, Amsterdam, 1994, Preprint #3803.
67. Beerends J. G. Measuring the Quality of Speech and Music Codecs, an Integrated Psychoacoustic Approach. — 98th AES Convention, Paris 1995, Preprint #3945.
68. Benjamin E. Evaluating Digital Audio Artifacts with PEAQ. — 113th AES Convention, Los Angeles 2002, Preprint #5711.
69. Keyhl M., Schmidmer Ch., Wächter H., Rath S., Stoll G., Colomes C„ Sporer T. Evaluating the Perceived Audio Quality (PEAQ) of Internet Audio Codecs. — 109th AES Convention, Los Angeles, 2000.
70. Treurniet W. C., Soulodre G. A. Evaluation of the ITU-R Objective Audio Quality Measurement Method. — J. Audio Eng. Soc., Vol. 48, Number 3, March 2000.
71. Кидд Дж. Слуховое распознавание сложных сигналов: влияние амплитудного разброса составляющих на распознаваемость формы спектра. Auditory processing of complex sounds. London.1987.16-25, пер. 66333.
72. Гилки Роберт X. Сравнение спектральной и временной информации при маскировании акустических сигналов. Auditory processing of complex sounds. London.1987, 26-35, пер. C-66334.
73. Ватсон Ч. Неопределенность: информационное маскирование и емкость оперативной слуховой памяти. Auditory processing of complex sounds. London. 1987. 267-277, пер. C-66355.
74. ISO/IEC/JTC1/SC29/WG11 Draft Document N1557, Evaluation Methods and procedures for MPEG-4 tests, 1997.
75. ITU-R Recommendation BS. 1534, Method for the subjective assessment of intermediate quality level of coding systems., June 2001.
76. ITU-T Contribution COM 12-74-E, Review of Validation Tests for Objective Speech Quality Measures, March 1996.
77. ITU-T Recommendation G. 107, The E-model, a computational model for use in transmission planning., May 2000.
78. ITU-T Recommendation E.420, Checking the Quality of the International Telephone Service General Considerations, 1988, (Extract from the Blue Book).
79. ITU-T Recommendation P.562, Analysis and interpretation of INMD voice-service measurements, May 2000.
80. ITU-T Recommendation P.810, Modulated Noise Reference Unit (MNRU), 1996.
81. ITU-T Recommendation P.830, Subjective Performance Assessment of Telephone-Band and Wideband Digital Codecs, 1996.
82. ITU-T Recommendation P.833, Methodology for Derivation of Equipment Impairment Factors from Subjective Listening-Only Tests, 2001.
83. ITU-T Recommendation P.834, Methodology for the Derivation of Equipment Impairment Factors from Instrumental Models, 2002.
84. Мишенков C.JI. Исследование и развитие систем звукового вещания и оповещения. Автореферат диссертации на соискание ученой степени доктора технических наук в форме научного доклада. М.: Информсвязьиздат, 1996.
85. Попов О.Б., Рихтер С.Г. О возможных подходах к измерению качества передачи в адаптивных вещательных каналах // Метрология и измерительная техника. 1998, №5, с. 24-27.
86. Петрова Г.А., Попов О.Б., Рихтер С.Г. Об интегральной оценке качества канала звукового вещания // НТК профессорско-преподавательского и научного состава. М., МТУСИ, 1999. Тезисы докладов, с. 226-228.
87. Донцова Г.А. Исследование и разработка методов анализа и обработки сигнала звукового вещания с использованием комплексного представления. -Автореф. диссерт. канд. техн. наук.- М.: МТУСИ, 2001. - 46 с.
88. Обнаружение и контроль экологически-негативных воздействий телерадиовещания. // Абрамов В.А., Литвин С.А., Попов О.Б., Рихтер С.Г., Хря-нин Е.А. Депонирована в ЦНТИ "Информсвязь" № 2200-св 01 от 22.05.01, с. 1935.
89. Хрянин Е.А. Статистический подход к оценке изменений вещательного сигнала. Деп. в ЦНТИ «Информсвязь» №2208 св.2002 от 10.06.2002, с.86-94.
90. Рихтер С.Г., Попов О.Б., Хрянин Е.А. Вопросы объективизации измерений параметров качества звуковых вещательных сигналов// Метрология и измерительная техника связи, 2003. №2 - с. 27-29. - Соавт.: С.Г. Рихтер, О.Б. Попов.
91. Рихтер С.Г., Попов О.Б., Хрянин Е.А. Качество каналов звукового вещания: всегда ли и всех оно устраивает? (Некоторые особенности передачи и метрологии звуковых вещательных сигналов)// Broadcasting.
92. ГОСТ 22260-76. Сигналы передач внутрисоюзного и внешнего вещания, подаваемые в междугородные каналы звукового вещания. Основные параметры. Методы контроля.
93. О предварительном нормировании звукового сигнала// Метрология и измерительная техника связи, 2003. №4 - с.28-29. - Соавт.: С.Г. Рихтер, О.Б. Попов.
94. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. — М.: ЮНИТИ-ДАНА, 2001.
95. Отчет по НИР "Разработка и исследование методов измерений параметров вещательных каналов с адаптируемыми к сигналу параметрами". Договор № 6802/01 от 01.03.2001. Шифр "Оценка", 2002.
96. Сб.: Гарбузов Е. Г, музыкант, исследователь, педагог. М., 1980
97. Асафьев В. Музыкальная форма как процесс. Л., 1971.
98. Звуковое вещание/А.В. Выходец, П.М. Жмурин, И.Ф. Зорин и др.; Под ред. Ю.А. Ковалгина: Справочник. М,: Радио и связь, 1993. - 464 е.: ил.
99. Осташевский Е.Н., Нечаев И.К., Ишуткин Ю.М. Чувствительность слуха к изменению параметров атаки музыкальных инструментов // Труды Ленинградского института киноинженеров. 1989. - № 1. - с. 24.
100. Хэррис Ф. Дж. Использование окон при гармоническом анализе методом дискретного преобразования Фурье // ТИИЭР, 1978. —66, -1, -с.60-96.
101. Ковалгин Ю.А., Вологдин Э.И. Цифровое кодирование звуковых сигналов. СПб: Корона принт, 2004.
102. Марпл-мл C.JI. Цифровой спектральный анализ и его приложения. М.: Мир,-1990.
103. Дубовик Ж.Я. «Исследование явления дребезжания диффузорных громкоговорителей и методы его объективного количественного определения». Диссертация на соискание ученой степени кандидат технических наук, Ленинградский Институт Киноинженеров, 1973.
104. Понукалин A.A. «Восприятие качества звучания». Учебное пособие. Издательство Саратовского университета 1980.
105. Фадеев A.A. «Контроль и измерение качества в звуковом вещании». Ленинградский Электротехнический Институт Связи им. проф. М.А. Бонч-Бруевича. Учебное пособие. Ленинград 1981.
106. Уваров В.К. «Разработка теоретических основ и технических средств компандирования звуковых сигналов». Ленинградский Институт Кино и Телевидения, диссертации на соискание ученой степени кандидата технических наук. Ленинград 1985.
107. Веселова Н.И. «Разработка метода и средств оперативного контроля качества звукотехнической аппаратуры». Ленинградский Институт Киноинженеров, Диссертация на соискание ученой степени кандидат технических наук. Ленинград 1987.
108. Центральный отраслевой орган научно-технической информации «ЭКОС», Аналитический обзор по материалам зарубежной и отечественной печати «Методы субъективной оценки качества звучания бытовой радиоэлектронной аппаратуры». Москва 1988.
109. Галембо A.C. «Разработка методов оценки интонационной ясности музыкальных звуков». Диссертация на соискание ученой степени кандидат технических наук. Санкт-Петербургский Институт Кино и Телевидения, 1994.
110. И.А. Алдошина, Р. Приттс «Музыкальная акустика». Учебник для высших заведений. СПб'.«Композитор Санкт-Петербург», 2006.
111. Лихницкий А. «Качество звучания. Новый подход к тестированию аудиоаппаратуры». СПб:«ПиК», 1998.
112. Грибов В.Д. «Методы интегральной оценки качества звуковоспроизведения в кинотеатрах». Санкт-Петербургский Институт Кино и Телевидения, диссертация на соискание ученой степени кандидат технических наук. Санкт-Петербург 2000.
113. Уваров В.К. «Разработка теоретических основ и технических средств компандирования звуковых сигналов». Диссертации на соискание ученой степени доктора технических наук. Санкт-Петербургский Институт Кино и Телевидения, Санкт-Петербург 2003.
114. Хрянин Е.А. «Компьютерная оценка качества передачи звуковых вещательных сигналов». Диссертации на соискание ученой степени кандидат технических наук. МТУ СИ. Москва 2003.
115. Fischer R: Die Lautstärkeempfindung fur Dauergeräusche und ihre Nachbildung in einem Meßgerät. Dissertation an der Fakultät fur Elektrotechnik der Technischen Universität Berlin, Berlin, 1964.
116. Brandenburg, K: OCF A New Coding Algorithm for High Quality Sound Signals. International Conference on Audio, Speech, and Signal Processing87,Dallas, Texas, USA, April 1987, pp. 141-144.
117. Colomes C; Lever M; Rault JB; Dehery YF:A Perceptual Model Applied to Audio Bit-Rate Reduction. Contribution to the 95th Convention of the Audio Engineering Society, New York, October 1993, Preprint 3742.
118. Terhardt E: The Spine Function for Scaling of Frequency in Auditory Models. Acústica, Vol. 77, 1992, pp. 40-42.
119. Zwicker E; Terhardt E: Analytical Expressions for Critical Bandwidth as a Function of Frequency. Journal of the Acoustical Society of America, Vol. 68 (5), November 1980, pp. 1523-1525
120. Fasti, H.: Temporal Masking Effects: II. Critical Band Noise Masker. Acústica, Vol.36,1976, pp. 317-331.
121. Hellman R.P.: Asymmetry of Masking between Noise and Tone. Perception & Psychophysics, Vol. 11 (3), 1972, pp. 241-246.
122. Humes, L.E.; Jesteadt, W.: Models of the Additivity of Masking. Journal of the Acoustical Society of America, Vol. 85 (3), March 1989, pp. 1285-1294.
123. Patterson, R. D.: Auditory filter shapes derived with noise stimuli. Journal of the Acoustical Society of America, Vol. 59 (3), March 1976, pp. 640-654.
124. Moore, B.C.J.; Glasberg, B.R.: Suggested formulare for calculating auditory-filter bandwidths and excitation patterns. Journal of the Acoustical Society of America, Vol. 74 (3), September 1983, pp. 750-753.
125. Glasberg,B.R.; Moore,В. J.: Derivation of auditory filter shapes from notched noise data. Hearing Research, Vol. 47,1990, pp. 103-138.
126. Stuart,J.R.: Implementation and measurement with respect to human auditory capabilities. AES UK DSP Conference, London, September 1992.
127. Deutsch,W.A.; Noll,A.; Eckel,G.: The perception of audio signals reduced by overmasking to the most prominent spectral amplitudes. Contribution to the 92nd Convention of the Audio Engineering Society, Vienna, March 1992, Preprint 3331.
128. Brandenburg,K.: Ein Beitrag zu den Verfahren und der Qualitaetsbeurteilung fuer fuer hochwertige Musikcodierung. Dissertation am Lehrstuhl für technische Elektronik der Universität Erlangen-Nürnberg, Erlangen, 1989.
129. Kapust,R.: Qualitätsbeurteilung Codierter Audiosignale mittels einer BankTransformation. Dissertation an der Technischen Fakultät der Universität Erlangen-Nürnberg Erlangen, 1993.
130. Schröder,M. etal.: Objective measure of certain speech signal degradations based on masking properties of human auditory perception. In: Lindblom; Öhmaneds.): Frontiers of Speech Communication Research. New York: Academic Press, 1979.
131. Thiede, Th.: Untersuchungen zur objektiven Qualitätsüberwachung bei bitra-tenreduzierten Tonsignalen. Diplomarbeit am Institut für Fernmeldetechnik der Technischen Universität Berlin, Berlin, 1994.
132. Thiede, Th .; Steinke, G .: Arbeitsweise und Eigenschaften von Verfahren zur Gehörrichtigen Audiosignalen. Rundfunktechnische Mitteilungen, Vol. 38,1994, pp. 102-114.
133. Thiede, Th.: Gehörrichtige Qualitätsbewertung von Audiosignalen Übersicht und Einschätzung der gegenwärtigen Verfahren. Proceedings of the 18th International Convention on Sound Design (Tonmeistertagung), Verlag K.G. Saur, München 1995, pp. 623-642.
134. Beerends,J.G.; Stemerdink,J.A.: Modelling a cognitive aspect in the measurement of the quality of music codecs. Contribution to the 96th Convention of the Audio Engineering Society, Amsterdam, February 1994, Preprint 3800.
135. Beerends, J.G.; van den Brink, W. A.C.: The role of informational masking and perceptual streaming in the measurement of musik codec quality. Contribution to the 100th Convention of the Audio Engineering Society, Copenhagen, May 1996, Preprint 4176.
136. Beerends,J.G.; Stemerdink,J.A.: The optimal time-frequency smearing and amplitude compression in measuring the quality og audio devices. Contribution to the 94th Convention of the Audio Engineering Society, Berlin, March 1993, Preprint 3604.
137. Sporer, Th.: Ein neuartiges Verfahren zur gehörrichtigen Beurteilung von Audiosignalen. Proceedings of the 19th International Convention on Sound Design (Tonmeistertagung), Verlag K.G. Saur, München 1997.
138. Kapust, R.: Ein gehörbezogenes Messverfahren zur Beurteilung der qualität codierter Musiksignale. U.R.S.I. Kleinheuerbacher Berichte, Band 33, Kleinheuerbach, October 1989, pp. 633 - 642.
139. Hansen, M.; Dau, T.; Kollmeier, B.: Objektive sprachqualitätsvorhersage Mittels einer gehörorientierten Vorverarbeitung. Fortschritte der Akustik, DAGA'96, Bonn, February 1996, pp.362-364.
140. Hollier, M.P.; Hawksford, M.O.; Guard, D.R.: Characteriyation of communications szstems using a speechlike test stimulus. Journal of the Audio Engineering Society, Vol. 41 (12), December 1993, pp. 1008-1021.
141. Thilo Thiede, Gehörbezogene Qualitätsbewertung von Audiosignalen unter Verwendung einer nichtlinearen Filterbank. Dr. Ing. genehmigte Dissertation. Technischen Universität. Berlin, 1999.
142. P.Kabal, An Examination and Interpretation of ITU-R BS.1387: Perceptual Evaluation of Audio Quality., Telecommunications & Signal processing laboratory, Department of Electrical & Computer Engineering McGill University, 2003.
143. Thilo Thiede, Gehörbezogene Qualitätsbewertung von Audiosignalen unter Verwendung einer nichtlinearen Filterbank. Dipl. Ing. Vom Fachbereich Elektrotechnik der Technischen Universität Berlin zur Erlangung des akademischen Grades. Berlin, 1999.
144. Gilbert A. Soulodre, Theorder Grusec, Michel Lavoie, and Louis Thibault: Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs. J.Audio Eng.Sos., Vol.46, No.3, 1998, March.
-
Похожие работы
- Разработка быстродействующих алгоритмов компрессии звуковых данных на основе дельта-преобразований второго порядка
- Повышение эффективности алгоритмов компрессии цифровых данных при кодировании сигналов стереопары
- Разработка и исследование усовершенствованного метода компрессии звуковых данных в мультимедийных системах
- Повышение эффективности передачи мультимедийной информации методом чирплет-преобразования
- Разработка методов и алгоритмов повышенной компрессии аудиосигналов, закодированных на основе оптимизированных дельта-преобразований второго порядка
-
- Теоретические основы радиотехники
- Системы и устройства передачи информации по каналам связи
- Радиотехника, в том числе системы и устройства телевидения
- Антенны, СВЧ устройства и их технологии
- Вакуумная и газоразрядная электроника, включая материалы, технологию и специальное оборудование
- Системы, сети и устройства телекоммуникаций
- Радиолокация и радионавигация
- Механизация и автоматизация предприятий и средств связи (по отраслям)
- Радиотехнические и телевизионные системы и устройства
- Оптические системы локации, связи и обработки информации
- Радиотехнические системы специального назначения, включая технику СВЧ и технологию их производства