автореферат диссертации по радиотехнике и связи, 05.12.13, диссертация на тему:Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека

кандидата технических наук
Стефанов, Михаил Александрович
город
Самара
год
2009
специальность ВАК РФ
05.12.13
Диссертация по радиотехнике и связи на тему «Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека»

Автореферат диссертации по теме "Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека"

На правах рукописи

СТЕФАНОВ Михаил Александрович

ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ СЖАТИЯ ЦИФРОВОЙ АУДИОИНФОРМАЦИИ С УЧЕТОМ СВОЙСТВ СЛУХОВОГО АНАЛИЗАТОРА ЧЕЛОВЕКА

Специальность 05.12.13 -Системы, сети и устройства телекоммуникаций

Автореферат диссертации на соискание ученой степени кандидата технических наук

1 7 ДЕК 2003

Самара - 2009

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Поволжский государственный университет телекоммуникаций и информатики» (ГОУВПО ПГУТИ)

Научный руководитель: доктор технических наук,

профессор Акчурин Э.А.

Официальные оппоненты: доктор технических наук,

доцент Горячкин О,В.

кандидат технических наук, доцент Засов В.А.

Ведущая организация: ГОУВПО Самарский государственный технический университет (СГТУ)

Защита состоится «» декабря 2009 г. в / 3> часов на заседании диссертационного совета Д219.003.02 при Поволжском государственном университете телекоммуникаций и информатики по адресу: 443010, г. Самара, ул. Льва Толстого, 23.

С диссертацией можно ознакомиться в библиотеке ГОУВПО ПГУТИ.

Автореферат разослан « Я Ь » ноября 2009 г.

Ученый секретарь

диссертационного совета Д219.003.02 доктор технических наук, доцент I ^ Мишин Д.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Современный этап развития систем цифровой обработки и передачи аудиоинформации характеризуется как увеличением потока передаваемой информации, так и повышением требований к ее качеству. В связи с этим одной из важнейших задач является повышение эффективности компрессии цифровых аудиоданных при условии высокого качества субъективного восприятия сжатого звука.

К настоящему времени в стандартах MPEG (Moving Pictures Expert Group) и A TSC (.Advanced Television System Committee) Dolby AC-3 (A/52) рекомендуются алгоритмы высококачественного сжатия звуковых сигналов (ЗС), обеспечивающие цифровые скорости от 64 кбит/с дня мультимедиа приложений до 384 кбит/с для цифрового стереофонического вещания. Нестандартные алгоритмы в форматах РАС, VQF, WMA, Ogg Vorbis и другие по утверждениям их авторов позволяют без существенного снижения качества субъективного восприятия сжатого звука довести цифровую скорость до 96 кбит/с. Таких успехов удалось добиться за счет обработки цифровых аудиоданных в частотной области, для чего используются дискретные ортогональные преобразования (ДОП). В свою очередь, такое радикальное изменение принципов обработки ЗС стало возможным благодаря результатам экспериментальных исследований психоакустических свойств слуха. Наиболее полно эти исследования провели Е. Zwicker, К Feldtkeller. Вместе с тем прикладной характер эти результаты получили благодаря усилиям зарубежных ученых К. Brandenburg, G. Stoll, G. Theile и др. В России следует выделить работы Ю.А. Ковалгина и А.М. Синильникова.

Однако дальнейшее развитие высококачественных систем компрессии цифровых аудиоданных сдерживается отсутствием условий эффективного использования психоакустических свойств слуха. Так. В стандартах MPEG и DOLBY АС-3 (А/52) эффект маскировки учитывается только для оценки допустимой степени округления. А в известных предложениях по повышению эффективности сжатия не учитываются частотные характеристики ДОП и особенности восприятия слухом сжатого спектра. В результате не представляется возможным предметно говорить о более эффективных алгоритмах кодирования спектра ЗС.

В связи с этим актуальной является задача выработки обоснованных рекомендаций относительно ДОП, перспективных для целей сжатия ЗС и условий повышения производительности высококачественных систем компрессии цифровых аудиоданных.

Цель и задачи работы. Целью диссертации является повышение эффективности сжатия цифровой аудиоинформации. Для достижения указанной цели в диссертационной работе поставлены следующие задачи: -сформулировать обоснованные требования и выработать реко-

мендации относительно ДОП, перспективных для эффективной и высококачественной компрессии цифровых аудиоданных;

- исследовать ДСО коэффициентов перспективных ДОП с учетом их частотных свойств и основных психоакустических свойств слуха;

-исследовать эффективность прореживания коэффициентов перспективных ДОП;

-разработать методики и провести экспериментальное исследование эффективности сжатия цифровых аудиоданных с прореживанием спектра.

Методы исследования. При решении поставленных задач использовались методы спектрального анализа, теории вероятностей и математической статистики, теории цифровой обработки сигналов, результаты экспериментальных исследований психоакустических свойств слуха и статистических свойств ЗС, компьютерное моделирование. Научная новизна работы заключается в следующем: -разработан метод оценки распределения допустимой степени округления коэффициентов гармонических дискретных ортогональных преобразований, учитывающий их частотные характеристики и свойства слухового анализатора человека;

-получены аналитические выражения для оценки вероятности маскировки коэффициентов гармонических дискретных ортогональных преобразований любым участком кривой маскировки;

-разработан алгоритм прореживания коэффициентов гармонических дискретных ортогональных преобразований, учитывающий особенности восприятия слухом компонент сжатого спектра;

-разработан метод оценки частотной области целесообразной для прореживания в заданном рабочем диапазоне частот.

Личный вклад. Основные научные положения, теоретические выводы и рекомендации, а также методики экспериментальной обработки цифровых аудиоданных, содержащиеся в диссертационной работе, получены автором самостоятельно.

Практическая ценность и реализация результатов работы. Полученные аналитические выражения и зависимости способствуют повышению производительности систем сжатия цифровых аудиоданных при сохранении высоких качественных показателей.

Результаты работы могут быть использованы при разработке новых и усовершенствовании существующих цифровых технологий передачи и обработки цифровой аудиоинформации. Разработанные методики экспериментальной обработки цифровых аудиоданных могут быть использованы для оценки эффективности новых алгоритмов сжатия.

Основные теоретические и практические результаты, полученные в работе, использованы ФГУП СОНИИР и внедрены в учебный про-

цесс ГОУВПО ПГУТИ, что подтверждено соответствующими актами.

Апробация работы. Основные результаты и положения работы обсуждались на VIV - XVI Российских научных конференциях (Самара, 2007 -2009), 6 Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Уфа, 2005), VII Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Самара, 2006), IX Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Казань, 2008), V Международной научно-технической конференции «Методы и средства управления технологическими процессами» (Саранск, 2009).

Публикации. По теме диссертации опубликовано 11 печатных работ, в том числе 2 статьи в научных изданиях, входящих в перечень ВАК, и 9 тезисов и текстов докладов на Российских и Международных конференциях.

Основные положения, выносимые на защиту:

- метод оценки распределения допустимой степени округления коэффициентов гармонических дискретных ортогональных преобразований, учитывающий их частотные характеристики и свойства слухового анализатора человека;

- аналитические выражения для оценки вероятности маскировки коэффициентов гармонических дискретных ортогональных преобразований любым участком кривой маскировки;

- метод оценки частотной области целесообразной для прореживания, в заданном рабочем диапазоне частот;

- результаты компьютерного моделирования обработки цифровой аудиоинформации.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа содержит 146 страниц машинописного текста, 64 рисунка, 10 таблиц. Список литературы включает 168 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы исследования, сформулированы цели и задачи работы, перечислены основные научные результаты диссертации, положения, выносимые на защиту, определены практическая ценность и области применения результатов, приведены сведения об апробации работы, структуре и объеме диссертации.

В первой главе на основе психофизиологических свойств слуха и характерных особенностях работы систем обработки и передачи ЗС формулируются требования, которым должны удовлетворять ДОП при использовании их в целях высококачественного сжатия цифровой аудиоинформации и проводится сравнительный анализ наиболее известных ДОП.

Распределение амплитуд колебаний вдоль основной мембраны органа

слуха экспериментально исследовано Бекеши (рис. 1). Оказалось, что тон возбуждает не одно поперечное волокно, настроенное на данную частоту, а целый участок мембраны. Тем не менее, в итоге ощущается только сам испытательный тон. Эти результаты позволяют сделать вывод, что в высококачественных системах сжатия ДОП

! |

1 -1.....1 У 1 ......!.....1 .1 \7 .. ч N N

100! 200 300 Гц | 1 1 : ! 1 1

X, мм 32 30 28 26 24 22 20

Рис. 1. Поперечные колебания основной мембраны

должны допускать интерпретацию своих коэффициентов как тональных компонент спектра, так и полосного шума, интенсивность которого сконцентрирована на частоте соответствующего коэффициента. Обе интерпретации отнюдь не противоречивы, поскольку с точки зрения электроакустики распределение интенсивности полосного шума безразлично. Она может быть распределена равномерно или сосредоточена в одной гармонике.

Согласно результатам экспериментальных исследований эффекта

маскировки ^(подавление тонов меньшей интенсивности тоном большей.....

интенсивности) слухового анализатора, колебания поперечных волокон основной мембраны некоррелированны. Следовательно, этим свойством должны обладать и коэффициенты ДОП. Кроме того, кривая порога слышимости при маскировке, иначе кривая маскировки (КМ), при определенных условиях может распространяться почти на весь слышимый диапазон частот (рис. 2). Тем самым обусловливается необходимость глобальной декорреляции коэффициентов ДОП. (.'„„ дБ

Эти требования следует допол- 100 ► нить еще одним, учитывающим работу подавляющего числа систем обработки и передачи цифровой аудиоинформации в режиме реального времени -ДОП должно обладать быстрым вычислительным алгоритмом.

Наибольшую эффективность сжатия цифровых аудиоданных можно ожидать при использовании преобразования Карунена-Лоэва, коэффициенты которого полностью декор-релированы. Более того, по критерию среднеквадратичной ошибки оно является оптимальным для представления стационарных процессов, когда разложение Карунена-Лоэва производится по собственным функциям интегрального уравнения Фредгольма с ядром, равным корреляционной функции процесса. Однако применительно к ЗС на интервалах, меньших интервала стационарности, для каждого такого интервала придется строить свой базис по его корреляционной функции. Кроме того, разложение Карунена-Лоэва не имеет быстрых вычислительных алгоритмов.

С кГц

Рис. 2. Кривые маскировки

Преобразование Хаара обладает быстрыми вычислительными алгоритмами. Однако, как известно, свойством глобальной декорреляции обладают только небольшое число первых коэффициентов.

Преобразование Уолша-Адамара также имеет быстрые вычислительные алгоритмы. Упорядоченное по Адамару, оно обеспечивает глобальную декорреляцию, но каждая точка его энергетического спектра представляет собой энергетическое содержание не одной, а группы частостей. В результате восприятие на слух сжатого и исходного спектров будет резко отличаться. При упорядочивании по Уолшу обеспечивается и глобальная декорреляция, и адекватный ЗС энергетический спектр. Вместе с тем. функции Уолша, положенные в основу преобразования, представляют собой прямоугольные, причем как периодические, так и непериодические волны. Столь резкие изменения частоты и амплитуды сигнала ощущаются на слух как щелчки.

Вейвлет-преобразование дает хорошее разрешение по частоте и плохое по времени в низкочастотной области. Обратно в высокочастотной области. Эта особенность хорошо согласуется с результатами экспериментальных исследований спектральной плотности средней мощности для ЗС различных жанров. Однако, во-первых, точность анализа посредством вейвлет-преобразования определяется степенью соответствия форм вейвлета и сигнала. Форму же ЗС на малых временных интервалах предсказать невозможно. Во-вторых, вейвлет-преобразование дает оценку суммарной интенсивности, сосредоточенной в некоторой полосе частот анализируемого сигнала. А, как известно, слуховой анализатор сигнал на полосы не разделяет.

Из класса гармонических преобразований наиболее известными являются преобразования Фурье, Хартли и косинусное преобразование (ДКП). Первые два преобразования по свойствам абсолютно идентичны. Разница лишь в том, что второе не требует комплексной арифметики. Поэтому в дальнейшем они обозначаются как ДПФ-Х.

В целом же все эти преобразования обладают быстрыми вычислительными алгоритмами и обеспечивают глобальную декорреляцию своих коэффициентов. На рис. 3 приведены их нормированные АЧХ \Нк(т)\п = \Нк{т)\/ \Нк{тк)\. Видно, что коэффициенты Кх(к) этих преобразований можно интерпретировать как полосный шум, интенсивность которого сосредоточена на частоте /к. Вместе с тем в силу слабого затуха-

0.5 0

вИ1

0.5 0

к

¿+1 А+2 —к+3

а) ДПФ-Х

б) ДКП

Рис. 3. АЧХ коэффициентов гармонических ДОП

ния амплтуды боковых лепестков и равновероятности знаков соответствующих спектральных компонент исходного сигнала в первом приближении Кх{к) можно считать некоррелированными. Однако для ДКП это справедливо только для четных и нечетных коэффициентов в отдельности.

Таким образом, перспективными для целей сжатия цифровой аудиоинформации следует признать гармонические ДОП. При этом в случае интерпретации коэффициентов ДКП как тональных компонент спектра их целесообразно разделять на два потока по признаку четности.

Во второй главе с учетом частотных свойств ДОП и основных психоакустических свойств слуха разрабатывается методика оценки распределения ДСО коэффициентов ДОП в пределах спектральной выборки.

Естественным критерием ограничения разрядности д \к модуля Кх{к) является коэффициент минимально ощущаемой на слух прямоугольной амплитудной модуляции полосного шума тк, концентрируемого на частоте /к. В свою очередь, тк является функцией двух параметров - ширины полосы шума Ли частоты его модуляции/мод = 11Т„, где Тп - длительность интервала"ттреобразования. Известное условие оценки 7„ получено при участии автора данной работы и позволяет оценить оптимальное значение соответствующего параметра тк: /мал = 130 Гц для музыкальных

||Я*(гю)|,

сигналов и 100 Гц для речевых сигналов.

Второй параметр тк обычно принимается равным рабочей полосе ЗС. Однако (рис. 3) степень влияния спектральных компонент на величину Кх{к) различна. Следовательно, должно существовать пороговое значение |Щг'га)|!1>п (рис. 4), разделяющее значимые в этом смысле компоненты спектра исходного сигнала (зт е 6/у,) от незначимых (5„ г БЯ^), где - часть полосного шума, обусловленная 7-м лепестком АЧХ. Тогда и поскольку фрагментарный характер шума для тк значения не имеет

Рис. 4. Составляющие АГ,

ш ,к

У

(1)

Учитывая, что занижение ц\к ведет к изменению взаимодействия компонент нового (после обратного преобразования) спегара, ^/¿(/со)!,^ целесообразно искать на основе эффекта маскировки.

Пусть для Кх(к) известна вероятность маскировки Ск. В плоскости слышимости ей можно сопоставить область безусловной маскировки, ограниченной сверху средним порогом слышимости при маскировке ипск. Тогда вероятность Ск можно переопределить как Р{ик<ииск} = =с1ес(ит,к / 20)/с1ес{0к /20), где ик - уровень Кх(к) в плоскости слышимо-

сти, ограниченной сверху динамическим диапазоном изменения сигнала, a dec(x) = 10*. Отсюда ¿есЩ,а/20) = Р {Uk<Unck} -dec(Dk /20). В наихудшем случае s„ обусловливает приращение ик = dec(Uk/20), не превышающее по абсолютной величине \\Hk(i(a„)\H\-dec(D„ /20). При этом s„ будет незначащей для Кх(к), если \\Hifja„)\H\-dec{Dn /20) < deciJJ^k /20). Таким образом, условие оценки ширины полос 8Fmj, составляющих AFmi, запишется в виде:

\\Нк(тт)\я\ > Gk-dec(Dk/20) / dec(Dml20) = \\Hk(ia)\„J. (2) С целью оценки Gk получена более адекватная по форме и вместе с тем достаточно точная (коэффициент детерминации Л2 1) аппроксимация КМ:

UlZ = -54|/ot, I1'6 +U, +а ,, t/® = -ЗА,, +(0,05/О,, +0,76)С/, +amJ, )

' (3)

VZ = -18|A,f'6 и% = -a, lg[l+a Jok, ехр(-а)]+</,+«„,

где верхний индекс означает участок KM Kx(i) уровнем Uh относительная частота fo^ - (fk-fi)/AF< и AF, - ширина частотной группы (области волосковых клеток, возбуждаемых минимально слышимым Кх(/)), -коэффициент маскировки (определяет уровень пика КМ относительно уровня маскирующего тона или шума), а коэффициенты ai - a3 определяются эмпирически. Кроме того, определяется безусловная вероятность P{Uk < Ulf^(fok i,Ui )} маскировки Kx(k) участком х КМ„ для чего соответствующая область ее значений на частоте fk приводится к единичному квадрату. В результате при маскировке левой ветвью и первыми двумя участками правой ветви эта вероятность равна 0,5, а третьим участком

/■{t/t<^0&t^,)} = lnI<4 + exp(a'-^,)1+-^-гх

1 ' ' Р fi-a,-(c/w-Ultrl)

•0.5 ■ а3 • (U,„2 - U,^ )■■ [2 • 1п(а2 ) - а, ■ (U,„2 - U,^ )] ■+

у (•')" ' exp(aat/IJp2w) ^ (-1)" ■ ехрСа,ишп) ц Jn(a2) ti n2 al . ti ' ',гр2 a,

(-■Г-a;

n exp (a3Ul{rlri) (4)

b(a2).

1 „» ■ i.rpl

y (-')" '«2 y , '"(<*2). ¿În'-exiKa,!/^»!)' a, '

0 в противном случае,

,л>2 a,

где Р = -In {1 +a2/o^,-exp(-a3- £/,_ф2)} + In{1 +a.2-fokexp(-a3• L',>rp,)}, а Ui-rpi и Ui,гр2 - фаницы участка х КМ,. Наконец, для упрощения вычислений

формулируется достаточное условие отсутствия маскировки: Кх(к) не маскируется, если его уровень не меньше уровня КМ любого другого Kx{i) на частоте fk. В соответствии с этими результатами и в предположении независимости К£к) получаем выражение для оценки искомой вероятности:

Gk = 1 -P{Uk Z ЖЛ» П 1 "Esi? • (5)

мя, L i

где P{Uk>A(fk)} - вероятность отсутствия маскировки Кх(к) абсолютным порогом слышимости А(/ку, щ и пг - соответственно, наименьший и наибольший номера Kx(jT), удовлетворяющие условию U^J (fok,, Д ) > A(fk); g(kx/ - условная вероятность маскировки Кх{к) участком х КМ„ определяемая в соответствии с известным выражением.

Помимо модуля, Кх(к) характеризуются фазовым сдвигом. Ограничение разрядности модуля фазы (р4 (к > 0) на величину Д<р* приводит к изменению частоты fk соответствующей компоненты sk нового спектра на ве-

—личину-Д^..Причем эти изменения происходят на..стыках спектральных выборок. Такой характер изменения можно интерпретировать как частотную модуляцию Kj(k) с частотой модуляции/иоя = 1/Гп и девиацией частоты Д^. Это позволяет сопоставить относительное изменение фазы Дер* с индексом частотной модуляции Дд /fmд. Но тогда естественным критерием ограничения разрядности модуля фазы является минимально ощущаемая на слух девиация частоты 5/ В результате анализа известных экспериментальных данных автором с высокой точностью (коэффициент детерминации R1 = 0,995) получено соответствующее аналитическое выражение:

8/(Л,/„„д) = W^-10-4 -л"2 + W„w)/Ig(/*), (6)

где коэффициенты К\(/мол) и K2(fM0д) подбираются эмпирически.

Пусть теперь |ф*| некоторого немаскируемого К^к) текущей спектральной выборки представлен q(fJi значащими двоичными разрядами. В результате округления q2vk младших разрядов обнуляются, вследствие чего достаточно передать только ql^ = q^ - q2^k старших разрядов. При этом по правилам округления |tp*| увеличится или уменьшится не более чем на величину Д = bin{q^k - /2, где bin(x) = 2х. Согласно принятой интерпретации округления отношение Nbm{qvk) = bin^ql^ - 1) определяет индекс частотной модуляции. Тогда искажения, вызванные округлением |<р*|, не будут ощущаться на слух, если это отношение не превышает 5/ Отсюда

qh,k = 1 log2[fHOJWb /мод)] - 1 Г, (7)

где 1 х Г - наименьшее целое, не меньшее х.

Заметим, что округление KJ0) приводит к дополнительному фазовому сдвигу компонент нового спектра на стыках выборок на величину, по модулю

не более Дср</2. Однако если это не больше наименьшей допустимой степени округления модуля фазы, подобные искажения на слух ощущаться не будут. Следовательно,

д10 = тах|^194|4 ', где г - номер первого коэффициента рабочей полосы. Наконец, поскольку ДКП чувствительно к фазовым сдвигам, для всех к >0 если тк < 5/ (/к, _/*0Д)Тп и дЦ = в противном случае.

Метод оценки распределения ДСО для ЗС любого типа и при любых и О в общем ввде приведен на рис. 5. Как показывают расчеты, зависимость распределения ДСО отРдИЯ слабая. Кроме того, в среднем дЦ дги ДКП по сравнению с ДПФ-Х практически в 2 раза меньше.

В третьей главе разрабатывается метод прореживания спектра и формулируются условия его максимальной эффективности.

Поскольку 2-8/ является градацией раздражения и определяет ширину еще различимой на слух ступени частоты, К£к) следует рассматривать как тональную компоненту ЗС, если Ъ/к< А/для ДПФ-Х и 5Д< 2'Д/"для ДКП, где Д/ - разрешающая способность ДОП по частоте. В противном случае интерпретация 5/ как градации раздражения теряет смысл, что характерно для шума. На том же основании можно сформулировать условие разделения коэффициентов ДКП на два потока: 8/*< 3-Д/

Как известно, для тональных компонент характерно дополнительное смещение ащ1 на величину ДсМ = 10... 12 дБ. Кроме того, вследствие неравномерности округления фазы на последовательности выборок, в новом спектре на соответствующих частотах возможны биения. Но только при совокупности следующих обстоятельств: 1) Кх{к) отображает тональную компоненту, 2) к = 2т и/или к = Ъп, 3) 1)„, и/или (У„ превышают Ц^ (соответствуетпересечения всех участков правой ветви КМ), 4) К£т) и/или К/п) не маскируются. При этом К^к) маскируется, если ик<{икл- Д^) дБ, где А д, = 8... 10 дБ.

На этих основаниях разрабатывается метод прореживания коэффициентов ДОП, обобщенная алгоритмическая схема которого представлена рис. 6, где ЛМК - локально маскирующий коэффициент (определяет очередной участок порога слышимости). С целью оценки его эффективности рассматриваются следующие ситуации маскировки .

1. к = 2т. Так как событие отсутствия маскировки (ОМ*) 5к в случае биений, обусловленных (событие Бт), и при их отсутствии (событие Бт) независимы и несовместны, вероятность Рк отсутствия маскировки

Начало 3 1 '

Вычисление параметров КМ

к = г,Ы-1 -Г

>1

Вычисление вероятности Ск

X

Вычисление /У7,^ I —

Вычисление дипд^

Вычисление д1о

^ Конец

Рис. 5. Метод оценки д1к

Рк = Г{иу>/4(Л)}-[/'(ОМ0Р(Бт) + Р(ОМ*)-Р(Б„)], (8) С Начало )

где ) = ГТ П — ^ ] > но в первом слагае-

/ = « X

мом ите[и,ф, От], а во втором ит < и^.

2. к = 3п. Здесь Рк определяется аналогично (9), но нижняя граница области возможно маскирующих коэффициентов ограничена п.

3. к = 2т и к = Зи. В этом случае

+ДОМ4)-/>( Б„ )Р(Б„) + />(ОМ*)-/>( Б„ )-Р( Б„)], где ДОМ*) первого слагаемого вычисляется аналогично первой ситуации, второго - второй ситуации, а третьего- при (С/„,Ч/И) < и^.

4. кф2т и кФ Зи. Здесь Рк = 1 Относительно Р(БУ) достаточно заметить, что с

вероятностью I—/"(Б,) компонента 5) не порождает

биений, если она либо маскируется, либо по уровню не превышает 1/^. Отсюда сразу следует: Р(Ц) = Рк- и

Теперь относительно числа немаскируемых коэффициентов Л^ спектральной выборки установим пороговую величину Потребуем, чтобы средний интервал времени между событиями Л^ > ЫП был не меньше времени непрерывного звучания Тт. Тогда < К} > 1- ТП /Тт. Усредняя эту вфоятностъ по длине выборки, получаем условие оценки Л^:

^ Конец

Рис. 6. Метод прореживания

(Ю)

ы о

где С* - число сочетаний из у по х, а Тт = 20 мин для музыкальных сигналов (симфоническое произведение) и Г„3 = 9 с для речевых (средний интервал между естественными паузами).

Для сравнения возможностей ДПФ-Х и ДКП в сжатии ЗС используется относительный коэффициент сжатия

"—(ДПФ-Х) ,

<71*

К

(ДПФ-Х)

где д\к - усредненное на выборке распределение Кроме того, учтены знаковые разряды, а для ДПФ-Х и минимально возможное количество дополнительных бит, необходимых для кодирования фазы. Как показывают расчеты ц > 1 для любых Рд. Следовательно, в высококачественных сис-

темах сжатия цифровых аудиоданных целесообразным является ДКП.

Применительно к задаче оценке условий повышения эффективности сжатия ЗС с прореживанием спектра выражение (12) примет вид:

ц = фк (Д7Л,Т)■ Мнн (Дт, (Д /г)■ Л^нм (Д /•,), (12)

где Дт и ^лст - стандартные для данной системы В и соответственно.

Степень значимости й и Гд схематично показана на рис. 7. При этом, как показывают расчеты, за счет изменения их значений можно повысить эффективность сжатия ЗС с прореживанием спектра в 1,5 раза, причем без ухудшения качества субъективного восприятия сжатого звука.

Наконец определяется об- 1 Значимость, % ласть рабочего диапазона частот /•р, где прореживание имеет смысл. Суть соответствующего метода заключается в последовательном сужении исходной вы- ^ ^ борки в сторону верхних частот ДО выполнения условия Рис. 7. Значение/> и в повышении и

/ где верхний индекс указывает номер итера-

ции. Начиная с этого моменту скорость уменьшения области превышает скорость уменьшения Л^. Следовательно, в области остались наиболее часто маскируемые коэффициенты. Результаты расчетов показывают, что прореживание целесообразно в 90 %

В четвертой главе с помощью компьютерного моделирования и субъективно-статистического анализа проводится оценка степени достоверности полученного распределения с/Ц и предположения о биениях, а также проверка целесообразности применения прореживания спектра. Критерием достоверности является качество ЗС на выходе психоакустической модели, а критерием целесообразности - эффективность и качество ЗС на выходе алгоритма кодирования. В качестве тестовых фрагментов использовалась монофоническая дикторская речь и стереофоническая музыкальная фраза в полосе частот до 10 и 20 кГц, соответственно. Оба фрагмента записаны при = 44,1 кГц с разрешением 16 бит/отсчет.

Приводится описание используемых в моделировании средств и условий проведения субъективной оценки качества сжатого звука. Во всех моделях спектр сигналов представлен коэффициентами ДКП.

На рис. 8 показаны теоретическое <71т(/") и модельное д1м(/) распределения д\к для музыкального тестового фрагмента. Суть методики моделирования соответствующих искажений заключается в уменьшении в одной из ступеней су1м(/") и экспертной оценке качества звучания. Результаты экспериментов, ограниченные уменьшением на 1 бит только второй и только третьей ступени, приведены на рис. 9. Зависимости и £/1ч(Л хо-

qh, бит

?1т

Ц—

г

-0,5

5 10 15 /кГц

Рис-. 8. Распределение q 1* 2 3

\

«речь

Номер ступени f)

-1

Средний балл качества

музыка

Рис. 9. Экспертиза распределения q\k

8

0

-0,5 -lt

6

0 Дщ, дБ

речь

рошо согласуются по форме, причем qljf) < qW)- Тем самым подтверждается существование в ДКП фазовых искажений, a можно считать достаточной для любых типов и жанров ЗС.

Для проверки возможности биений предлагается, изменяя Л™, всякий раз проводить экспертную оценку качества звука Результата моделирования (рис. 10) позволяют согласиться с данной гипотезой.

Для апробации

прореживания предлагается модификация алгоритма с поблочно плавающей запятой {Dolby АС-3, MPEG-2 ААС). Коэффициенты спектральной выборки объединяются в блоки по признаку одинакового qlk. Блоки, где прореживание не имеет смысла, кодируются как обычно с помощью порядка (количество нулевых старших разрядов для наибольшего по

модулю коэффициента блока) и мантисс (ограниченное число старших разрядов коэффициентов блока). В остальных блоках только для немаскируемых коэффициентов помимо порядков и мантисс кодируются расстояния меящу ними. При этом теоретическая скорость цифрового потока для музыкального и речевого тестового фрагмента составляет 107,6 и 101 кбит/с, соответственно.

В результате моделирования получена Vm для музыкального фрагмента 105,5 кбит/с при среднем балле качества -0,19, а для речевого - 99,5 кбит/с при среднем балле качества -0,23. Таким образом, при достаточно высоком качестве субъективного восприятия звука за счет прореживания Vm относительно наиболее перспективного на сегодняшний день алгоритма кодирования MPEG-2 ААС (128 кбит/с при дополнительном статистическом уплотнении и среднем балле качества -0,17) снизилась в 1,2 раза для музыкального фрагмента и в 1,3 для речевого фрагмента.

Хорошее согласование теоретических и экспериментальных результатов позволяет сделать прогноз эффективности применения прореживания при нестандартных Fa и D. Как показывают расчеты, в этих условиях

музыка

-1,5! Средний балл качества

Рис. 10. Экспертиза возможных биений

можно обеспечить Vm не более 96,7 кбит/с (ц = 1,3) для музыкальных сигналов, 75,7 кбит/с (ц = 1,7) для широкополосных речевых сигналов и 31,5 кбит/с (ц = 2) для телефонии. И это без дополнительного статистического уплотнения и при высоком качестве субъективного восприятия звука.

В заключении приведены основные результаты работы:

1. На основе психофизиологических свойств слуха сформулированы требования, позволяющие обоснованно установить ДОП, перспективные для систем высококачественного сжатия цифровой аудиоинформации.

2. Разработан метод оценки распределения ДСО коэффициентов гармонических ДОП в пределах спектральной выборки, позволяющий рационально распределить биты при кодировании сжатого спектра с учетом достаточно высокого качества субъективного восприятия сжатого звука.

3. Получены аналитические выражения для оценки вероятности маскировки коэффициентов гармонических ДОП при различной их интерпретации и использовании всех ветвей кривой маскировки.

4. Разработан алгоритм прореживания спектра, позволяющий за счет изменения D и Fn дополнительно повысить эффективность компрессии цифровых аудиоданных в 1,5 раза при достаточно высоком качестве субъективного восприятия сжатого звука.

5. Разработан метод оценки эффективной для прореживания области рабочего диапазона частот, расширяющий перспективу развития новых более эффективных методов кодирования сжатых цифровых аудиоданных.

6. Разработаны методики экспериментальной обработки цифровой аудиоинформации с прореживанием спектра средствами компьютерного моделирования, позволяющие оценить эффективность новых алгоришов сжатия ЗС.

7. Результаты проведенных исследований могут быть полезны при разработке новых рациональных с точки зрения реализационной сложности и высокоэффективных кодеков для высококачественных систем цифровой обработки и передачи аудиоданных. Применение их в лабораторных условиях относительно наилучшего алгоритма кодирования MPEG-2 ААС практически при тех же качественных показателях, стандартных параметрах цифровых аудиоданных позволило снизить скорость цифрового потока в 1,2 раза.

Приложение содержит протокол экспертной комиссии субъективных оценок качества сжатых ЗС и акты использования результатов диссертации.

Публикации по теме диссертации

1. Стефанов, М. А. Эффективные дискретные ортогональные преобразования в компрессии цифровых аудиоданных / М. А. Стефанов. // «Инфокоммуникационные технологии». - 2009. - т. 7. - № 4. - С. 67-72.

2. Акчурин, Э.А. Энергетический параметр высококачественной эффективной компрессии цифровых аудиоданных / Э.А. Акчурин, A.M. Стефанов, М. А. Стефанов. // «Инфокоммуникационные технологии». - 2009. - т. 7. - № 2. - С. 82-87.

3. Стефанова, И.А. Оптимизация временного параметра эффективности сжатия звуковых сигналов / И.А. Стефанова, М.А. Стефанов. // 6 Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: сб. докладов. - Уфа, 2005. - С. 38-40.

4. Стефанов, М.А. Оценка допустимой степени округления фазы спектральных компонент звуковых сигналов / М.А. Стефанов. // VII Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: материалы конференции. - Самара, 2006. - С. 171-173.

5. Стефанов, М.А. Дискретные ортогональные преобразования как инструмент сжатия звуковых сигналов / М.А. Стефанов, Э.А. Акчурин. / XIV Российская науч. конф.: тез. докладов. - Самара, 2007. - С. 147-148.

6. Стефанов, М.А. Особенности округления спектральных компонент звуковых сигналов / М.А. Стефанов. II XV Российская науч. конф.: тез. докладов. - Самара, 2008. - С. 185.

7. Стефанов, М.А. Оценка ширины полосы концентрации энергии коэффициентами ДОП I М.А. Стефанов. // IX Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»:, ма-. териалы конференции. - Казань, 2008. - С. 140-141.

8.Сгефанов, М.А. Реализация округления коэффициентов дискретных ортогональных преобразований / М.А. Стефанов, А.М. Стефанов, И. А. Стефанова. // XV Российская науч. конф:: тез. докладов. - Самара, 2008. - С. 188.

9. Стефанов, М.А. К выбору способа нормировки коэффициентов ДОП при цифровой обработке звукового сигнала / М. А. Стефанов. // XVI Российская науч. конф.: тез. докладов. - Самара, 2009. - ч.2 - С. 12.

Ю.Стефанов, М.А. Особенности цифровой обработки звуковых сигналов в системе MATLAB / М.А. Стефанов. // XVI Российская науч. конф.: тез. докладов. - Самара, 2009. - ч.2 - С. 13.

11. Стефанов, М.А. Оценка вероятности маскировки спектральных компонент звуковых сигналов / М.А. Стефанов. // Электроника и информационные технологии. - 2009 Специальный выпуск (V Международная конференция "Методы и средства управления технологическими процессами" 19-21 ноября 2009. г. Саранск) - 2009. -http://fetmag.mrsu.ru/2009-2/pdf/Stefanov.pdf. - 0420900067/0015.

Отпечатано фотоспособом е соответствии с материалами, представленными заказчиком Подписано в печать 23.11.09г. Формат 60x84716 Бумага писчая№1 Гарнитура .Тайме Заказ 528. Печать оперативная .Усл. печ. л.0.92. Уч. изд. л.0.87. Тираж 100 экз

Отпечатано в издательстве учебной и научной литературы Поволжского государственного университета телекоммуникаций и информатики 443090, г. Самара, Московское шоссе 77. Т.(846)228-00-44

Оглавление автор диссертации — кандидата технических наук Стефанов, Михаил Александрович

ВВЕДЕНИЕ.

1. АНАЛИЗ ДИСКРЕТНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ НА СООТВЕТСТВИЕ СИСТЕМЕ СЛУХА ЧЕЛОВЕКА.

1.1 Состояние вопроса и постановка задачи.

1.2. Требования к ДОП в высококачественных системах компрессии цифровой аудиоинформации.

1.3. Негармонические дискретные ортогональные преобразования

1.4. Гармонические ортогональные преобразования.

Выводы по главе 1.

2. ИССЛЕДОВАНИЕ ДОПУСТИМОЙ СТЕПЕНИ ОКРУГЛЕНИЯ КОЭФФИЦИЕНТОВ ГАРМОНИЧЕСКИХ ДИСКРЕТНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ.

2.1. Состояние вопроса и постановка задачи.

2.2. Анализ параметров минимально ощущаемой на слух прямоугольной амплитудной модуляции полосного шума.

2.3. Метод оценки вероятности маскировки полосных шумов.

2.4. Численные характеристики допустимой степени округления коэффициентов ДОП.

Выводы по главе 2.

3. ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ СЖАТИЯ ЦИФРОВОЙ АУДИОИНФОРМАЦИИ С ПРОРЕЖИВАНИЕМ СПЕКТРА.

3.1. Состояние вопроса и постановка задачи.

3.2. Алгоритм прореживания спектра звуковых сигналов.

3.3. Метод оценки вероятности маскировки тональных компонент спектра.

3.4. Численные характеристики психоакустического анализа с прореживанием спектра.

Выводы по главе 3.

4. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ КОМПРЕССИИ ЦИФРОВОЙ АУДИОИНФОРМАЦИИ.

4.1. Состояние вопроса и постановка задачи.

4.2. Организация процессов моделирования и экспертной оценки качества звучания.

4.3. Распределение допустимой степени округления и особенности восприятия слухом сжатого спектра.

4.4. Модификация алгоритма с поблочно плавающей запятой.

4.5. Анализ эффективности алгоритма с поблочно плавающей запятой

Выводы по главе 4.

Введение 2009 год, диссертация по радиотехнике и связи, Стефанов, Михаил Александрович

Актуальность темы. Современный этап развития систем цифровой обработки и передачи цифровых аудиоданных характеризуется как увеличением потока передаваемой информации, так и повышением требований к ее качеству. Традиционные же методы сокращения статистической избыточности при условии его высокого качества (несущественной разницы в субъективном восприятии исходного и сжатого звука) обеспечивают выигрыш в пропускной способности канала связи лишь на 15 . 40 % [1 - 7]. Поэтому в последнее время в нашей стране и за рубежом уделяется большое внимание [8 - 22] вопросам развития новых методов сжатия цифровой аудиоинформации, основанных на использовании психоакустических свойств слуха человека. При этом сжатие звуковых сигналов (ЗС) производится не во временной, а в частотной области, для чего используются дискретные ортогональные преобразования (ДОП). Основополагающими в этой области являются работы таких авторов, как Е. Zwicker, W. Reichardt, К. Brandenburg, G. Stoll и др. В России следует выделить работы Ю.А. Ковалгина и A.M. Синильнико-ва.

Современные системы компрессии цифровой аудиоинформации стандартов MPEG {Moving Pictures Expert Group) [23 - 26] и ATSC (Advanced Television System Committee) Dolby AC-3 (A/52) [27] обеспечивают цифровые скорости от 64 кбит/с [28] для мультимедиа приложений до 384 кбит/с [29] для цифрового стереофонического вещания. При этом, судя по результатам экспертных оценок [30], несущественная разница в субъективном восприятии исходного и сжатого звука сохраняется только при сжатии цифрового потока с 768 до 128 кбит/с. Хотя по утверждению разработчиков MUSICAM [32, 33] и авторов нестандартных форматов РАС, VOF, WMA и Ogg Vorbis те же качественные показатели сохраняются и при сжатии до 8 раз. Вместе с тем известно [34], что при пропускной способности слухового аппарата в 100. 120 кбит/с человек способен осознанно воспринимать лишь порядка 100 бит/с. И хотя это относится к восприятию речи, такой большой разрыв дает повод к выводу о существовании возможности дальнейшего повышения эффективности высококачественной компрессии цифровых аудиоданных. Однако развитие соответствующих методов сдерживается рядом нерешенных проблем, основными из которых являются:

1. Эффективность сокращения психоакустической избыточности зависит [35] от вида ДОП. В настоящее время на основе весьма общих требований к свойствам ДОП в системах высококачественной компрессии цифровой аудиоинформации перспективными признаются [13, 36, 37] гармонические ДОП. Однако без достаточно обоснованной доказательной базы всегда остаются сомнения в целесообразности такого предпочтения.

2. Одним из основных психоакустических ресурсов компрессии цифровых аудиоданных является свойство порогового восприятия слухом изменения интенсивности спектральных компонент ЗС. Оно позволяет ограничить разрядность двоичного представления коэффициентов ДОП. С целью оценки допустимой' степени этого ограничения (округления) был проведен ряд исследований [30, 38 - 41]. Однако ни одно из них не учитывало такие важные факторы, как частотные свойства ДОП и связь [42] указанного свойства слуха с другим из основным его свойств — маскировкой (подавлением) спектральных компонент относительно малой интенсивности. В связи с этим отсутствует возможность эффективного ограничения разрядности цифрового представления коэффициентов ДОП. Как следствие, эмпирический подход к решению этого вопроса [43] по-прежнему актуален, хотя и обусловливает зависимость соответствующей оценки как от характера ЗС в целом (речь или музыка), так и от характера отдельных его фрагментов.

3. Уже упомянутый эффект маскировки слухового анализатора является и самостоятельным ресурсом сжатия цифровой аудиоинформации в частотной области. Его использование позволяет сократить количество передаваемых коэффициентов ДОП, ограничившись только немаскируемыми из них. Вместе с тем результаты экспериментальных [44] и теоретических [45,

46] исследований позволяют предположить существование определенных условий эффективного применения такого прореживания, связанных в частности с рабочим диапазоном частот и частотой дискретизации. Однако этот вопрос до сих пор остается открытым.

4. В настоящее время для повышения качества воспроизведения звука предполагается увеличение динамического диапазона ЗС почти до болевого порога слышимости. В связи с этим необходимы обоснованные сведения относительно влияния этого параметра на эффективность компрессии цифровых аудиоданных. Экспериментальным путем установить соответствующие зависимости весьма затруднительно, а теоретические исследования этого вопроса, судя по общедоступным литературным источникам, не проводились.

5. Недостаточно исследован вопрос адаптации алгоритма поблочного кодирования [47], хорошо зарекомендовавшего себя при сжатии ЗС во временной области, к условиям сжатия в частотной области. Вследствие относительно низкого качества прореживания кодируется весьма значительная часть маскируемых коэффициентов ДОП и/или отбрасывается часть немаскируемых из них.

От обоснованного решения перечисленных проблем зависят все важнейшие характеристики как существующих, так и новых высококачественных систем цифровой обработки и передачи ЗС. Поэтому актуальной является задача выработки обоснованных рекомендаций относительно ДОП, перспективных для целей сжатия ЗС и методов повышения производительности высококачественных систем компрессии цифровых аудиоданных.

Цель и задачи работы. Целью диссертации является повышение эффективности высококачественного сжатия цифровой аудиоинформации с использованием психоакустических свойств слухового анализатора. Для достижения указанной цели в диссертационной работе- поставлены следующие задачи:

- сформулировать обоснованные требования и выработать рекомендации относительно ДОП, перспективных для эффективной и высококачественной компрессии цифровых аудиоданных;

- исследовать допустимую степень округления (ДСО) коэффициентов перспективных ДОП с учетом их частотных свойств и взаимосвязи основных психоакустических свойств слуха и выработать рекомендации относительно допустимой степени ограничения разрядности двоичного представления коэффициентов указанных преобразований;

- исследовать эффективность прореживания коэффициентов перспективных ДОП и выработать рекомендации относительно наиболее целесообразного ДОП, а также рациональных значений частоты дискретизации (Fn) и динамического диапазона (D);

- разработать методики и провести экспериментальное исследование эффективности сжатия цифровых аудиоданных с прореживанием спектра.

Объектом исследования являются новые цифровые технологии для систем обработки и передачи цифровой аудиоинформации.

Предметом* исследования являются высококачественные системы сжатия цифровых аудиоданных.

Методы исследования. При решении поставленных задач использовались методы спектрального анализа, теории вероятностей и математической статистики, теории цифровой обработки сигналов, результаты экспериментальных исследований психоакустических свойств слуха и статистических свойств ЗС, компьютерное моделирование.

Научная новизна работы состоит в развитии методов цифровой обработки аудиоинформации и заключается в следующем:

- разработан метод оценки распределения допустимой степени округления коэффициентов гармонических дискретных ортогональных преобразований, учитывающий их частотные характеристики и свойства слухового анализатора человека;

- получены аналитические выражения для оценки вероятности маскировки коэффициентов гармонических дискретных ортогональных преобразований любым участком кривой маскировки;

- разработан алгоритм прореживания коэффициентов гармонических дискретных ортогональных преобразований, учитывающий особенности восприятия слухом компонент сжатого спектра;

- разработан метод оценки частотной области целесообразной для прореживания в заданном рабочем диапазоне частот.

Вклад автора в разработку проблемы. Основные научные положения, теоретические выводы и рекомендации, а также методы экспериментальной обработки цифровых аудиоданных средствами математического моделирования, содержащиеся в диссертационной работе, получены автором самостоятельно.

Практическая ценность и реализация результатов работы. Полученные аналитические выражения и зависимости позволяют повысить производительность систем сжатия цифровой аудиоинформации при сохранении высоких качественных показателей.

Результаты работы могут быть использованы при разработке новых и усовершенствовании существующих цифровых технологий передачи и обработки ЗС. Разработанные методики экспериментальной обработки цифровых

•j аудиоданных могут быть использованы для оценки эффективности новых алгоритмов сжатия.

Основные теоретические и практические результаты, полученные в работе, использованы ФГУП СОНИИР и внедрены в учебный процесс ГОУВ-ПО Поволжского государственного университета телекоммуникаций и информатики г. Самара, что подтверждается соответствующими актами.

Апробация работы. Основные результаты и положения работы обсуждались и были одобрены на VIV - XVI Российских научных конференциях (Самара, 2007 - 2009), 6 Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Уфа, 2005), VII Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Самара, 2006), IX Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» и

Казань, 2008), V Международной научно-технической конференции «Методы и средства управления технологическими процессами» (Саранск, 2009).

Публикации. Основное содержание диссертации отражено в 11 печатных работах, в том числе 2 статьи в научных изданиях, входящих в перечень ВАК, и 9 тезисов и текстов докладов на Российских и Международных конференциях.

Достоверность полученных результатов и положений работы обосновывается корректной интерпретацией параметров эффективности сжатия ЗС и строгим использованием математического аппарата в процессе выводов аналитических выражений. Подтверждается оценками экспертной комиссии при прослушивании сжатых цифровых аудиоданных, взятых с компакт-диска EBU-SOAM, Cat. № 422 204-2, рекомендуемого для таких испытаний исследовательской группой MPEG, а также научными трудами и апробациями на представительных научных форумах.

Основные положения, выносимые на защиту:

- метод оценки распределения допустимой степени округления коэффициентов гармонических дискретных ортогональных преобразований, учитывающий их частотные характеристики и свойства слухового анализатора* человека;

- аналитические выражения для оценки вероятности маскировки коэффициентов гармонических дискретных ортогональных преобразований любым участком кривой маскировки;

- метод оценки частотной области целесообразной для прореживания, в заданном рабочем диапазоне частот;

- результаты компьютерного моделирования обработки цифровой аудиоинформации.

Структура и объем работы. Материал диссертации состоит из введения, четырех глав основной части, заключения, списка использованной литературы и приложений. Основная часть работы содержит 146 страниц машинописного текста, 64 рисунка, 10 таблиц. Список литературы включает 168

Заключение диссертация на тему "Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека"

Выводы по главе 4

1. Для системы MATLAB + Simulink разработана методика компьютерного моделирования прореживания спектра с округлением коэффициентов ДКП.

2. Результаты экспериментальной проверки основных положений данной работы позволяют считать их достаточно достоверными.

3. Предложенный в работе метод сжатия с прореживанием спектра позволяет повысить эффективность кодирования при сохранении высокого качества субъективного восприятия звука.

В результате моделирования при высоких качественных показателях скорость цифрового потока относительно наилучшего алгоритма MPEG-2 ААС уменьшилась в 1,2 раза для музыкальных сигналов и в 1,3 раза для широкополосных речевых сигналов.

4. Алгоритм с поблочно плавающей запятой при определенных условиях достаточно чувствителен к прореживанию спектра. Тем не менее, целесообразно изыскание более эффективных алгоритмов кодирования, основанных на использовании аналитического описания кривых маскировки.

ЗАКЛЮЧЕНИЕ

Теоретические и экспериментальные исследования, выполненные в диссертационной работе, позволяют сформулировать следующие основные выводы и результаты:

1. На основе психофизиологических свойств слуха сформулированы требования, позволяющие обоснованно установить ДОП, перспективные для систем высококачественного сжатия цифровой аудиоинформации.

2. Разработан метод оценки распределения ДСО коэффициентов гармонических ДОП в пределах спектральной выборки, позволяющий рационально распределить биты при кодировании сжатого спектра с учетом достаточно высокого качества субъективного восприятия сжатого звука.

3. Получены аналитические выражения для оценки вероятности маскировки коэффициентов гармонических ДОП при различной их интерпретации и использовании всех ветвей кривой маскировки.

4. Разработан алгоритм прореживания спектра, позволяющий за счет изменения D и FA дополнительно повысить эффективность компрессии цифровых аудиоданных в 1,5 раза при достаточно высоком качестве субъективного восприятия сжатого звука.

5. Разработан метод оценки эффективной для прореживания области рабочего диапазона частот, расширяющий перспективу развития новых более эффективных методов кодирования сжатых цифровых аудиоданных.

6. Разработаны методики экспериментальной обработки цифровой аудиоинформации с прореживанием спектра средствами компьютерного моделирования, позволяющие оценить эффективность новых алгоритмов сжатия ЗС.

7. Результаты проведенных исследований могут быть полезны при разработке новых рациональных с точки зрения реализационной сложности и высокоэффективных кодеков для высококачественных систем цифровой обработки и передачи ЗС. Применение их в лабораторных условиях относительно наилучшего алгоритма кодирования MPEG-2 ААС практически при тех же качественных показателях, стандартных параметрах цифровых аудиоданных и без использования дополнительного статистического уплотнения позволило снизить скорость цифрового потока в 1,2 раза.

Библиография Стефанов, Михаил Александрович, диссертация по теме Системы, сети и устройства телекоммуникаций

1. Синильников, A.M. Дифференциальная импульсно-кодовая модуляция с плавающей запятой / A.M. Синильников. //Техника средств связи: Сер. ТРПА. 1983. - Вып. 1. - С. 56-61.

2. Дельта-модуляция / М.Д. Венедиктов и др. М.: Связь, 1976. - 272 с.

3. Харатишвили, Н.Г. Дифференциальная импульсно-кодовая модуляция в системах связи / Н.Г. Харатишвили. М.: Радио и связь, 1982. — 135 с.

4. Свириденко, В.А. Анализ систем со сжатием данных / В.А. Свири-денко. -М.: Связь, 1977. 184 с.

5. Гуревич, В.Э. Импульсно-кодовая модуляция в многоканальной телефонной связи / В.Э. Гуревич, Ю.Г. Лопушнян, Г.В. Рабинович. М.: Связь, 1973.-336 с.

6. Пилипчук, Н.И. Адаптивная импульсно-кодовая модуляция / Н.И. Пилипчук, В.П. Яковлев. М.: Радио и связь, 1986. - 295 с.

7. Сапожков, М.А. Вокодерная связь / М.А. Сапожков, В.Г. Михайлов. М.: Радио и связь, 1983. - 248 с.

8. Грудинин, А.С. Кодирование сигналов звукового вещания в базисе дискретного косинусного преобразования / А.С. Грудинин, A.M. Синильников. // Техника средств связи: Сер. ТРПА. 1986. - Вып. 3. - С. 3-10.

9. Грудинин, А.С. Кодирование звуковых сигналов в спектральной области / А.С. Грудинин, Ю.А. Ковалгин. // Техника кино и телевидения. М.: Искусство, 1987. - №7. - С. 14-19.

10. Ковалгин, Ю.А. Компрессия цифрового звука: психоакустические основы и алгоритмы / Ю.А. Ковалгин. // Звукорежиссер. 2000. - №6. — С. 56-63.

11. Колесников, В.М. Спектральные методы сокращения избыточности высококачественных звуковых сигналов / В.М. Колесников и др. // Радио и телевидение ОИРТ. 1989. - №1. - С. 36-39.

12. Колесников, В.М. Спектральные методы сокращения избыточностивысококачественных звуковых сигналов / В.М. Колесников и др. // Радио и телевидение ОИРТ. 1989. - №2. - С. 35-39.

13. Синильников, A.M. Полосное кодирование звуковых сигналов с ортогональным преобразованием / A.M. Синильников. // Электросвязь. 1991. - №8. - С. 35-37.

14. Розенберг, Е.А. Построение аппаратуры адаптивного кодирования в спектральной области / Е.А. Розенберг, A.M. Синильников, Б.И. Шехтман. // Техника средств связи: Сер. ТРПА. 1989. - Вып. 1. - С. 9-16.

15. Blesser, В.А. Digitization of Audio: A Comprehensive Examination of Theory, Implementation, and Current Practice I B.A. Blesser. // Journal of the Audio Engineering Society. 1987. -№10. - Vol. 26. - P. 739-771.

16. Brandenburg, K. OCF: Coding High Quality Audio with Data Rates of 64 kbit/sec / K. Brandenburg. // Proc. 85th Conv. Aud. Eng. Soc., Preprint #2723. -Mar. 1988.-P. 813-817.

17. Brandenburg, K. ASPEC: Adaptive Spectral Entropy Coding of High Quality Music Signals / K. Brandenburg et. al. // Proc. 90th Conv. Aud. Eng. Soc., Preprint #3011.-Feb. 1991.- 1025-1029.

18. Brandenburg, K. Transform coding of high quality digital audio at low bitrates-algorithms and implementation / K. Brandenburg et. al. // Proc. of the 1990 Int. Conf. on Acoustics, Speech and Signal Processing ICASSP. 1990. - P. 322.2.1-322.2.5.

19. Princen, J. Subband/transform coding using filter bank desingnsbased on time domain aliasing cancellation / J. Princen, A. Johnson, A. Bradley. //Proc. of the 1987 Int. Conf. on Acoustics, Speech and Signal Processing ICASSP. 1987. -P. 2161-2164.

20. Richardson, E.B. Subband coding with adaptive prediction for 56 kbit/sec audio / E.B. Richardson, N.S. Jayant. // IEEE Trans. Acoust., Speech, Signal Processing. April. 1986. - Vol. ASSP-34. - P. 691-696.

21. Smyth, M. APT-X100: A low-delay, low bit-rate, sub-band ADPCM audio-coder for Broadcasting I M. Smyth, S. Smyth. // Proceeding of the 10th International AES Conference. 1991. - P. 41-56.

22. International Standard ISO/IES 11172-3. Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Part 3: Audio. - 1993-08-01.

23. International Standard ISO/IES 13818-3. Information technology-Generic Coding of moving pictures and associated audio information. Part 3: Audio.-1995-05-15.

24. International Standard ISO/IES 13818-7. Information technology-Generic Coding of pictures and associated audio information. Part 7: Advanced Audio Coding (AAC). - 1997(E).

25. ISO/IES FCD 14496-3 Subpart 1. Information Technology-Very Love Bit rate Audio-Visual Coding. Part 3: Audio. - 1998-05-10 (ISO/JTC 1/SC 29, N2203).

26. Digital Audio Compression Standard (AC-3)//Doc. A/52. 1995-12-20.

27. Musman, H.G. Kompressionsalgoritmen fuer interaktive Multimedia-System / H.G. Musman, O. Werner, H. Fuchs. // Informationstechnik und Tech-nische Informatik. 1993. -N2. - S. 4-18.

28. Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов / Ю.А. Ковалгин, Э.И. Вологдин. СПб.: КОРОНА-принт, 2004. - 240 с.

29. ITU-R Recommendation "Method for objective Measurements of Perceived Audio Quality" (Document 10-4/19-E, 19 March 1998).

30. Theile, G. MUSICAM Surround: The universal multi-channel coding system / G. Theile, G. Stoll. // 17. Tonmeistertagung, Karlsruhe, Bericht. 1992. -S. 96-108.

31. Артюшенко, B.M. Цифровое сжатие видеоинформации и звука: учеб. пособие / В.М. Артюшенко, О.И. Шелухин, М.Ю. Афонин; под ред. В.М. Артюшенко. М.: Дашков и К, 2003. - 426 с.

32. Стефанов, М.А. Дискретные ортогональные преобразования как инструмент сжатия звуковых сигналов / М.А. Стефанов, Э.А. Акчурин. / XIV Российская науч. конф.: тез. докладов. Самара, 2007. - С. 147-148.

33. Стефанова, И.А. К выбору ортогональных преобразований для эффективного сжатия звуковых сигналов / И.А. Стефанова. // IX Российская науч. конф.: тез. докладов. Самара, 2002. - С. 133.

34. Цифровое радиовещание / С.Г. Рихтер. М.: Горячая линия - Телеком, 2004.-352 с.

35. Дворецкий, И.М. Цифровая передача сигналов звукового вещания / И.М. Дворецкий, И.Н. Дриацкий. М.: Радио и связь, 1987. - 192 с.

36. Стефанов, A.M. Применение порогового восприятия слухом интенсивности звука в сжатии звуковых сигналов / A.M. Стефанов, И.А. Стефанова. // X Российская науч. конф.: тез. докладов. — Самара, 2003. — С. 188-189.

37. Стефанова, И.А. Оценка допустимой степени округления спектральных компонент звуковых сигналов / И.А. Стефанова. // 6 Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: сб.докладов. Уфа, 2005. - С. 36-38.

38. Цвикер, Э. Фельдкеллер Р. Ухо как приемник информации / Э. Цви-кер, Р. Фельдкеллер; пер. с нем. под ред. Б.Г. Белкина. М.: Связь, 1971. -256 с.

39. Моисеев, М.Н. Кодирование высококачественных звуковых сигналов в частотной области / М.Н. Моисеев, A.M. Синильников. // Электросвязь. 1988. -№8. - С. 34-36.

40. Zwicker, Е. Psychoacoustic / Е. Zwicker. Springier, Verlag, Berlin, Heidelberg, New York, 1982. - 326 p.

41. Стефанова, И.А. О возможности использования эффекта маскировки в сжатии звуковых сигналов / И.А. Стефанова, A.M. Стефанов. // VIII Российская науч. конф.: тез. докладов. Самара, 2001. - Ч. 1. — С.178-179.

42. Zelinsky, R. Adaptive transform coding of speech signal / R. Zelinsky, P. Noll. // IEEE Trans. Commun. 1977. - Vol. ASSP-25, № 4. - P. 1392-1401.

43. Бабуркин, B.M. Электроакустика и радиовещание / B.M. Бабуркин, Г.С. Гензель, Н.Н. Павлов. М.: Связь, 1967. - 312 с.

44. Бернар, Ж. Руководство по записи звука / В.А. Свириденко; пер. с фр. М.: Сов. радио, 1962. - 112 с.

45. CCIR. Document СМТТ. 1974. - N 1059.- Р. 1-29.

46. Ржевкин, С.Н. Некоторые результаты анализа певческого голоса / С.Н. Ржевкин. // Акустический журнал. 1956. — т. 11. — №2. - С. 205-210.

47. Church, S. ISDN and ISO/MPEG Layer III Audio Coding: Powerful

48. New Tools for Broadcast Audio Production / S. Church. //AES an audio engineerthing society preprint. The 95 Convention. New York, 1993. - October. - P. 7-10.

49. Church, S. ISDN and ISO/MPEG Layer III Audio Coding: Powerful New Tools for Broadcast Audio Production / S. Church, B. Grill, H. Popp. // Preprints

50. AES 96th Convention. Amsterdam, 1994. - February, 26-March, 01. - P. 10.

51. Theiie, G. Low bit-rate coding of high-quality audio signals. An introduction to the MASCAM system / G. Theiie, G. Stall, M. Link. // EBU Review-Technical. 1988. -№ 230. - P. 158-181.

52. Thiede, T. Arbeitsweise und Eigenschaften von Verfahren zur Gehoer-richtigen Qualitaetsbewertung von Bitratenreduzierten Audiosignalen / T. Thiede, G. Steinke. // Rundfunktechnische Mitteilungen, Jahrgang 38. 1994. - № 3. - S. 102-114.

53. Wiese, D. Optimierung von Fehlererkennung und verschleierung fur ISO/MPEG/AUDIO Codecs / D. Wiese. // Tonmeistertagung, Karlsruhe, Bericht. 1992.-№ 17.-S. 109-116.

54. Стефанова, И.А. Оптимизация временного параметра эффективности сжатия звуковых сигналов / И.А. Стефанова, М.А. Стефанов. // 6 Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: сб. докладов. Уфа, 2005. - С. 38-40.

55. Банк, М.У. Формирование выборки звукового сигнала при спектральном преобразовании / М.У. Банк, В.А. Сучилин. // Электросвязь. — 1990. -№1.- С. 28-30.

56. Самусев, Р.П. Атлас анатомии человека / Р.П. Самусев, В.Я. Лип-ченко. 5-е изд., перераб. и доп. - М.: ООО «Издательский дом «ОНИКС 21 век»: ООО «Мир и Образование», 2002. - 544 с.

57. Bekesy, G. Uber ein neues Audiometer / G. Bekesy. // AEU. 1947. — No.l.-P. 13.

58. Радиовещание и электроакустика: учеб. пособие для вузов / С.И. Алябьев и др.; под ред. Ю.А. Ковалгина. М.: Радио и связь, 2002. - 798 с.

59. Стефанов, М. А. Эффективные дискретные ортогональные преобразования в компрессии цифровых аудиоданных / М. А. Стефанов. // ИКТ. — 2009. т. - №.-С.-.

60. Loeve, М. Probability Theory / М. Loeve. — Van Nostrand Company Inc., New Jersey, 1955. — 710 p.

61. Andrews, H.C. A Generalized Technique For Spectral Analysis / H.C. Andrews, K.L. Caspari. // IEEE Trans. Computers. 1970. - C-19. - P. 16-25.

62. Cooley, J.W. An Algorithm for the Machine Calculation of Complex Fourier Series / J.W. Cooley, J.W. Tukey. // Mathematics Computation. 1965. -Vol. 19.-P. 297-301.

63. Ahmed, N. Cooley-Tukey type Algorithm for the Haar Transform / N. Ahmed, T. Natarajan, K.R. Rao. II Electronics Letters. 1973. - Vol. 9. - P. 276278.

64. Ahmed, N. Some Considerations of the Modified Walsh-Hadamard and Haar Transforms / N. Ahmed, T. Natarajan, K.R. Rao. // Symposium Applications of Walsh Functions. 1973. -P. 91-95.

65. Haar, A. Zur Theorie der Orthogonalen Funktionensysteme / A. Haar. // Mathematics Analytical. 1910. -No. 69. - P. 331-371.

66. Haar, A. Zur Theorie der Orthogonalen Funktionensysteme / A. Haar. // Mathematics Analytical. 1912. -No. 71. - P. 38-53.

67. Nagy, B.S. Introduction to Real Functions and Orthogonal Expansions / B.S. Naggy. // New York Oxford University Press. 1965.

68. Andrews, H.C. A Generalized Technique For Spectral Analysis / H.C. Andrews, K.L. Caspari. // IEEE Trans. Computers. 1970. - C-19. - P. 16-25.

69. Glassman, J.A. A Generalization of the Fast Fourier Transform / J.A. Glassman. // IEEE Trans. Computers. 1970. - C-19. - P. 105-116.

70. Ahmed, N. On Matrix Partitioning and a Class of Algorithms / N. Ahmed, S.M. Cheng. // IEEE Trans. Education. 1970. - Vol. E-13. - P. 103-105.

71. Pratt, W.K. Hadamard Transform Image Coding / W.K. Pratt, H.C. Andrews. // Proc. IEEE. 1969. - Vol. 57. - P. 58-68.

72. Manz, J.W. A Sequence-Ordered Fast Walsh Transform / J.W. Manz. II IEEE Trans. Audio and Electro Acoustics. 1972. - Vol. AU-20. - P. 204-205.

73. Ohnsorg, F. Binary Fourier Representation / F. Ohnsorg. // Spectrum Analysis Techniques Symp. -20-21 Sept., 1966. P. 60-69.

74. Ahmed, N. Wolsh Functions and Hadamard Transform / N. Ahmed,

75. K.R. Rao. // Wolsh Functions Symposium. Springfield, 1972. - P. 8-13.

76. Harmuth, H.F. Transmission of Information by Orthogonal Functions / H.F. Harmuth. New York, Heidelberg, Berlin: Springer, 1972. - 160 p.

77. Ahmed, N. On Notation and Definition of Terms Related to a Class of Complete Orthogonal Functions / N. Ahmed, H. Schreiber, P. Lopresti. // IEEE Trans. Electromagnetic Compatability. 1973. - Vol. EMC-15. - P. 75-80.

78. Boesswetter, C. Analog Sequence Analysis and Synthesis of Voice Signals / C. Boesswetter. // Walsh Functions Symposium. 1970. - P. 220-229.

79. Robinson, G. Digital Sequence Decomposition of Voice Signals / G. Robinson, S.J. Campanella. // Walsh Functions Symposium. 1970. - P. 230-237.

80. Pratt, W.K. Slant Transforms for Image Coding / W.K. Pratt, L.R. Welch, W.H. Chen. // Symp. Applications of Walsh Functions. 1972. - P. 229234.

81. Chen, W.H. Color Image Coding with the Slant Transform / W.H. Chen, W.K. Pratt. // Symp. Applications of Walsh Functions. 1973. -P. 155-161.

82. Shibata, K. Waveform Analysis of Image Signals by Orthogonal Transformation / K. Shibata. // Symp. Applications of Walsh Functions. 1972. - P. 210-215.

83. Shibata, K. Block Waveform Coding of Image Signals by Orthogonal Transformation / K. Shibata. // Symp. Applications of Walsh Functions. 1973. -P. 137-143.

84. Воробьев, В.И. Теория и практика вейвлет-преобразований / В.И. Воробьев. СПб.: ВУС, 1999. - 202 с.

85. Астафьева, Н.М. Вейвлет-анализ: основы теории и примеры применения / Н.М. Астафьева. // Успехи Физических Наук. 1996. - Т. 166. — № 11. -С. 1145-1170.

86. Переберин, А.В. О систематизации вейвлет-преобразований / А.В. Переберин. // Вычислительные методы и программирование. — 2001. Т. 2. — С.133-158.

87. Поликар, Р. Введение в вейвлет-преобразование / Р. Поликар; пер. сангл. В.Г. Грибунина. СПБ.: АВТЭКС, 2001. - 59 с.

88. Дьяконов, В.П. Вейвлеты. От теории к практике / В.П. Дьяконов. -Изд. 2-е, дополненное и переработанное. М.: Солон-Р, 2004. - 400 с.

89. Новиков, JI.B. Основы вейвлет-анализа сигналов: учеб. пособие / JI.B. Новиков. СПб: ООО «Модус+», 1999. - 208 с.

90. Добеши, И. Десять лекций по вейвлетам / И. Добеши; пер. с англ. Е.В. Мищенко; под ред. А.П. Петухова. М.: РХД, 2001. - 461 с.

91. Чуй, К. Введение в вейвлеты / К. Чуй; пер. с англ. под ред. Я.М. Жилейкина. М.: Мир, 2001. - 412 с.

92. Дремин, И.М. Вейвлеты и их использование / И.М. Дремин, О.В. Иванов, В.А. Нечитайло. // Успехи Физических Наук. 2001. - Т. 171. - № 5. -С. 445-501.

93. Morlet, Jean. Decomposition of Hardy functions into square integrable wavelets of constant shape / Jean Morlet, Alex Grossman. // SIAM Journal of Mathematical Analysis.- 1984.-Vol. 15.-No. 4.-P. 723-736.

94. Van De Villem, Dimitri. Activelets and sparsity: a new way to detect brain activation from fMRI data / Dimitri Van De Ville, Jalal Fadili, Michael Un-ser. // Wavelets XII Conference 6701-Proceedings of SPIE Optics and Photonics,, Volume 6701.-2007.

95. Sardy, Sylvain. AMlet and GAMlet: Automatic Nonlinear Fitting of Additive Models and Generalized Additive Models with Wavelets / Sylvain Sardy, Paul Tseng. // Journal of Computational and Graphical Statistics. 2004.

96. Lian, J. A. Analysis-Ready Multiwavelets (Armlets) for processing scalar-valued signals / J. A. Lian, С. K. Chui. // Signal Processing Letters. 2007. -Vol. 11.-No. 2.-P. 205-208.

97. Erwan, Le Pennec. Image compression with geometrical wavelets / Le Pennec Erwan, Steiphane Mallat. // International Conference on Image Processing (ICIP). Vancouver, 2000. - P. 605-608.

98. Monro, D. M. Orthogonal wavelets with balanced uncertainty / D. M. Monro, В. E. Bassil, G. J. Dickson. // International Conference on Image Processing (ICIP). -1996. P. 581-584.

99. Donoho, David. Beamlets and Multiscale Image Processing / David Donoho, Xiaoming Huo. Stanford, 2001. - 198 p.

100. Meyer, Francis G. Brushlets: a tool for directional image analysis and image compression / Francis G. Meyer, Ronald R. Coifman. // Applied and Computational Harmonic Analysis. -1997. Vol. 4. - P. 147-187.

101. Ron, A. Caplets: wavelets without wavelets / A. Ron. // 29th Annual Spring Lecture Series, Recent Developments in Applied Harmonic Analyis, Multiscale Geometric Analysis. 2004. - P. 55-60.

102. Do, M. N. Contourlets: A Directional Multiresolution Image Representation / M. N. Do, M. Vetterli. // Proc. of IEEE International Conference on Image Processing (ICIP). Rochester, 2002. - P. 433-436.

103. Coifman, R. Noiselets / R. Coifman, F. Geshwind, Y. Meyer. // Appl. Сотр. Harmonic Analysis. 2001. - No. 10. - P. 27-44.

104. Gopinath, Ramesh A. The phaselet transform — an integral redundancy nearly shift-invariant wavelet transform / Ramesh A. Gopinath. 2004.

105. Rajpoot, N. Planelets: A new analysis tool for planar feature extraction / N. Rajpoot, R. Wilson, Zhen Yao. // International Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS). 2004.

106. Goodman, T. N. T. On refinement equations determined by Polya frequency sequence / T. N. T. Goodman, C. A. Micchelli. // SIAM J. Math. Anal. -1997. Vol. 23. - P. 766-784.

107. Refregier, Alexandre. Shapelets: A New Method to Measure Galaxy Shapes / Alexandre Refregier, David Bacon. // Proceedings of the Workshop "The Shapes of Galaxies and their Halos". -Yale, 2001.

108. Clerc, Maureen. The Texture Gradient Equation for recovering Shape from Texture / Maureen Clerc, Stephane Mallat. // IEEE Transactions on Pattern Analysis and Matching Intelligence. 2002. - Vol. 24. - No. 4. - P. 536-549.

109. Величкин, А.И. Теория дискретной передачи непрерывных сообщений / А.И. Величкин. М.: Сов. Радио, 1970. - 296 с.

110. Шитов, А.В. Статистические характеристики сигналов, представляющих натуральные звучания, и их применение при исследовании электроакустических систем / А.В. Шитов, Б.Г. Белкин. // НИКФИ: сб. трудов. -1976.-Вып. 56.-С. 77-174.

111. Кнель, Г.С. Нелинейные искажения сигналов вещания при передаче их способом А-модуляции / Г.С. Кнель, А.К. Оксман, B.C. Пекедов. // Вопросы радиотехники. Сер. ТПС. 1968. - №2. - С. 13-18.

112. Fourier, J. Theorie analytique de la chaleur / J. Fourier. Paris, 1822. —90 s.

113. Снеддон, И. Преобразования Фурье / И. Снеддон. М.: ИЛ, 1955.58 с.

114. Cooley, J. W. The Finite Fourier Transform / J. W. Cooley. // IEEE Trans. Audio and Electroacoustics. 1969. - Vol. AU-17. - P. 77-85.

115. Рабинер, Л. Теория и применение цифровой обработки сигналов / Л. Рабинер, Б. Гоулд; пер. с англ.; под ред. Ю.И. Александрова. М.: Мир, 1978.-540 с.

116. Оппенгейм А.В. Цифровая обработка сигналов / А.В. Оппенгейм, Р.В. Шафер; пер. с англ. под ред. С.Я. Шаца. М.: Связь, 1979. - 416 с.

117. Прудников, А. П. Интегралы и ряды / А. П. Прудников, Ю. А. Брычков, О.И. Маричев. М.: Наука, 1981. - 800 с.

118. Danielson, G.C. Some Improvements in Practical Fourier Analysis and Their Application to X-Ray Scattering From Liquids / G.C. Danielson, C. Lanczos. // J. Frankin Inst. 1937. - Vol. 233 - P. 365-380, 435-452.

119. Goertzel, G. An Algorithm for the Evaluation of Finite Trigonometric Series / G. Goertzel. // Amer. Math. Monthly. 1958. - Vol. 65. - P. 34-35.

120. Голд, Б. Цифровая обработка сигналов / Б. Голд, Ч. Рэйдер; пер. с англ. М.: Сов. радио, 1973. - 368 с.

121. Gentleman, W.M. Fast Fourier Transforms for Fun and Profit / W.M. Gentleman, G. Sande. // AFIPS Conf. Proc. - 1966. - Vol. 29. - P. 563-578.

122. Singleton, R.C. An Algorithm for Computing the Mixed Radix Fast

123. Fourier Transform / R.C. Singleton. // IEEE Trans. Audio Electroacoust. 1969. -Vol. AU-17.-P. 93-103.

124. Bergland, G.D. A Fast Fourier Transform Algorithm Using Base 8 Iterations / G.D. Bergland. // Math. Computation. 1968. - Vol. 22. - P. 275-279.

125. Bergland, G.D. A Guided Tour of the Fast Fourier Transform / G.D. Bergland. // IEEE Spectrum. 1969. - Vol. 6. - P. 41-52.

126. Сергиенко, А.Б. Цифровая обработка сигналов / А.Б. Сергиенко. -СПб: Питер, 2002. 608 с.

127. Айфичер, Э.С. Цифровая обработка сигналов: практический подход / Э.С. Айфичер, Джервис, У. Барри; пер. с англ. М.: Изд. дом «Вильяме», 2004. - 992 с.

128. Hartley, R.V.L. / R.V.L. Hartley. // Proceedings of the IRE. 1942. -Vol. 30.-P. 75-79.

129. Брейсуэлл, P. Преобразование Хартли / P. Брейсуэлл. M.: Мир, 1990.- 176 с.

130. Bracewell, R.N. / R.N. Bracewell. // J. Opt. Soc. Amer. 1983. -Vol.73.-P. 44-47.

131. Брейсуэлл, P.H. / P.H. Брейсуэлл. // ТИИЭР. 1984. - Т. 72. - №8. -С. 97-101.

132. Per, S.C. / S.C. Per, Wul. // Electron. Lett. 1986. - Vol. 22. - №1. -P. 188-190.

133. Злобин, С. JI., Стальной А. Я. Матричный рекуррентный алгоритм быстрого преобразования Хартли с естественным порядком адресации входной и выходной информации / С. Л. Злобин, А. Я. Стальной. // Радиотехника. -2000,-№4.- С. 12-18.

134. Ahmed, N. Discrete Cosine Transform / N. Ahmed, Т. Natarajan, K.R. Rao. // IEEE Trans. Computers. 1974. - Vol. C-23. - P. 90-93.

135. Fike, C.T. Computer Evaluation of Mathematical Functions / C.T. Fike. Englewood Cliffs, N.J.: Prentice Hall, 1968. - 205 s.

136. Кей, C.M. Современные методы спектрального анализа / С.М. Кей.

137. ТИИЭР. 1981. — №11. - С. 5-51.

138. Ахмед, Н. Ортогональные преобразования при обработке цифровых сигналов / Н. Ахмед, К.Р. Рао; пер. с англ. под ред. И.Б. Фоменко. М.: Связь, 1980.-248 с.

139. Bellman, R. Introduction to Matrix Analysis / R. Bellman. New York: McGraw-Hill, I960. - 157 p.

140. Grenander, V. Toeplitz Forms and Their Applications / V. Grenander, G. Szego. Berceley and Los Angeles: University of California Press, 1958. - 95 p.

141. Стефанов, M.A. Оценка допустимой степени округления фазы спектральных компонент звуковых сигналов / М.А. Стефанов. // VII Между-нар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: материалы конференции. Самара, 2006. - С. 171-173.

142. Стефанов, М.А. Особенности округления спектральных компонент звуковых сигналов / М.А. Стефанов. // XV Российская науч. конф.: тез. докладов. Самара, 2008. - С. 185.

143. Richards, D.R. Statistical properties of speech signals / D.R. Richards. // Proc. IEE. 1964. - Vol. 111. - № 5. - P. 941-948.

144. Римский-Корсаков, A.B. Статистические свойства радиовещательного сигнала / A.B. Римский-Корсаков. // Акустический журнал. 1960. - т.6. -Вып. 3.-С. 360-369.

145. Ферсман, Б.А. Экспериментальное исследование статистических свойств музыкальных и речевых радиовещательных сигналов / Б.А. Ферсман. // Акустический журнал. 1957. - №3. - С. 274-281.

146. Горон, И.Е. Радиовещание /И.Е. Горон. М.: Связь, 1979. - 368 с.

147. Стефанов, М.А. Оценка ширины полосы концентрации энергии коэффициентами ДОП / М.А. Стефанов. // IX Междунар. науч.-техн. конф.

148. Проблемы техники и технологий телекоммуникаций»: материалы конференции. Казань, 2008. - С. 140-141.

149. Дрейпер, Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. М.: Финансы и статистика, 1996. - 336 с.

150. Ферстер, Э. Методы корреляционного и регрессионного анализа / Э. Ферстер, Б. Ренц. — М.: Финансы и статистика, 1983. — 302 с.

151. Акчурин, Э. А. Энергетический параметр высококачественной эффективной компрессии цифровых аудиоданных / Э.А. Акчурин, A.M. Стефанов, М. А. Стефанов. // ИКТ. 2009. - т. 7. - № 2. - С. 82-87.

152. Стефанов, М.А. Реализация округления коэффициентов дискретных ортогональных преобразований / М.А. Стефанов, A.M. Стефанов, И.А. Стефанова. // XV Российская науч. конф.: тез. докладов. Самара, 2008. - С. 188.

153. Финк, JT.M. Теория передачи дискретных сообщений / JI.M. Финк. -М.: Сов. радио, 1970. 727 с.154. 101. Гольденберг, JI.M. Цифровая обработка сигналов: справочник / Л.М. Гольденберг, Б.Д. Матюшкин, М.Н. Поляк. М.: Радио и связь, 1985. -457 с.

154. Вентцель, Е.С. Теория вероятностей и ее инженерные приложения / Е.С. Вентцель, Л.А. Овчаров. М.: Наука, 1988. - 480 с.

155. Стефанов, A.M. Эффективное использование интегрирующей способности слуха при цифровой обработки сигналов / A.M. Стефанов, И.А. Стефанова. // 3 Междунар. науч.-техн. конф. «Цифровая обработка сигналов»: сб. докладов. М., 2000. - т. З.-С. 137-141.

156. Стефанова, И.А. Аппроксимация основных характеристик слухового анализатора / И.А. Стефанова. // Акустический журнал. 2003. - т.49. -№ 2. - с. 245-249.

157. Стефанова, И.А. К оценке вероятности маскировки спектральных компонент звуковых сигналов / И.А. Стефанова, A.M. Стефанов. // XVI Российская науч. конф.: материалы конференции. — Самара, 2009. Ч. 2. — С. 8.

158. Музыкальная энциклопедия: в 6 т. / гл. ред. Ю.В. Келдыш. М.: Советская энциклопедия, 1978 - 6 т.

159. Глухов, А.А. Статистические исследования скважности сигналов программ центрального вещания / А.А. Глухов. // Электросвязь. 1972. - № 6.-С. 4-11.

160. Дьяконов, В.П. MATLAB 6.5 SPI/7 + Simulink 5/6. Обработка сигналов и проектирование фильтров. / В.П. Дьяконов. — М.: СОЛОН-Пресс, 2005.-576 с.

161. Черных, И.В. SIMULINK: среда создания инженерных приложений / И.В. Черных; под ред. В.Г. Потемкина. М.: ДИАЛОГ-МИФИ, 2003. -496 с.

162. Стефанов, М.А. К выбору способа нормировки коэффициентов ДОП при цифровой обработке звукового сигнала / М.А. Стефанов. // XVI Российская науч. конф.: тез. докладов. Самара, 2009. - ч.2 - С. 12.

163. Стефанов, М.А. Особенности цифровой обработки звуковых сигналов в системе MATLAB / М.А. Стефанов. // XVI Российская науч. конф.: тез. докладов. Самара, 2009. - ч.2 - С. 13.