автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка новых методов и алгоритмов компьютерной обработки данных при сжатии-восстановлении музыкальных файлов в информационно-телекоммуникационных системах
Автореферат диссертации по теме "Разработка новых методов и алгоритмов компьютерной обработки данных при сжатии-восстановлении музыкальных файлов в информационно-телекоммуникационных системах"
На правах рукописи
и
ЧИЖОВ ИЛЬЯ ИГОРЕВИЧ
Разработка новых методов и алгоритмов компьютерной обработки данных при сжатии-восстановлении музыкальных файлов в информационно-телекоммуникационных системах
по специалыюсга 05.13.01 Системный анализ, управление и обработка информации (информационно-телекоммуникационные системы)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Белгород - 2005
Работа выполнена в Белгородском государственном университете
Научный руководитель: доктор технических наук, профессор
Жиляков Евгений Георгиевич
Официальные оппоненты: доктор технических наук, старший
научный сотрудник Волчков Валерий Павлович
кандидат технических наук, доцент Тубольцев Михаил Федорович
Ведущая организация: ОАО "Центральная телекоммуникационная
компания"
Защита диссертации состоится 15 сентября 2005г. в 16 часов на заседании диссертационного совета Д212.015.04 при Белгородском государственном университете по адресу: 308015, г. Белгород, ул. Победы, 85.
С диссертацией можно ознакомиться в библиотеке Белгородского государственного университета.
Автореферат разослан «12» августа 2005г.
Ученый секретарь диссертационного совета, кандидат физико-математических наук, доцент
С.Е. Савотченко
¿T6S8
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. В настоящее время наблюдается все более интенсивное использование информационно-телекоммуникационных систем для хранения и передачи файлов, содержащих музыкальные данные (музыкальных файлов). По оценкам независимых экспертов порталов www.eManual.ru,www.show.hi-fi.ru,www.my.park.ru и т.д. трафик музыкальных файлов в сети Интернет составляет примерно 1-2*Ю20 байт в год.
Таким образом, возникает проблема уменьшения объемов битовых представлений подобных файлов для снижения сетевого трафика при передаче и объема дискового пространства, необходимого для их хранения. Над уменьшением битового представления музыкальных данных долгое время работает несколько групп исследователей, в результате чего был создан ряд стандартов сжатия музыкальных файлов. Наиболее известными из них являются стандарты MPEG, АС-3, WMA и т.д.
Данные стандарты предполагают уменьшение объема битового представления исходных данных за счет более грубого квантования по уровню и статистического (энтропийного) кодирования.
При выборе метода квантования необходим тщательный анализ воздействия степени его «грубости» (погрешности представления) на качество восприятия звука. Существующие стандарты сжатия музыкальных файлов при выборе шага квантования основываются на так называемой психоакустической модели.
В связи с этим, основным элементом известных процедур сжатия является разделение отрезков исходного сигнала на составляющие, спектры которых сосредоточены в определенных интервалах оси частот. Для реализации этого обычно используются цифровые фильтры с конечной импульсной характеристикой (КИХ-фильтры). При этом для уменьшения количества обрабатываемых в дальнейшем данных осуществляется прореживание выходных последовательностей фильтров, так что при частоте дискретизации fM и ширине подполосы равной Д/", остается каждый М-й дискрет, где M-fRlbf. Например, в стандарте МРЗ выделяют 32 субполосы,
так что остается каждый 32-й отсчет.
Отметим, что в виду неидеальной прямоугольности частотной характеристики КИХ-фильтров, при прореживании возникает искажение, обусловленное наложением частот (элайсинг).
Поэтому, представляется целесообразным разработка метода субполосного представления отрезков сигналов с меньшей погрешностью и исключающего другие трудности применения КИХ-фильтров.
Квантование данных по уровню в существующих системах сжатия применяется либо непосредственно к прореженным выходным последовательностям фильтров, либо к результатам их дискретного косинус-преобразования (ДКП). Чаще всего используется равномерное квантование,
шаг которого в соответствии моделью
переопределяется для каждой из частотных полос. В любом случае при выборе шага квантования предварительно рассчитываются так называемые кривые маскировки с учетом разделения звуков на тональные и шумоподобные.
Отметим, что эти расчеты носят эвристический характер. Поэтому, не ясно какова степень доверия к результатам решающих процедур.
Таким образом, представляется целесообразной разработка метода квантования по уровню, в котором при выборе уровней и шагов квантования и интервалов их действия не используются расчеты на основе эвристических психоакустических моделей, но гарантируется величина относительной погрешности представления исходных данных с помощью квантованных значений.
Основным способом статистического кодирования в существующих процедурах сжатия является код Хаффмана. Вместе с тем известен так называемый метод арифметического кодирования, который теоретически является наилучшим с точки зрения адаптируемости к энтропийным характеристикам кодируемых последовательностей и возможность его использовать целесообразно исследовать.
Таким образом, возрастающая интенсивность использования файлов музыкальных данных позволяет говорить об актуальности разработки новых процедур их сжатия, которые являются более совершенными, чем используемые в настоящее время форматы.
Целью работы является повышение эффективности использования информационно-телекоммуникационных систем для хранения и передачи файлов с музыкальными данными за счет разработки более совершенных процедур их обработки.
Для достижения этой цели на основе анализа состояния вопроса были сформулированы и решены следующие задачи:
1. Разработка новой обратимой процедуры получения субполосного представления конечных отрезков отсчетов (блоков) музыкальных сигналов на основе вычислений для каждой из заданных частотных полос соответствующей последовательности чисел, спектр которой наилучшим в смысле минимума евклидовой нормы погрешности образом аппроксимирует в этой полосе отрезок спектра исходных данных.
2. Разработка субоптимального метода неравномерного квантования отсчетов по уровню, позволяющего при заданной среднеквадратической относительной погрешности представления исходных данных получить наименьшее количество уровней квантования.
3. Разработка и исследование новой процедуры сжатия-восстановления файлов музыкальных данных с применением арифметического кодирования, без использования эвристических
Лс?йхоакусТических моделей.
* ' <
4. Разработка программно-алгоритмической поддержки новой информационной технологии сжатия-восстановления музыкальных файлов. Методы исследований
• Методы системного анализа и синтеза на основе использования вариационных принципов.
• Методы цифровой обработки сигналов.
• Вероятностно-статистическое моделирование.
• Вычислительный эксперимент. Научно-практическая значимость работы. Научная новизна работы заключается:
• В новой обратимой процедуре субполосного представления сигналов, которая является оптимальной в смысле минимума евклидовой нормы погрешности аппроксимации отрезков исходного спектра в заданных частотных полосах.
• В новом методе субоптимального квантования по уровню, который позволяет минимизировать количество уровней квантования при заданной относительной пофешности представления исходных данных при помощи квантованных значений.
• В разработке и исследовании алгоритмов обработки звуковых файлов в задаче их сжатия-восстановления без использования эвристических психоакустических моделей, с применением энтропийного арифметического кодирования.
Практическая значимость диссертационной работы заключается в создании более эффективных методов частотного разделения сигналов и квантования их по уровню, а так же в создании программной поддержки информационной технологии сжатия-восстановления звуковых файлов при передаче их по каналам связи, применение которой позволяет получить степень сжатия в 1,3-1,5 раза выше, чем наиболее часто используемые в настоящее время форматы (МРЗ, OGG, WMA), при той же погрешности воспроизведения исходных данных.
Положения, выносимые на защшу
1. Обратимая оптимальная процедура субполосного представления отрезков сигналов.
2. Алгоритм адаптивного квантования числовых данных в режиме пакетной обработки, который позволяет минимизировать количество уровней квантования при гарантированной относительной погрешности представления исходных данных с помощью квантованных значений.
3. Информационная технология сжатия-восстановления музыкальных файлов без использования эвристических психоакустических моделей, с применением энтропийного арифметического кодирования квантованных по уровню результатов дискретного косинус-преобразования.
4. Программно-алгоритмическая реализация разработанной информационной технологии сжатия-восстановления музыкальных файлов. Достоверность полученных результатов обусловлена корректностью математических выкладок, согласованностью основных теоретических результатов с известными положениями теории цифровой обработки сигналов и результатами достаточно обширных вычислительных экспериментов по тестированию созданных алгоритмов, которые подтверждают непротиворечивость основных теоретических результатов и выводов.
Личный вклад соискателя. Все разделы диссертационной работы выполнены лично автором. Выводы и рекомендации по результатам сформулированы самостоятельно. Разработка вариационных принципов построения методов оптимального частотного разделения и адаптивного квантования сигналов по уровню принадлежит научному руководителю Жилякову Е.Г., который принимал так же участие в обобщениях и интерпретации полученных результатов.
Личный вклад соискателя заключается:
• в разработке и исследования процедуры сжатия-восстановления музыкальных файлов без использования эвристических исихоакустических моделей, с применением энтропийного арифметического кодирования, квантованных по уровню результатов дискретного косинус-преобразования;
• в разработке и исследовании процедур субполосного представления и квантовании сигналов по уровню при блочной обработке данных,
• в создании проекта прототипа программно-алгоритмической реализации разработанной информационной технологии сжатия-восстановления музыкальных файлов, разработке отдельных программных модулей, тестировании и документировании системы в целом.
Апробация работы. Основные результаты работы были предстяьлены на следующих научно-технических конференциях:
• III Международная научно-техническая конференция "Проблемы информатики и моделирования", г.Харьков, 2003г.
• 8-й Международный молодежный форум "Радиоэлектроника и молодежь в 2! веке" г. Харьков, 2004г.
• И-ая международная научно-техническая конференция "Современные инструментальные системы, информационные технологии и инновации" г. Курск, 2004г.
» IV Международная научно-техническая конференция "Проблемы информатики и моделирования", г.Харьков, 2004г.
• Научно-технический семинар "Системы синхронизации, формирования и обработки сигналов для связи и вещания ", г. Самара, 2005г.
Кроме того, созданная информационная технология экспонировалась на межрегиональной специализированной выставке "Эра компьютеров", проводившейся в выставочном зале ВЦ "Белэкспоцентр", г. Белгород, 2005г.
Связь с научно техническими программами. Разработка новой информационной технологии сжатия-восстановления музыкальных файлов частично финансировалась в рамках Государственного контракта № 4591 с Фондом поддержки малых форм предприятий в инновационной сфере при правительстве России в рамках программы "СТАРТ-2004".
Соискатель имел личный двухлетний грант Минобразования России и администрации Белгородской области в 2003-2004 годах на НИР по обработке звуковых файлов.
Публикации. Основные положения работы изложены в 8 печатных работах, из них статей 6.
Объем и структура работы. Диссертация состоит из введения, четырех глав, общих выводов и списка литературы. Работа изложена на 132 страницах машинописного текста, включающего список литературы из 149 наименований.
СОДЕРЖАНИЕ РАБОТЫ
Ведение
Во Введении обосновывается актуальность темы диссертационного исследования и формулируется их цель. Дается общий обзор содержания диссертации. Указывается научная новизна и выносимые на защиту положения. Приводятся сведения о публикациях и апробации результатов работы.
Глава 1. Хранение и передача музыкальных файлов в
информационно - телекоммуникационных системах
В этой главе основное внимание уделено анализу проблем использования информационно-телекоммуникационных систем для хранения и передачи файлов с музыкальными данными.
Приводятся сведения, показывающие, что интенсивность востребованности этой услуги возрастает, причем как со стороны специалистов профессиональной сферы, так и от частных лиц, которые используют музыкальные файлы для прослушивания в обыденной жизни. Основным инструментом обеспечения этих запросов служат компьютерные технологии, в основе которых используются методы цифровой обработки музыкальных сигналов.
Анализируются существующие подходы к созданию файлов музыкальных данных, включая процедуры уменьшения объемов их битовых представлений (сжатия). Основными алгоритмами подобного сжатия на сегодняшний день являются МРЗ, WMA и OGG.
В силу различных причин целесообразно подвергать обработке отдельные отрезки отсчетов музыкальных сигналов, которые в существующих форматах сжатия составляют от 500 до 1200 отсчетов.
На основании проведенного анализа и установленных несовершенств существующих процедур сжатия формулируются конкретные задачи диссертационного исследования, решение которых позволяет повысить эффективность использования информационно-телекоммуникационных систем для хранения и передачи файлов с музыкальными данными (музыкальных файлов).
Глава 2. Субполосное кодирование музыкальных сигналов
Современный подход к сжатию музыкальных файлов заключается в цепочке преобразований данных, которые предусматривают получение более грубого представления отсчётов сигналов либо коэффициентов их преобразования Фурье за счет квантования по уровню и дальнейшее статистическое кодирование с целью уменьшения энтропии получаемых битовых последовательностей.
Основные искажения вносит квантование по уровню, которое является необратимым в смысле невозможности восстановления значений сигнала до квантования. Поэтому, при выборе метода квантования необходим тщательный анализ воздействия степени его «грубости» (погрешности представления) на качество восприятия звука.
Многочисленные исследования, проведенные различными коллективами, показывают, что ухо человека по-разному реагирует на частотный состав звуков. Кроме того, существенное значение имеют так называемые маскировки во временной и частотной областях.
В настоящее время при выборе процедуры квантования ориентируются на различные частотные диапазоны. Это принято называть субполосным кодированием. При этом ориентиром для современных методов квантования по уровню при сжатии музыкальных файлов служат так называемые психоакустические модели восприятия звука, основные положения которых излагаются в разделе 2.1 диссертации.
В разделе 2.2 анализируются проблемы использования цифровых КИХ-фильтров для субполосного разделения музыкальных сигналов.
В разделе 2.3 диссертации исследуется новый метод частотного разделения сигналов на аддитивные составляющие, который имеет ряд преимуществ перед методом КИХ-фильтров и может быть использован для субполосного кодирования. Основная суть метода заключается в следующем.
В дальнейшем для некоторого вектора из вещественнозначных компонент х=(х1,..^сг/у (здесь штрих - символ транспонирования), соответствующей большой буквой обозначается трансформанта Фурье (спектр)
= , (2.1) х, = )х(?)е'м&/2х (2.2)
-X
Пусть далее У = [-У2 -У,]и(У„У2] - объединение соответствующих
интервалов в области определения спектра (нормированной частотной области), причём имеет место 0 < V, < У2 <, я.
Часть нормы (энергии) рассматриваемого вектора, попадающей в эту частотную область, в соответствии с формулой Парсеваля равна
Ху = ¡\Х(у)\2 ёу/2я. (2.3)
«к
Подставляя сюда выражение (2.1), нетрудно получить квадратичную форму
Ху=х'Ах, (2.4)
где А = ал = (5Ь(у2 (к _ /)), Sin(^/l (к - ,"))) / тг(к - /) (2.5)
Линейное частотное разделение исходного вектора /=(/„- >/»)' реализует представление
/ = х+«г, (2.6)
где х = (х,,..,х„У - искомый вектор, который согласно содержательной постановке задачи фильтрации отвечает требованию воспроизведения трансформанты исходного вектора только в интересующем частотном интервале, тогда как вне его в идеальном случае трансформанта искомого вектора должна быть равна нулю.
В соответствии с этим введём функционал
Р(Х,Р)=(\-Р) ¿М2я+Р \\х(у)\г^12я,0<.р<\, (2.7)
тег 1*г
который, очевидно, может служить мерой отклонения от нуля разности трансформант Фурье исходного и вычисляемого вектора в заданном интервале частот и трансформанты искомого вектора вне этого частотного интервала. При этом значение параметра (5 служит в качестве веса, определяющего важность соответствующих компонент отклонений от нуля, а символом Р обозначается трансформанта Фурье вектора /.
Легко показать, что задаче фильтрации отвечает также вариационный принцип
Р(х,Р) = т\п,Ух£1<", (2.8)
который естественно дополнить требованием равенства нормы вычисляемого вектора доле энергии исходной последовательности, попадающей в выбранный частотный интервал
II5 .р, (2.9)
Ясно, что решение вариационной задачи вида (2.8), (2.9) будет зависеть от параметра р, значение которого либо может быть задано из априорных соображений, либо может быть доопределено на основе принципа повторной минимизации функционала (2.7) после решения задачи (2.8), (2.9).
В работе показано, что решение вариационной задачи (2.8), (2.9) может быть представлено в виде
х(Д) = *(Щ+(\-2Р)<*Г'Л/, (2.Ю)
*'(/?)=САЛ/Ц(Д+(1 - тлу аД! , (2.П)
где I - единичная матрица соответствующей размерности. Минимальное значение (2.7), очевидно, равно
P(fl)m =i2{(l-Z, Hfi + (\-2p)z,fz, +/?£c,2(1-z,.)z,2 /(jS + (1 -)2}, (2.12)
причём здесь первая и вторая суммы определяют соответственно величины первого и второго слагаемых в правой части определения (2.7). Именно минимизация по параметру Р правой части этого соотношения с учётом ограничения в определении (2.7) позволяет выбрать его оптимальное значение.
С позиций сжатия данных на основе субполосного кодирования наибольший интерес представляют спектральные свойства вектора
у={у„уг-ущ*\) (2.13)
где
¿=[jt/(v2-v,)];
Л/ = [(ЛГ-1)/£] ^ ' '
квадратная скобка означает операцию взятия целой части числа.
В дальнейшем полагаем, что отношения в скобках являются целыми числами.
В работе рассмотрена задача поиска такого вектора, который удовлетворяет следующему условию оптимальности
и 2 и 2
Ф2 = J/4v)-f>„, е-«"*«г™* dv = mm J F(y)-^w, ■ dv, (2.15)
weF "О «К "O
где минимум ищется по всем векторам w размерности М+1 с вещественными
компонентами, a sign - знаковая функция.
Показано, что оптимальный в этом смысле вектор определяется соотношением
y = LBf , (2.16)
где
В = {Ък4},к = 0Д..АГ;/ = 0,1- JV-1
Г(-1Г5ц(,--уг) + 5ш(у,-0
kL-i (2.17)
Uv2 ~ vi) cos(A£ v, ),i = kL Его представляется естественным называть кодирующим исходные данные в выбранном диапазоне частот.
Пусть теперь выбраны не перекрывающиеся частотные интервалы
Vr = (~v7r ,-vlr) ^ (vlr, V2r ) , (2.18)
причем выполняется условие смежности
— v2S
и равенства
где L - количество этих интервалов. Положим далее
вв=
(2.19)
V,, = гг
(2.20)
1А,
Здесь блок Br,r-\.L представляет собой определяемую соотношениями (2.17) матрицу, вычисляемую для каждого из интервалов вида (2.18).
Пусть далее
уу = (у[,у'г,-&д (2.21)
вектор, состоящий из определяемых соотношением (2.16) подвекторов для тех же диапазонов частот.
Тогда очевидно, что операции частотного разделения (кодирования) получаемых последовательностей во всех выбранных частотных интервалах соответствует вектор
W = LBBf; (222)
Существенным является тот факт, что матрица ВВ является неособенной, так что справедливо обратное представление
f = BB-'w>L ■ (2.23)
Иными словами, исходный вектор может быть восстановлен на основе всех кодированных данных, удовлетворяющим условиям вида (2.15).
Таким образом, процедура вычислений субполосного представления исходных отрезков отсчетов сигналов на основе (2.22) является не только оптимальной в смысле принципа (2.15), но и обратимой.
Если кодированные данные подвергались промежуточным необратимым искажениям, например квантованию по уровню, то при восстановлении исходного вектора будет иметь место погрешность
s=BB~'ijlL, (2.24)
где ff - погрешность, связанная с неточностью представления вектора прореженных данных уу.
Очевидно, что получающаяся при этом среднеквадратическая погрешность
Р1 =М[Щ2]=М[т}т(ВВ-'У BB-'ijyü, (225)
во многом будет определяться обусловленностью матрицы ВВ. В следующем разделе будет приведен пример обработки отрезка музыкального сигнала, который свидетельствует об устойчивости операции восстановления вида (2.23) к квантованию по уровню компонент вектора уу.
С целью сопоставления уровней евклидовых погрешностей, которые возникают при предлагаемом подходе к субполосному представлению и при использовании КИХ-фильтров, были проведены вычислительные эксперименты с различными отрезками музыкальных сигналов.
При этом использовалось разбиение оси частот на интервалы равной длинны, так что
Lr = const = L = 22,
что соответствует разбиению, применяемому в стандарте МРЗ.
Результаты нескольких экспериментов приведены в диссертации. Они не противоречат утверждению (2.15), причем в нескольких случаях предлагаемый подход позволяет почти вдвое уменьшить погрешность аппроксимации спектра исходного вектора с помощью данных вида (2.16) по сравнению с прореженными выходными последовательностями КИХ-фильтров, с импульсной характеристикой длиной 1024 отсчета.
Глава 3. Квантование данных по уровню при сжатии музыкальных
файлов
В разделе 3.1 диссертации рассмотрены основные методы квантования по уровню отсчетов музыкального сигнала, такие как равномерное и неравномерное квантование.
Далее, в разделе 3.2, рассмотрены вопросы, связанные с квантованием по уровню на основе использования психоакустической модели, применяемым при субполосном кодировании музыкальных сигналов.
Раздел 3.3 посвящен изложению нового метода субоптимального квантования по уровню, который развит в данной работе.
Определение: квантователем по уровню значений некоторой последовательности X, принято называть операцию замены ее другой последовательностью х' согласно правила: если выполняется неравенство
Ьк<х,<Ьм, 1 = 0,1,2..., (3.1)
то полагается
х',=рк, к = ЧХ—,М-\, (3.2)
где
Ь^х,<Ьи (3.3)
- интервалы Dk=[bk,bkt,) разбивают область значений и, обычно, удовлетворяют условию
P*eDk=>At+l<;/>4<6t (3.4)
Здесь имеется в виду, что область значений х, конечна.
Построение процедуры квантования заключается в выборе значений bt ирк, к = 0,\..М-1.
Ясно, что при этом следует руководствоваться некоторыми принципами, которые соответствуют представлениям об оптимальности подхода.
Отметим, что операция квантования по уровню имеет широкое применение в задачах сокращения избыточности данных, особенно при их передаче по каналам связи.
В известном подходе к этой проблеме, изложенном в работе Тихонова В.И. Статистическая радиотехника М.: Радио и связь, 1982г., количество уровней квантования предполагается фиксированным, а в качестве критерия используется погрешность квантования
ь,
где со О)- функция плотности вероятностей (ФПВ), количество уровней М определено заранее, а е2 должно быть минимизировано.
В данной работе разработан метод синтеза такого квантователя, чтобы в смысле выполнения неравенства
Ч
е21Цх1\^8\ Е[*!] = (3.6)
6.
где 8 - допустимая величина, уровень относительной погрешности представления исходных данных, гарантировалось как можно меньшее количество уровней квантования.
Используемая в работе процедура вычислений позволяет для частного случая учета погрешностей получить наименьшее количество уровней. Однако отсутствие доказательства достижения глобального минимума позволяет только говорить о субоптимальности подхода. Положим
9к = ('' [х-рк]2а)(х)(1х, (3.7)
так что (3.5) можно переписать в виде
е-=±<рк. (3.8)
о
Легко получить
Ф» *
так что при
Ля^хшДОс/«,, (3.9)
г„ = ^'(о{х)с1х, (3.10)
функционал (3.7) достигает минимума, который равен
ФГ ~ л ]'«>(*)& = ^хМх)<1х-1лр\. (3.11)
Очевидно, что при этом из представления (3.8) можно получить соотношение, которое при фиксированных границах интервалов квантования
(3.12)
определяет минимум погрешности квантования
= ["SeKxXIx-ZzbPl = . (3.13)
^ »=0 »-0
Непосредственное использование этого соотношения позволило бы
получить оптимальное решение, но это приводит к трудоемким
вычислениям. Поэтому предлагается использовать дополнительные условия.
Для построения процедуры определения границ интервалов (3.12),
используя определения (3.5) и (3.11), представим (3.6) в виде
(3.14)
где
S2t = ^x26tx)dx , (3.15)
S2 = frx2<a(x)dx = Е[дг2].
Если теперь потребовать выполнения равенства относительных погрешностей на каждом из искомых интервалов в виде условия
то из (3.14) нетрудно получить неравенство для этой погрешности
f<62. (3.17)
Таким образом, получаем условие для выбора границ интервалов квантования
"J {x-pjatx)<f^''x2a(x)dx, (3.18)
где предполагается использование представлений (3.9).
Это неравенство и определение (3.9) являются основными при выборе Ьк,к-0,1 .М. Ясно, что (3.18) можно преобразовать к более удобному для вычислений виду
(1 -f)Sl<zlP2t, (3.19)
где S; определено в (3.15).
Очевидно, что если левая граница k-того интервала известна, то вычисление правой сводятся к определению согласно (3.9) и (3.15) значений ptuS2k, где Ьы должен быть выбран наибольшим, из удовлетворяющих неравенству (3.19).
Выше предполагалось, что нижняя граница области значений исходной последовательности Ь„ известна. Поэтому описанная процедура синтеза квантователя может быть реализована.
Очевидно, что при дополнительном условии (3.16) предложенная процедура позволяет вычислить наименьшее количество границ и уровней квантования, использование которых гарантирует относительную погрешность представления исходных данных в смысле выполнения неравенства (3.6).
Вместе с тем отметим, что эти расчеты можно осуществить только при известной функции плотности вероятности, неточное знание которой уже не гарантирует оптимальности.
Кроме того, с помощью единой функции плотности вероятности нельзя адекватно описать данные музыкальных файлов в целом, так как в виду наличия различных партий вокала и музыкальных инструментов музыкальные сигналы будут нестационарными. Поэтому целесообразно, воспользовавшись изложенными выше теоретическими результатами, построить процедуру, которая позволяет для каждого отрезка музыкального сигнала вычислять свои границы и уровни квантования, использование которых гарантируют уровень относительной погрешности
£г/Щ±8г , (3.20)
где 5 = (дг,, ,хм)'-отрезок обрабатываемого при сжатии сигнала;
(3.21)
х -соответствующий отрезок получаемых квантованных значений.
Такая процедура построена. Её обоснование и описание приводиться в
диссертации.
Очевидно, что этот метод квантования является адаптивным.
Были проведены различные вычислительные эксперименты, целью которых являлось сравнение с наиболее известными процедурами квантования: равномерное, А-закон и ц-закон.
В процессе экспериментов определялось количество уровней квантования при одной и той же относительной погрешности представления данных. Квантованию подвергались данные музыкальных файлов, которые в исходном виде кодировались 16 разрядами. Некоторые результаты приведены в диссертации.
Здесь отметим только, что разработанный подход к квантованию по уровню позволяет получить на порядок меньше уровней при той же погрешности представления, что и равномерный и в 3-5 раз меньше чем при использовании А и ц-закона.
С целью оценки устойчивости, основанной на соотношении (2.23) процедуры восстановления исходных отрезков музыкальных сигналов к погрешности квантования по уровню результатов дискретного косинус-преобразования компонент вектора вида (2.22) был проведен ряд вычислительных экспериментов по обработке музыкальных данных в соответствии с принципами субполосного кодирования.
Ниже приводятся результаты некоторых экспериментов, при проведении которых осуществлялось следующее.
Для отрезков музыкальных сигналов длиной 512 отсчетов применялось преобразование вида (2.22).
Далее для каждого из отрезков из 16 значений (которые соответствуют одному из частотных интервалов) вычислялись ДКП, которые затем квантовались по уровню так, чтобы погрешность квантования не превышала заданного значения.
Квантованные значения прореженных данных использовались в правой части соотношения (2.23) для восстановления исходных данных.
Далее вычислялось усредненное по всем отрезкам значение относительной погрешности
(3-37)
где М1 - количество обрабатываемых отрезков (векторов /Д а -результат восстановления.
В таблице 2 приведены результаты обработки одного из файлов, когда М1-1000. Легко видеть, что операция вида (2.23) является устойчивой к погрешностям квантования по уровню.
Таблица 2
Относительная среднеквадратическая погрешность квантования исходных данных при восстановлении Относительная среднеквадратическая погрешность восстановления
Адаптивное квантование Равномерное квантование
Погрешность квантования -0,01 Весь отрезок 0,00958 0,00961
Сублолосное разделение 0,00282 0,00573
Погрешность квантования -0,05 Веся, отрезок 0,05575 0,05612
Субполосное разделение 0,02225 0,03135
Погрешность квантования ~0,1 Весь отрезок 0,10965 0,11713
Субполосное разделение 0,05211 0,06259
Аналогичный вывод следует из анализа результатов обработки других файлов, (порядка 100 файлов) с иным разбиением оси частот.
Отметим, что такая устойчивость к погрешности квантования является следствием достаточно большого определителя матриц вида (2.20).
Глава 4. Разработка новой процедуры обработки данных при сжатии-восстановлении музыкальных файлов
Разработанные в главах 2 и 3 алгоритмы частотного разделения сигналов и квантования по уровню являются оптимальными. Поэтому их целесообразно использовать вместо применяемых в настоящее время при субполосном кодировании.
Вместе с тем, в работе изучена возможность построения информационной технологии сжатия-восстановления музыкальных файлов, в которой не используются эвристические психоакустические модели, что позволяет отказаться и от процедуры субполосного разделения сигнала. Данный подход обусловлен рядом факторов:
1. Субполосное разделение применяется в стандартах MPEG Layer 1 и MPEG Layer 2, являющихся предшественниками стандарта MPEG Layer 3 или сокращенно МРЗ. Принципиальным отличием стандартов
MPEG Layer 1 и MPEG Layer 2 от МРЗ, является их работа с отсчетами звукового сигнала во временной области, в то время когда в MPEG Layer 3 обработка осуществляется в спектральной области. Прочие этапы обработки сигнала у данных стандартов достаточно схожи. Таким образом, можно говорить о том, что применение субполосного разделения в формате МРЗ в значительной мере обусловлено требованьями стандарта MPEG.
2. Как показано в главах 2 и 3 применение субполосного разделения с последующим прореживанием и квантованием по уровню коэффициентов ДКП (или значений сигнала) ведет к появлению дополнительной погрешности обратного восстановления. Таким образом, отказ от применения субполосного разделения может позволить повысить точность представления исходных аудиоданных квантованными значениями.
3. Эффективность статистических методов кодирования (применение которых является заключительным этапом любой процедуры сжатия музыкальных файлов) выше на более длинных отрезках. Таким образом, сжимая одну последовательность длиной 512 отсчетов, можно получить меньший объем битового представления, чем у суммы 32 сжатых последовательностей по 16 дискретов, т.е. эффективнее сжимать сразу весь обрабатываемый отрезок, чем каждую из субполос отдельно.
4. Применение адаптивного квантования при субполосном кодировании может оказаться малоэффективным в связи с необходимостью передачи дополнительной служебной информации (например, значений уровней квантования, минимального и максимального чисел в интервале и т.д.) по каждой из субполос (например, по 32 в формате МРЗ), тогда как при обработке всего интервала подобный набор служебной информации только один.
Эти причины позволяют предположить, что отказ от применения психоакустической модели способен повысить эффективность сжатия музыкальных файлов без потери качества воспроизведения. Для проверки данного предположения был разработан прототип программной поддержки новой информационной технологии сжатия-восстановления музыкальных файлов. Указанная информационная технология состоит из несколько этапов:
1. Дискретное косинус-преобразование (ДКП) всего обрабатываемого отрезка;
Переход из временной области в частотную целесообразен, так как большое количество коэффициентов ДКП, особенно высокочастотных может бьггь равен нулю. Таким образом, подобный переход уменьшает энтропию исходной последовательности отсчетов музыкального сигнала.
2. Адаптивное квантование по уровню коэффициентов косинус-преобразования;
В исходной звуковой последовательности каждый отсчет кодируется при помощи 16 или 24 бит. С точки зрения восприятия звука человеческим ухом, во многих случаях столь точное представление не является необходимым. Вследствие этого, при сжатии музыкальных данных прибегают к более грубому представлению аудиоданных. Степень подобной "грубости" определяется задаваемой пользователем погрешностью представления исходных данных квантованными значениями.
3. Сжатие квантованных значений при помощи арифметического кодера.
Арифметический метод сжатия данных разрабатывался как развитие идеи кода Хаффмана, что позволяет данному методу показывать более высокую степень сжатия по сравнению с другими методами сжатия данных без потерь. Тот факт, что во всех известных на сегодняшний день алгоритмах сжатия музыкальных файлов используется метод Хаффмана объясняется существованием патентов, ограничивавших до недавнего времени использование арифметического кодера и значительной стандартизованностью (в первую очередь в выборе таблиц Хаффмана) современных алгоритмов сжатия музыкальных файлов с потерями. В ходе исследований статистических свойств дискретизованных значений звукового сигнала была
экспериментально установлена возможность аппроксимации на основе функции распределения вероятности Коши. Данная модификация метода сжатия, позволила значительно повысить его эффективность для пакетной передачи данных.
Длина обрабатываемого блока избрана равной 512 отсчетам, исходя из следующих обстоятельств:
• для выполнения быстрого косинус-преобразования (БКП) необходимо, чтобы длина отрезка была равна целой степени двойки;
• музыкальный сигнал нестационарен, поэтому целесообразно использовать достаточно короткие интервалы.
Программная поддержка указанной информационной технологии реализована в виде пакета прикладных программ, включающих в себе программу для перевода файлов формата WAV в формат ZPC и обратно, получившую название "Кодер" и программную поддержку воспроизведения звука - "Плеер". Стоит отметить, что формат записи полученных в ходе сжатия аудиоданных существенно отличается от имеющихся в настоящее время аналогов, что позволяет говорить о новом формате записи звуковых файлов.
Программная реализация рассмотренных выше алгоритмов выполнена на ЭВМ класса IBM PC для платформы Windows NT (и выше) на языке С++.
Реализация программной поддержки для IBM PC достаточно обоснованна, т.к. по оценкам независимых экспертов ЭВМ данного типа составляют 85-90% парка персональных компьютеров в мире.
Области применения программного комплекса:
• Передача аудиоданных по каналам Интернет в пакетном режиме.
• Хранение и воспроизведение звуковых файлов на локальной машине. Программный продукт выполняет следующие функции:
1. Сжатие исходных аудиоданных, представленных в формате WAV с различными стандартными битрейтами - эту функцию выполняет программа кодер;
Кратко напомним, что битрейтом называют количество бит необходимое для кодирования секунды записи мультимедиа потока. Единицей измерения данной величины является "килобит в секунду", т.е. кбит/с. Как уже отмечалось выше, типичными (или стандартными) битрейтами являются 32 кбит/с, 64 кбит/с, 128 кбит/с, 256 кбит/с, 320 кбит/с. Не сложно заключить, что с повышением битрейта качество воспроизведения аудиозаписи возрастает. В течение длительного времени стандартным считался битрейт 128 кбит/с. Однако в настоящее время все активнее стал использоваться битрейт 256 кбит/с, что обусловлено возросшими вычислительными возможностями персональных компьютеров, и в первую очередь, многократным увеличением доступного пользователю дискового пространства. Важным аспектом является то, что указанные битрейты используются не только в формате МРЗ, но и во всех известных на сегодняшний день форматах сжатия аудиоданных с потерями, что можно рассматривать как положительный факт, в смысле простоты сравнения результатов получаемых различными кодерами.
2. Восстановление и воспроизведение звукового файла, сохраненного в формате ZPC в пакетном режиме - выполняется плеером;
В ходе выполнения данной работы был проведен ряд вычислительных экспериментов, некоторые результаты которых представлены в диссертации. В качестве исходных сигналов, были выбраны различные музыкальные композиции (около 650 файлов), отобранные из возможных вариантов по методу квотируемой выборки.
Эксперимент состоял из нескольких этапов:
1. Сжатие исходного сигнала по технслс! ии МРЗ (кодек LAME 2005 года) с указанным в таблице битрейтом;
Файлы сжимались с наиболее типичными на сегодняшний день битрейтами: 64 кбит/с, 128 кбиг/с и 256 кбит/с,
2. Восстановление исходного сигнала из .шрЗ файла;
3. Определение относительной среднеквадратической погрешности представления исходных данных восстановленными значениями;
4. Квантование спектральных коэффициентов исходного сигнала с относительной погрешностью равной вычисленной с последующим арифметическим сжатием и записью в ZPC-файл;
5. Расчет степени сжатия для каждого из форматов;
Степень сжатия представляет собой отношение исходного объема файла к объему файла после сжатия.
6. Вычисление отношения объема МРЗ к объему ZPC.
Результаты данных экспериментов показывают, что при сжатии всех рассмотренных файлов, на любых битрейтах степень сжатия предлагаемого алгоритма в 1,3-1,5 раза выше, чем у формата МРЗ при равной погрешности представления исходных данных.
Стоит отметить, что в стандарте МРЗ вся служебная информация (номер квантователя, количество кодируемых полос, номер таблицы Хаффмана и т.д.) стандартизована в виде таблиц, что позволяет получать дополнительное сжатие за счет передачи не самих значений, а их кодов. Предложенный в работе прототип программной поддержки новой информационной технологии сжатия-восстановления музыкальных файлов нуждается в доработке до коммерческой версии. Одним из основных направлений доработки является создание таблиц служебной информации, как это сделано в стандарте МРЗ. Таким образом, существует путь для повышения степени сжатия достигаемой данной информационной технологией.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Разработана новая обратимая процедура субполосного представления отрезков сигналов, оптимальная в смысле минимума евклидовой нормы погрешности аппроксимации отрезков исходного спектра в заданных частотных полосах. Её применение при субполосном кодировании музыкальных сигналов позволяет с точки зрения погрешности построить более совершенную процедуру, чем кодирование с использованием прореженных выходных последовательностей КИХ-фильтров.
2. Разработан субоптимальный адаптивный метод квантования по уровню, позволяющий минимизировать количество уровней квантования при гарантированной погрешности представления исходных данных квантованными значениями. Вычислительные эксперименты показали, что количество уровней квантования по сравнению с равномерным квантованием может быть меньше в 10 раз.
3. С помощью вычислительных экспериментов обоснована возможность построения процедуры сжатия-восстановления звуковых файлов без использования эвристических психоакустических моделей, включая субполосное кодирование. Использование при этом разработанного метода квантования до определенной степени позволяет учесть особенности восприятия звука слуховым аппаратом человека.
4. Для повышения степени сжатия статистическое кодирование квантованных данных реализовано с помощью энтропийного арифметического кодера. Показано, что использование аппроксимации на основе распределения Коши позволяет существенно повысить степень сжатия и практически достичь потенциального предела сжатия, определяемого энтропией исходных данных.
5. Разработана информационная технология сжатия-восстановления музыкальных файлов.
6. Создана программно-алгоритмическая поддержка разработанной информационной технологии сжатия-восстановления музыкальных файлов.
7. Тестовые испытания показали, что применение данной программно-алгоритмической поддержки позволяет получить степень сжатия в 1,31,5 раза выше, чем наиболее часто используемые в настоящее время форматы (МРЗ, OGG, WMA), при той же погрешности представления исходных данных.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Жиляков, Е.Г. О дифференцировании, интерполяции, экстраполяции и фильтрации дискретных сигналов / Е.Г. Жиляков, И.Г. Попов, И.И. Чижов // Научные ведомости Белгородского государственного университета, -Белгород, 2004. - С. 3-15.
2. Жиляков, Е.Г. О субполосном кодировании сигнала / Е.Г. Жиляков, И .Г. Попов, И.И. Чижов // Вестник НТУ "ХПИ": сб. науч. тр. Темат. вып. "Информатика и моделирование". - Харьков, 2004. - № 46. - С. 10-20.
3. Жиляков, Е.Г. Оптимальный синтез квантователя по уровню / Е.Г. Жиляков, И.Г. Попов, И.И. Чижов // Вестник НТУ "ХПИ" : сб. науч. тр. Темат. вып. "Информатикаимоделирование".-Харьков,2004.-№46.-С. 101-106.
4. Чижов, И.И. О сжатии аудиоданных / И.И. Чижов // Современные инструментальные системы, информационные технологии и инновации : материалы II междунар. науч.-технической конф. - Курск, 2004. - С. 11-15.
5. Чижов, И.И. Об обратимом сжатии аудиоданных / И.И. Чижов // Радиоэлектроника и молодежь в 21 веке : тез. докл. 8-го междунар. молодежного форума. - Харьков, 2004. - С. 74.
6. Чижов, И.И. Синтезатор речевых сигналов в среде Интернет / И.И. Чижов // Вестник НТУ "ХПИ": сб. науч. тр. Темат. вып. "Информатикаи моделирование". - Харьков, 2003. - № 26. - С. 45-52.
7. Жиляков, Е.Г. Программный комплекс сжатия-восстановления звуковых файлов при передаче по каналам Интернет / Е.Г. Жиляков, И.Г. Попов, И.И. Чижов. - М.: ВНТИЦ, 2005. - № 50200500162.
8. Жиляков, Е.Г. Об оптимальном частотном разделении коротких реализаций дискретных сигналов / Е.Г. Жиляков, И.И. Чижов // Системы синхронизации, формирования и обработки сигналов для связи и вещания : сб. материалов науч .-тех нич. семинара. - Самара, 2005. - С. 66-67.
Подписано в печать 19 07.2005. Формат 60x84/16. Гарнитура Times. Усл. п л 1,11 Заказ № 137. Тираж 100 экз Оригинал-макет подготовлен и тиражирован в издательстве Белгородского государственного университета 308015 г Белгород, ул Победы, 85
РНБ Русский фонд
2006-4 15688
Оглавление автор диссертации — кандидата технических наук Чижов, Илья Игоревич
Введение. к
Глава 1. Хранение и передача музыкальных файлов в информационно телекоммуникационных системах. Слф 1.1 Создание музыкальных файлов.
1.2 Хранение и передача музыкальных файлов.
1.3 Основные подходы к сжатию музыкальных файлов.
1.4 Задачи исследования.
Глава 2. Субполосное кодирование музыкальных сигналов.
2.1 Основные элементы психоакустической модели восприятия звука.
2.2 Субполосное преобразование музыкальных сигналов с помощью цифровых фильтров.
2.3 Разработка новой обратимой процедуры субполосного преобразования музыкальных сигналов.
2.4 Вычислительные эксперименты.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Чижов, Илья Игоревич
В настоящее время во всем мире получила значительное распространение процедура передачи и хранения сжатых музыкальных файлов. Их используют в своей работе владельцы студий звукозаписи, музыкальных сайтов, профессиональные музыканты и звукорежиссеры, а также пользователи, использующие музыкальные композиции для частного прослушивания.
Музыкальные файлы представляют собой результаты регистрации колебаний электрического тока на выходе микрофона, на мембрану которого воздействует музыкальная композиция. Частота дискретизации для файлов подобного типа не может быть менее 44100 Гц, что соответствует спектру от 0 до 22050 Гц. Для кодирования каждого отсчета дискретного сигнала используется от 16 до 24 бит. Учитывая, что среднее время исполнения музыкальной композиции равно 3 мин, то несложно подсчитать ее объем - 30 Мб. Принимая во внимание тот факт, что скорость передачи данных по сети Интернет редко превышает 20 кб в секунду, то время скачивания одной песни может составлять 1500 с. или 25 минут. Таким образом, возникает проблема уменьшения объема битового представления подобных файлов для снижения сетевого трафика при передаче и объема дискового пространства необходимого для хранения последних. Над уменьшением битового представления музыкальных данных долгое время работает несколько групп исследователей, в результате чего был создан ряд стандартов. Наиболее известными из них являются стандарты MPEG, АС-3, WMA и т.д.
Данные стандарты предполагают уменьшение объема битового представления исходных данных за счет более грубого квантования по уровню и статистического (энтропийного) сжатия.
Квантование по уровню является необратимой операцией, т.е. будут потери, следовательно, нужно аккуратно подойти к выбору процедуры квантования (включая шаг квантования). Следует иметь в виду, что при выборе процедуры квантования целесообразно достигать меньшей энтропии полученной последовательности, т.к. от этого зависит эффективность статистического кодирования. Существующие стандарты при выборе шага квантования основываются на так называемой психоакустической модели, а именно учитывается избирательность человеческого слуха к различным частотным диапазонам и явление маскировок более сильным звуком более слабого и частотной составляющей с большей интенсивностью частотной составляющей с меньшей интенсивностью, если они попадают в один и тот же частотный диапазон.
В связи с этим, основным элементом процедуры сжатия является разделение исходного сигнала на составляющие спектры которых сосредоточены в разных интервалах оси частот. Для реализации этого используются цифровые КИХ-фильтры. При этом для уменьшения количества обрабатываемых в дальнейшем данных осуществляется прореживание выходной последовательности фильтров, так что при ширина подполосы равной А/, остается каждый М-й отсчет М = /д/ Af. В стандарте МРЗ выделяют 32 субполосы, так что остается каждый 32-й элемент.
Отметим, что в виду неидеальной прямоугольности КИХ-фильтра, при прореживании возникает искажение обусловленное наложением частот (элайсинг). В существующей теории частотного анализа-синтеза показано, что совместная обработка специального вида выходных прореженных данных всех полос позволяет в восстановленном сигнале компенсировать элайсинг. Однако, в каждой из полос сохраняется погрешность вызванная им, а квантование данных по уровню исключает возможность компенсировать элайсинг даже при совместной обработке.
Таким образом, представляется целесообразным разработка метода субполосного представления в меньшей степени подверженного влиянию элайсинга и исключающего другие трудности применения КИХ-фильтров, как то необходимость дополнения обрабатываемого интервала, просачивание из др. интервалов и т.д.
Квантование данных по уровню в существующих системах сжатия применяется либо непосредственно к выходным прореженным последовательностям фильтров, либо к результатам их МДКП. Применяется равномерное квантование, шаг которого определяется частотной полосой. В любом случае при выборе шага квантования предварительно рассчитываются так называемые кривые маскировки с учетом разделения звуков на тональные и шумоподобные.
Отметим, что эти расчеты носят эвристический характер то же самое можно говорить и о выборе порогов для процедуры принятия решений. Иными словами, не ясно какова степень доверия к результатам решающих процедур. При этом некоторые значения отсчетов, признаваемые слишком малыми, могут подвергнуться обнулению, что может привести к необоснованной потере информации.
Таким образом, представляется целесообразным разработка метода квантования по уровню, в котором при выборе уровней и шагов квантования не используется эвристические расчеты на основе психоакустической модели, но гарантируется погрешность цифрового представления данных.
Кроме того, очевидно, что отказ от использования психоакустической модели позволяет отказаться от процедуры частотного разделения.
Основным способом статистического кодирования в существующих процедурах сжатия является код Хаффмана. Вместе с тем известен так называемый метод арифметического кодирования, который теоретически является наилучшим с точки зрения адаптируемости к энтропийным характеристикам кодируемых последовательностей.
Целью работы является повышение эффективности использования информационно-телекоммуникационных систем для хранения и передачи файлов с музыкальными данными за счет разработки более совершенных процедур их обработки.
Для достижения этой цели на основе анализа состояния вопроса были сформулированы и решены следующие задачи:
1. Разработка новой обратимой процедуры получения субполосного представления конечных отрезков отсчетов (блоков) музыкальных сигналов на основе вычислений для каждой из заданных частотных полос соответствующей последовательности чисел, спектр которой наилучшим в смысле минимума евклидовой нормы погрешности образом аппроксимирует в этой полосе отрезок спектра исходных данных.
2. Разработка субоптимального метода неравномерного квантования отсчетов по уровню, позволяющего при заданной среднеквадратической относительной погрешности представления исходных данных получить наименьшее количество уровней квантования.
3. Разработка и исследование новой процедуры сжатия-восстановления файлов музыкальных данных с применением арифметического кодирования, без использования эвристических психоакустических моделей.
4. Разработка программно-алгоритмической поддержки новой информационной технологии сжатия-восстановления музыкальных файлов.
Методы исследований:
• Методы системного анализа и синтеза на основе использования вариационных принципов.
• Методы цифровой обработки сигналов.
• Вероятностно-статистическое моделирование.
• Вычислительный эксперимент. СОДЕРЖАНИЕ РАБОТЫ
Диссертация состоит из Введения, четырех глав, Заключения и Приложения, в котором приведены документы, подтверждающие внедрение результатов работы.
Заключение диссертация на тему "Разработка новых методов и алгоритмов компьютерной обработки данных при сжатии-восстановлении музыкальных файлов в информационно-телекоммуникационных системах"
4.5 Основные результаты и выводы главы
1. Разработана процедура сжатия-восстановления звуковых файлов без использования эвристических психоакустических моделей и субполосного кодирования. Указанная процедура состоит из нескольких этапов:
• Дискретное косинус-преобразование всего обрабатываемого блока музыкального сигнала (длина блока составляет 512 отсчетов);
• Адаптивное квантование по уровню полученных спектральных коэффициентов с заданной относительной погрешностью;
• Сжатие квантованной последовательности на основе арифметического метода статистического кодирования с адаптацией к характеристикам последовательности.
Новизна разработанной процедуры сжатия-восстановления музыкальных файлов заключается:
• В отказе от использования психоакустических моделей и субполосного кодирования, и как следствие - обработка всего блока отсчетов музыкального сигнала (512 отсчетов) одновременно;
• В использовании субоптимального адаптивного метода квантования по уровню;
• В разработке и применении арифметического кодера учитывающего статистические свойства отсчетов музыкального сигнала.
2. Разработан прототип программно-алгоритмической поддержки предлагаемой процедуры сжатия-восстановления музыкальных файлов состоящий из двух модулей:
• конвертора - позволяющего переводить WAV файлы в новый формат и обратно;
• плеера — позволяющего воспроизводить в пакетном режиме музыкальные произведения на основе запакованных данных без создания WAV файла.
Прототип программно-алгоритмической поддержки предлагаемой процедуры сжатия-восстановления музыкальных файлов выполнен на ЭВМ класса IBM PC для платформы Windows NT (и выше) на языке С++. Воспроизведение звука осуществляется с помощью процедур библиотеки DirectX. Минимальными требованьями к аппаратной части компьютера являются: процессор класса Пентиум-3 и 10 Мб свободного дискового пространства для хранения программных модулей и временного файла используемого системой при сжатии музыкального файла. Общий объем исполняемых модулей - 1 Мб.
Указанный прототип программной поддержки имеет дружественный интерфейс интуитивно понятный, в том числе начинающему пользователю.
Тестовые испытания показали, что применение данной программно-алгоритмической поддержки позволяет получить степень сжатия в 1,3-1,5 раза выше, чем наиболее часто используемые в настоящее время форматы (МРЗ, OGG, WMA), при той же погрешности представления исходных данных, либо почти двукратное уменьшение погрешности представления исходных данных при той же самой степени сжатия. На указанную информационную технологию сжатия-восстановления музыкальных файлов получено свидетельство о регистрации в Отраслевом фонде алгоритмов и программ (№ регистрации: 4314) и в Национальном фонде неопубликованных документов (№ государственной регистрации: 50200500162). Копии свидетельств о регистрации содержаться в Приложении.
Заключение
В ходе выполнения диссертационного исследования были получены следующие результаты:
1. Разработана новая обратимая процедура субполосного представления отрезков сигналов, оптимальная в смысле минимума евклидовой нормы погрешности аппроксимации отрезков исходного спектра в заданных частотных полосах. Её применение при субполосном кодировании музыкальных сигналов позволяет с точки зрения погрешности построить более совершенную процедуру, чем кодирование с использованием прореженных выходных последовательностей КИХ-фильтров.
2. Разработан субоптимальный адаптивный метод квантования по уровню, позволяющий минимизировать количество уровней квантования при гарантированной погрешности представления исходных данных квантованными значениями. Вычислительные эксперименты показали, что количество уровней квантования по сравнению с равномерным квантованием может быть меньше в 10 раз.
3. С помощью вычислительных экспериментов обоснована возможность построения процедуры сжатия-восстановления звуковых файлов без использования эвристических психоакустических моделей, включая субполосное кодирование. Использование при этом разработанного метода квантования до определенной степени позволяет учесть особенности восприятия звука слуховым аппаратом человека.
4. Для повышения степени сжатия статистическое кодирование квантованных данных реализовано с помощью энтропийного арифметического кодера. Показано, что использование аппроксимации на основе распределения Коши позволяет существенно повысить степень сжатия и практически достичь потенциального предела сжатия, определяемого энтропией исходных данных.
5. Разработана информационная технология сжатия-восстановления музыкальных файлов.
6. Создана программно-алгоритмическая поддержка разработанной информационной технологии сжатия-восстановления музыкальных файлов.
7. Тестовые испытания показали, что применение данной программно-алгоритмической поддержки позволяет получить степень сжатия в 1,3-1,5 раза выше, чем наиболее часто используемые в настоящее время форматы (МРЗ, OGG, WMA), при той же погрешности представления исходных данных.
Библиография Чижов, Илья Игоревич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Адаптивные фильтры Текст. : пер. с англ. / под ред. К. Ф. Н. Коуэна, П. М. Гранта. - М. : Мир, 1988. - 392 с.: ил.
2. Алябьев, С. И. Цифровая передача и обработка сигналов ЗВ в трактах формирования и первичного распределения программ Текст. : учеб. пособие / С. И. Алябьев, В. А. Воднев, О. Б. Попов. М. : Изд-во Моск. ин-та связи, 1989. - 82 с.
3. Антонью, А. Цифровые фильтры: анализ и проектирование Текст. /
4. A. Антонью ; пер. с англ.: В. А. Лексаченко, В. Г. Челпанова ; под ред. С. А. Понырко. М. : Радио и связь, 1983. - 320 с. : ил.
5. Артюшенко, В. М. Цифровое сжатие видеоинформации и звука Текст. : учеб. пособие / В. М. Артюшенко, О. И. Шелухин, М. Ю. Афонин ; под ред. В. М. Артюшенко. М. : Дашков и К, 2003.-426 с.
6. Архангельский, А. Я. Программирование в С++ Builder 6 Текст. / А. Я. Архангельский. -М. : БИНОМ, 2003.- 1152 с.
7. Ахмед, Н. Ортогональные преобразования при обработке цифровых сигналов Текст. / Н. Ахмед, К. Р. Рао ; пер. с англ. Т. Э. Кренкеля. М. : Связь, 1980. - 248 с. : ил.
8. Банк, М. У. Формирование выборки звукового сигнала при спектральном преобразовании Текст. / М. У. Банк, В. А. Сучилин // Электросвязь. 1990. - № 1. -С. 28-30.
9. Банкет, В. J1. Цифровые методы в спутниковой связи Текст. / В. J1. Банкет, В. М. Дорофеев. М.: Радио и связь, 1988. - 240 с. : ил.
10. Баранов, J1. А. Квантование по уровню и временная дискретизация в цифровых системах управления Текст. / J1. А. Баранов. М.: Энергоатомиздат, 1990. - 304 с.
11. Берестецкий, А. А. Адаптивное взвешивание в задаче сжатия цифрового звукового сигнала Текст. / А. А. Берестецкий, О. А Климова, А. Н. Синильников // Известия вузов. Радиоэлектроника. 1990. - № 12. - С. 7-12.
12. Блейхут, Р. Быстрые алгоритмы цифровой обработки сигналов Текст. / Р. Блейхут ; пер. с англ. И. И. Грушко. М. : Мир, 1989. - 448 с. : ил.
13. Вайдьнатхан, П. П. Цифровые фильтры, блоки фильтров и полифазные цепи с многочастотной дискретизацией Текст. : метод, обзор / П. П. Вайдьнатхан // ТИИЭР. — 1990. Т. 78, № 3. - С. 77-120.
14. Ванштейн, J1. А. Выделение сигналов на фоне случайных помех Текст. / JT. А. Ванштейн,
15. B. Д. Зубаков. М.: Сов. радио, 1960. - 447 с.
16. Венгеров, А. А. Прикладные вопросы оптимальной линейной фильтрации Текст. / А. А. Венгеров, В. И. Щаранский. М.: Энергоатомиздат, 1982. - 387 с.: ил.
17. Витерби, Э. Д. Принципы цифровой связи и кодирования Текст. / А. Д. Витерби, Дж. К. Омура ; пер. с англ. и под ред. К. Ш. Зигангирова. М. : Радио и связь, 1982. - 536 с. : ил. -(Статистическая теория связи ; вып. 18).
18. Витязев, В. В. Цифровая частотная селекция сигналов Текст. / В. В. Витязев. — М. : Радио и связь, 1993.-239 с. : ил.
19. Воеводин, В. В. Вычислительные основы линейной алгебры Текст. / В. В. Воеводин. М. : Наука, 1977.-304 с.
20. Воеводин, В. В. Матрицы и вычисления Текст. / В. В. Воеводин, Ю. А. Кузнецов. М. : Наука, 1984.-318 с.
21. Воеводин, В. В. Вычислительные процессы с теплицевыми матрицами Текст. / В. В. Воеводин, Е. Е. Тыртышников. М.: Наука, 1987. - 319 с. : ил.
22. Вологдин, Э. И. Аналоговая и цифровая звукозапись Текст. / Э. И. Вологдин. СПб. : СТ «Факультет ДВО», 2004. - 52 с.
23. Вологдин, Э. И. Слух и восприятие звука Текст. : учеб. пособие / Э. И. Вологдин. СПб. : СТ «Факультет ДВО», 2004. - 52 с.
24. Воробьев, В. И. Теория и практика вейвлет-преобразования Текст. / В. И. Воробьев, В.Г. Грибунин. СПб. : Изд-во ВУС, 1999. - 204 с.
25. Гантмахер, Ф. Р. Теория матриц Текст. / Ф. Р. Гантмахер. 3-е изд. - М. : Наука, 1967. -575 с. : ил.
26. Гельфонд, А. О. Исчисление конечных разностей Текст. : учеб. пособие / А. О. Гельфонд. 3-е изд., испр. - М. : Наука, 1967. - 375 с.: ил.
27. Голд, Б. Цифровая обработка сигналов Текст. : пер. с англ. / Б. Голд, Ч. Рейдер. М. : Сов. радио, 1973.-376 с.
28. Гольденберг, JI. М. Цифровая обработка сигналов Текст. : учеб. пособие / JI. М. Гольденберг, Б. Д. Матюшкин, М. Н. Поляк. 2-е изд., перераб. и доп. - М. : Радио и связь, 1990. -256 с. : ил.
29. Гольденберг, Л. М. Цифровая обработка сигналов Текст. : справочник / JI. М. Гольденберг, Б. Д. Матюшкин, М. Н. Поляк. М. : Радио и связь, 1985. - 308 с.
30. Гоноровский, И. С. Радиотехнические цепи и сигналы Текст. : учеб. пособие / И. С. Гоноровский, М. П. Демин. 5-е изд., перераб. и доп. - М. : Радио и связь, 1994. - 481 с. : ил.
31. Грудинин, А. С. Кодирование сигналов звукового вещания в базисе дискретного косинусного преобразования Текст. / А. С. Грудинин, А. М. Синильников // Техника средств связи. 1986. - Вып. 3. - С. 3-10. - (Сер. ТРПА).
32. Гутников, В. С. Фильтрация измерительных сигналов Текст. / В. С. Гутников. М. : Энергоатомиздат, 1990. - 192 с.: ил.
33. Даджион, Д. Цифровая обработка многомерных сигналов Текст. : пер. с англ. / Д. Даджион, Р. Мерсеро. М. : Мир, 1988. - 488 с. : ил.
34. Дворецкий, И. М. Цифровая передача сигналов звукового вещания Текст. / И. М. Дворецкий, И. Н. Дриацкий. М. : Радио и связь, 1987 - 192 с. : ил.
35. Еремеев, В. П. Модификации полифазных фильтров Текст. / В. П. Еремеев, Э. В. Матросов // Цифровая обработка сигналов и ее применение : докл. 3-й Междунар. конф. DSPA-2000. М., 2000. - Т. 3. - С. 203-211.
36. Ефимов, В. М. Об оценке корреляционной функции шума квантования по уровню Текст. / В. М. Ефимов // Автометрия. 1968. - № 3. - С. 96-98.
37. Жиляков, Е. Г. Некоторые вопросы статистической теории квантования по уровню Текст. / Е. Г. Жиляков // Специализированные вычислительные устройства и их применение. -Киев, 1981.-С. 33-34.
38. Жиляков, Е. Г. О субполосном кодировании сигнала Текст. / Е. Г. Жиляков, И. Г. Попов, И. И. Чижов // Вестник НТУ (ХПИ) : сб. науч. тр. Харьков, 2004. -№ 46. - С. 10-20. - (Тем. вып. «Информатика и моделирование»).
39. Жиляков, Е. Г. Оптимальный синтез квантователя по уровню Текст. / Е. Г. Жиляков, И. Г. Попов, И. И. Чижов // Вестник НТУ (ХПИ): сб. науч. тр. Харьков, 2004. - № 46. - С. 101-106. - (Тем. вып. «Информатика и моделирование»).
40. Жиляков, Е. Г. О точности прогноза квантованного по уровню процесса авторегрессии Текст. / Е. Г. Жиляков, А. Я. Шпильберг // Электрические цепи, сигналы, системы : сб. науч. тр. Киев, 1979. - С. 90-96.
41. Зайцев, А. А. Методы и цифровые устройства сжатия телеметрической информации в системах сбора и передачи геофизических данных Текст. : автореф. дис. . канд. техн. наук : 05.13.05 / А. А. Зайцев ; Рязан. гос. радиотехн. акад. — Рязань, 2003. 17 с.
42. Звуковое вещание Текст. : справочник / А. В. Выходец, П. М. Жмурин, И. Ф. Зорин и др.; под ред. Ю. А. Ковалгина. М. : Радио и связь, 1993. - 464 с. : ил.
43. Кадач, А. В. Эффективные алгоритмы неиекажающего сжатия текстовой информации Текст. : автореф. дис. . канд. физ.-мат. наук : 05.13.11 / А. В. Кадач ; Ин-т систем информатики. Новосибирск, 1998. - 19 с.
44. Каппелини, В. Цифровые фильтры и их применение Текст. / В. Каппелини, А. Дж. Константинидис, П. Д. Эмилиани ; пер. с англ. В. Н. Елисеева ; под ред. Н. Н. Слепова. -М.: Энегроатомиздат, 1983. 360 с.
45. Кейнон, Дж. Пространственно-временной спектральный анализ с высоким разрешением Текст. / Дж. Кейнон // ТИИЭР. 1969. - Т. 57, № 8. - С. 69-79.
46. Кендалл, М. Дж. Многомерный статистический анализ и временные ряды Текст. / М. Дж. Кендалл, А. Стьюарт ; пер. с англ.: Э. Л. Пресмана, В. И. Ротаря ; под ред. А. Н. Комогорова. М.: Наука, 1976. - 736 с.
47. Ковалгин, Ю. А. Алгоритмы компрессии цифровых аудиоданных Текст. / Ю. А. Ковалгин // Системы и средства связи, телевидения и радиовещания. 2000. — № 3. -С. 17-29.
48. Ковалгин, Ю. А. Компрессия цифрового звука: психоакустичестические основы и алгоритмы Текст. / Ю. А. Ковалгин // Звукорежиссер. 2000. - № 6. - С. 56-63.
49. Ковалгин, Ю. А. Стереофония Текст. / Ю. А. Ковалгин. М. : Радио и связь, 1989. -272 с. : ил.
50. Ковалгин, Ю. А. Формат Dolby АС-3. Алгоритмы компрессии цифровых аудиоданных Текст. : ч. 1 / Ю. А. Ковалгин // Звукорежиссер. 2001. - № 3. - С. 68-73.
51. Ковалгин, Ю. А. Формат Dolby АС-3. Алгоритмы компрессии цифровых аудиоданных Текст. : ч. 2 / Ю. А. Ковалгин // Звукорежиссер. 2001. - № 4. - С. 66-69.
52. Ковалгин, Ю. А. Цифровые системы радиовещания и звукосопровождения телевидения Текст. : ч. 2 / Ю. А. Ковалгин // Broadcasting : Телевидение и радиовещание. 2002. — №4.-С. 60-63.
53. Ковалгин, Ю. А. Цифровые системы радиовещания и звукосопровождения телевидения Текст. : ч. 3 / Ю. А. Ковалгин // Broadcasting : Телевидение и радиовещание. 2002. -№ 6. - С. 82-87.
54. Ковалгин, Ю. А. Цифровое кодирование звуковых сигналов : учеб. пособие Текст. / Ю. А. Ковалгин, Э. И. Вологдин. СПб.: КОРОНА-принт, 2004. - 240 с.
55. Козюренко, Ю. И. Высококачественное звуковоспроизведение Текст. / Ю. И. Козюренко. М. : Радио и связь, 1993. - 144 с. : ил. - (Массовая радиобиблиотека ; вып. 1191).
56. Корн, Г. Моделирование случайных процессов на аналоговых и аналого-цифровых машинах Текст. / Г. Корн ; пер. с англ.: Е. В. Доброва, И. Б. Гуревича ; под ред. В. П. Яковлева. М. : Мир, 1968. - 315 с. : ил.
57. Корнейчук, Н. П. Экстремальные свойства полиномов и сплайнов Текст. / Н. П. Корнейчук, В. Ф. Бабенко, А. А. Лигун. Киев : Наук, думка, 1992. - 304 с.
58. Косякин, А. А. Статистическая теория квантования по уровню Текст. / А. А. Косякин // Автоматика и телемеханика. — 1961. № 6. — С. 722-729.
59. Кочетков, М. Е. Компрессия цифровых изображений с использованием векторного квантования в области дискретных ортогональных преобразований Текст. : дис. . канд. техн. наук : 05.13.01 / М. Е. Кочетков. М., 1999. - 191 с.: ил.
60. Крошьер, Р. Е. Интерполяция и децимация цифровых сигналов Текст. : метод, обзор / Р. Е. Крошьер, Л. Р. Рабинер // ТИИЭР. 1981. - Т. 69, № 3. - С. 14-40.
61. Куприянов, М. С. Цифровая обработка сигналов: процессоры, алгоритмы, средства проектирования Текст. / М. С. Куприянов, Б. Д. Матюшкин. СПб. : Политехника, 1998. -592 с.
62. Лагода, Д. П. Метод синтеза цифровых фильтров с конечной импульсной характеристикой Текст. / Д. П. Лагода, Е. Г. Жиляков // Функционально-ориентированные вычислительные системы : тез. докл. науч-техн. конф. Харьков, 1990. - С. 71-72.
63. Ланнэ, А. А. Передача информации о состоянии фильтра-предсказателя с помощью спектральных пар Текст. / А. А. Ланнэ, Д. А. Улахович // Радиоэлектроника и связь. -1991. -№1.- С. 43-47.
64. Ланцош, К. Практические методы прикладного анализа Текст. : справ, рук. / К. Ланцош ; пер. с англ. М. 3. Кайнера. М. : Физматгиз, 1961. - 524 с.
65. Мак-Кракен, Д. Численные методы и программирование на Фортране Текст. / Д. Мак-Кракен, У. Дорн ; пер. с англ. Б. Н. Казака ; под ред. и с доп. Б. М. Наймарка. -2-е изд., стереотип. М. : Мир, 1977. - 584 с. : ил.
66. Макс, Ж. Методы и техника обработки сигналов при физических измерениях Текст. : в 2-х т. / Ж. Макс ; пер. с фр. Ю. В. Пяткова ; под ред. Н. Г. Волкова. М. : Мир, 1983. - Т. 2. Техника обработки сигналов. Применения. Новые методы. - 256 с. : ил.
67. Марпл, С. Л. Цифровой спектральный анализ и его приложения Текст. / С. Л. Марпл ; пер. с англ.: О. И. Хабарова, Г. А. Сидоровой ; под ред. И. С. Рыжака. М. : Мир, 1990. - 584 с. : ил.
68. Методы сжатия данных: устройство архиваторов, сжатие изображений и видео Текст. / Д. Ватолин, А. Ратушняк, М. Смирнов, В. Юкин. М. : ДИАЛОГ-МИФИ, 2003. - 384 с.
69. Мишенков, С. Л. Сертификация услуг звукового вещания Текст. : учеб. пособие / С. Л. Мишенков, С. Г. Рихтер, В. И. Прилипко. М. : Изд-во Моск. техн. ин-та связи и информатики, 1997.-63 с.
70. Моисеев, М. Н. К вопросу о выборе интервала анализа при кодировании звуковых сигналов в частотной области Текст. / М. Н. Моисеев // Техника средств связи. 1989. - Вып. 2. - С. 51-57. - (Сер. ТРПА).
71. Моисеев, М. Н. Кодирование высококачественных звуковых сигналов в частотной области Текст. / М. Н. Моисеев, А. Н. Синильников // Электросвязь. 1988. - № 9. — С. 34-36.
72. Назаров, М. В. Методы цифровой обработки и передачи речевых сигналов Текст. / М. В. Назаров, Ю. Н. Прохоров. М. : Радио и связь, 1985. - 176 с.: ил.
73. Никольский, С. М. Квадратурные формулы Текст. / С. М. Никольский. М. : Наука, 1988.- 256 с. : ил.
74. Нуссбаумер, Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток Текст. / Г. Нуссбаумер ; ред.: В. М. Амербаев, Т. Э. Кренкель ; пер. с англ.: Ю. Ф. Касимов, И. П. Пчелинцев. М. : Радио и связь, 1985. - 248 с. : ил., табл., граф.
75. Оберхеттингер, Ф. Преобразование Фурье распределений и их обращения Текст. : табл. / Ф. Оберхеттингер ; пер. с англ. М. С. Никулина. М.: Наука, 1979. - 248 с.
76. Оппенгейм, А. Цифровая обработка сигналов = Digital signal processing / Текст. / А. Оппенгейм, Р. Шафер ; ред. С. Я. Шац ; пер. с англ.: В. А. Лексаченко, В. Г. Челпанов. -М.: Связь, 1979. -416с.: рис.
77. Основы цифровой обработки сигналов Текст. : курс лекций : учеб. пособие / А. И. Солонина, Д. А. Улахович, С. М. Арбузов и др. СПб. : БХВ-Петербург, 2003. - 608 с. : ил.- (Учеб. пособие).
78. Применение цифровой обработки сигналов Текст. / С. Л. Фрини, Дж. Ф. Кайзер, X. С. Макдональд и др. ; пер. с англ. А. М. Рязанцева ; под ред. Э. Оппенгейма. М. : Мир, 1980.- 552 с.
79. Попов, О. Б. К вопросу формирования объективной оценки качества звучания по субъективным критериям Текст. / О. Б. Попов, С. Г. Рихтер // Тез. докл. науч.-техн. конф. / МТУ СИ. М., 1997. - С. 143-144.
80. Пытьев, Ю. П. Методы анализа и интерпретации эксперимента Текст. / Ю. П. Пытьев. — М.: Изд-во Моск. гос. ун-та, 1990. 286 с.
81. Рабинер, Л. Р. Теория и применение цифровой обработки сигналов Текст. / Л. Рабинер, Г. Гоулд ; пер. с англ. А. Л. Зайцева ; под ред. Ю. Н. Александрова. М. : Мир, 1978. — 848 с. : ил.
82. Радиовещание и электроакустика Текст. : учеб. пособие для вузов / С. И. Алябьев, А. В. Выходец, Р. Гермер и др.; под ред. Ю. А. Ковалгина. М. : Радио и связь, 2002. - 798 с.
83. Радченко, М. Ю. Исследование алгоритмов сжатия, обработки и восстановления сигналов и изображений Текст. : дис. . канд. физ.-мат. наук : 01.04.03 / М. Ю. Радченко ; Воронеж, гос. ун-т. Воронеж, 2000. - 143 с.: ил., табл.
84. Ратушняк, О. А. Методы сжатия данных без потерь с помощью сортировки параллельных блоков Текст. : дис. . канд. физ.-мат. наук : 05.13.11 / О. А. Ратушняк. Новосибирск, 2002. - 87 с.
85. Рихтер, С. Г. Об энергетическом выигрыше за счет естественной избыточности цифровых сигналов ЗВ Текст. / С. Г. Рихтер // Электросвязь. 1998. - № 5. - С. 28-30.
86. Розенберг, Е. А. Построение аппаратуры адаптивного кодирования спектральной области Текст. / Е. А. Розенберг, А. М. Синильников, Б. И. Шехтман // Техника средств связи. — 1989. Вып. 1. - С. 9-16. - (Сер. ТРПА).
87. Саванов, В. JI. Влияние квантования на точность вычисления моментов случайных величин Текст. / В. Л. Саванов // Автоматика и телемеханика. 1972. - № 10. — С. 74-81.
88. Сборник научных программ на Фортране Текст. : рук. для программиста / пер. с англ. С. Я. Виленкина. М.: Статистика, 1974. - Вып. 1. Статистика : Нью-Йорк, 1960-1970. — 316 с. : ил.; Вып. 2. Матричная алгебра и линейная алгебра. - 223 с.
89. Сергиенко, А. Б. Цифровая обработка сигналов Текст. : учеб. пособие для студ. вузов / А. Б. Сергиенко. СПб.: Питер, 2002. - 603с.: ил. - (Учебник для вузов).
90. Синильников, А. М. Полосное кодирование звуковых сигналов с ортогональным преобразованием Текст. / А. М. Синильников // Электросвязь. 1991. - № 8. - С. 35-37.
91. Синильников, А. М. Цифровое радиовещание Текст. / А. М. Синильников // Техника средств связи. — 1993. Спец. вып. - С. 37-56. - (Сер. ТРПА).
92. Смирнов, В. И. Курс высшей математики Текст. : учеб. пособие для мех.-мат. и физ.-мат. фак. ун-тов : в 5-ти т. / В. И. Смирнов. 6-е изд., перераб. и доп. - М. : Наука, 1974. — Т. 4, ч. 1.-336 с.
93. Солонина, А. И. Алгоритмы и процессоры обработки сигналов Текст. : учеб. пособие / А. И. Солонина, Д. А. Улахович, Л. Яковлев. СПб. : БХВ-Петербург, 2001. - 464 с. : ил., табл., схем.
94. Спектральные методы сокращения избыточности высококачественных звуковых сигналов Текст. / В. М. Колесников, М. У. Банк, А. М. Синильников, В. А. Сучилин // Радио и телевидение ОИРТ. 1989. -№ 1. - С. 36 - 39 ; № 2. - С. 35 - 39.
95. Титчмарш, Е. Введение в теорию интеграла Фурье Текст. / Е. Титчмарш ; пер. с англ. Д. А. Райкова. М.; Л. : ОГИЗ : Гостехиздат, 1948. - 479 с.
96. Тихонов, В. И. Статистическая радиотехника Текст. / В. И. Тихонов. 2-е изд., перераб. и доп. - М.: Радио и связь, 1982. - 624 с.: ил.
97. Тихонов, В. И. Оптимальный прием сигналов Текст. / В. И. Тихонов. М. : Сов. радио, 1983.-320 с. : ил.
98. Толстов, Г. П. Ряды Фурье Текст. / Г. П. Толстов. 3-е изд., испр. - М. : Наука, 1980. - 382 с. : ил. — (Физ.-мат. б-ка инженера).
99. Уидроу, Б. Адаптивная обработка сигналов Текст. : пер. с англ. / Б. Уидроу, С. Стирнз. -М. : Радио и связь, 1989. 440 с. : ил.
100. Фалькович, С. У. Оптимальный прием пространственно-временных сигналов в радиоканалах с рассеянием Текст. / С. У. Фалысович, В. И. Пономарев, Ю. В. Шкварко ; под ред. С. Е. Фалысовича. М.: Радио и связь, 1989. - 295 с. : ил.
101. Френке, Л. Теория сигналов Текст. / JI. Френке ; пер. с англ.: М. Р. Краевской, Р. М. Седлецкого ; под ред. Д. Е. Вакмана. М. : Сов. радио, 1974. - 343 с. : ил.
102. Хургин, Я. И. Финитные функции в физике и технике Текст. / Я. И. Хургин, В. П. Яковлев. М. : Наука, 1971. - 408 с. : ил.
103. Цвикер, Э. Ухо как приемник информации Текст. / Э. Цвикер, Р. Фельдкельлер ; пер. с нем. и под общ. ред. Б. Г. Белкина. 2-е изд., доп. и перераб. - М. : Связь, 1971. - 256 с. : ил.
104. Цикин, И. А. Дискретно-аналоговая обработка сигналов Текст. / И. А. Цикин. М. : Радио и связь, 1982. - 161 с. : ил.
105. Цифровая и вычислительная техника Текст. : учеб. для вузов / Э. В. Евреинов, Ю. Т. Бутыльский, И. А. Мамзелев и др. ; под ред. Э. В. Евреинова. М. : Радио и связь, 1991.-464 с. : ил.
106. Чижов, И. И. О сжатии аудиоданных Текст. / И. И. Чижов // Современные инструментальные системы, информационные технологии и инновации : Материалы II Междунар. науч.-техн. конф. Курск, 2004. - С. 11-15.
107. Чижов, И. И. Об обратимом сжатии аудиоданных Текст. / И. И. Чижов // Радиоэлектроника и молодежь в 21 веке : тез. докл. 8-го Междунар. молод, форума. — Харьков, 2004. С. 74.
108. Чижов, И. И. Синтезатор речевых сигналов в среде Интернет Текст. / И. И. Чижов // Вестник НТУ (ХПИ) : сб. науч. тр. Харьков, 2003. - № 26. - С. 45-52. - (Тем. вып. «Информатика и моделирование»).
109. Шеломов, Е. А. Эффективность оптимальных фильтров Винера Текст. / Е. А. Шеломов, Е. Г. Жиляков // Компьютерные методы в теории и технике информационных систем : тез. докл. Всесоюз. науч.-техн. конф. Харьков, 1991. - С. 63-64.
110. Шелухин, О. И. Цифровая обработка и передача речи Текст. / О. И. Шелухин, Н. Ф. Лукъянцев ; под ред. О. И. Шелухина. М. : Радио и связь, 2000. - 456 с.
111. Blessen, В. An inrestigation of quantization noise Text. / B. Blessen // S. Andto Bng. Soc. — 1974. Vol. 22, № 1. - P. 20-22.
112. Blesser, B. A. Digitization of Audio Text. : A Comprehensive Examination of Theory, Implementation, and Current Practice / B. A. Blesser // Journal of the Audio Engineering Society. -1987.-Vol. 26, №10.-P. 739-771.
113. Brandenburg, K. OCF: Coding High Quality Audio with Data Rates if 64kbit/sec Text. / K. Brandenburg // Proc.85th Conf. Aud. Ehg. Soc. 1988. - Mar.
114. Brandenburg, K. ASPEC: Adaptive Spectral Entropy Coding if High Quality Music Signals Text. / K. Brandenburg et. al. // Proc. 90th Conf. Aud. Ehg. Soc. 1991. - Feb.
115. Brandenburg, K. Second Generation Perceptual Audio Coding: The Hybrid Coder Text. / K. Brandenburg, J. D. Jonston // In. Proc. ICASSP-90. 1990. - May. - P. 1109-1112.
116. Church, S. ISDN and ISO/MPEG Layer 111. Audio Coding: Powerful New Tools for Broadcast Audio Production Text. : The 95th Convention / S. Church // AES an audio engineering society. -New-York, 1993. October. - P. 7-10.
117. Church, S. ISDN and ISO/MPEG Layer 111. Audio Coding: Powerful New Tools for Broadcast Audio Production Text. : The 96th Convention / S. Church, B. Grill, H. Popp // AES. -Amsterdam, 1994. 26 February-1 March. - P. 10.
118. Digital Audio Compression Standard (AC-3) Electronic resource. : 1995-12-20 : Revision A/52 / Advanced Television Systems Committee. Access mode: http://www-koi.compression.ru/download/audio.html.
119. Eberlein, E. MPEG-Audio-Layer 111 System Text. / E. Eberlein // 17 Tonmeistertagung : Bericht. - Karlsruhe, 1992. - S. 60-70.
120. Fielder, L. D. AC-1: A Family of Low complexity Transform-Based Music Coders Text. / L. D. Fielder, G. A. Davidson // Proceedings of the 10th International AES Conference. 1991. - P. 5770.
121. Freyer, U. DAB-Digitaler Hhoerfunk Text. / U. Freyer. Berlin: Verlag Technik GmBH, 1997. -132 s.
122. Goldstein Lawrens, N. Quantization error and step-size distributions in ADPCM. Text. / N. Goldstein Lawrens // IEEE Trans In for Theory. 1977. - Vol. 23, № 2. - P. 216-223.
123. Johnston, J. D. Estimation of Perceptual Entropy Using Noise Criteria Text. / J. D. Johnston // IEEE Transactions on Communications. 1988. - № 9. - P. 2524-2527.
124. Johnston, J. D. Transform Coding of Audio Signals Using Perceptual Noise Criteria Text. / J. D. Johnston // IEEE J. Sel. Areas in Comm. 1988. - Feb. - P. 314-323.
125. Kapust, R. Qualitaetsbeurteilung codierter Audiosignale mittels einer Bark-Transformation Text. / R. Kapust; Der Technischen Fakultaet der Universitaet Erlangen-Nuernberg, zur Erlangen des Grades. Erlangen, 1993. - 166 s.
126. Mahieux, Y. Transform Coding of Audio Signals at 64 kbit/s Text. / Y. Mahieux, J. Petit // Proc. Globecom 1990. - Nov. - P. 405.2.1-405.2.5
127. Musman, H. G. Kompressionsalgoritmen fuer interactive Multimedia-Systeme Text. / H. G. Musman, O. Werner, H. Fuch // Informationstechnik und Technische Informatik. 1993. -№2.-S. 4-18.
128. Oliveria, A. J. A Design Method for High-Audio-Quality FM Multiplex Encoders Text. / A. J. Oliveria // J. of the Audio Engineering Society 1992. - Vol. 40, № 3. -P. 130-141.
129. Paillard, B. PERCEVAL: Perceptual Evaluation of the Quality of Audio Signals Text. / B. Paillard, P. Mabilleau, S. Morissette, J. Soumagne // J. of the Audio Engineering Society. -1992.-Vol. 40, № 1-2.-P. 21-31.
130. Radio communication Study Groups. Draft New Recommendation Text. / International Telecommunication Union I I Low Bit-Rate Audio Coding : Document 10/52 (Rev.l)-E. 1993. — November 18.-P. 12.
131. Richardson, E. B. Coding with adaptive prediction for 56 kbit/s audio Text. / E. B. Richardson, N. S. Jayant // IEEE Trans. Acoust., Speech, Signal Processing. 1986. — Vol. ASSP-34 (April.). - P. 691 -696.
132. Smyth, M. APT-X100 Text. : A low-delay, low bit-rate, sub-band ADPCM audio-coder for Broadcasting / M. Smyth, S. Smyth // Proceedings of the 10th International AES Conference. — 1991.-P. 41-56.
133. Stoll, G. High quality audio bitrate reduction system family for different applications Text. / G. Stoll, Y. F. Deheri // Proc. of the Int. Conf. on Acoustics, Speech and Signal Processing ICASSP. 1990.-P. 322.3.1-322.3.5.
134. Theile, G. MUSICAM Surround: The universal multi-channel coding system Text. / G. Theile, G. Stoll // 17 Tonmeistertagung : Bericht. Karlsruhe, 1992. - S. 96-108.
135. Theile, G. MUSICAM-Surround: A Universal Multichannel Coding System Compatible with ISO 11172-3 Text. / G. Theile, G. Stoll // AES 93 RD Convention the Moscone Convention Centr. -San-Francisco, 1992. № 3403 (1-4 October). - P. 8.
136. Theile, G. Low bit-rate coding of high-quality audio signals : an introduction to the MASCAM system Text. / G. Theile, G. Stoll, M. Link // EBU Review-Technical. 1988. - № 230 (August). -P. 158-181.
137. Vaidyanathan, P. P. Multirate Systems and Filter Banks / P. P. Vaidyanathan // Englewood Cliffs. -NY.: Prentice Hall, 1993.
138. Widrow, B. Study of Rough amplitude Quantization by mean of Niguist Sampling Theory / B. Widrow // Trans. IRE. 1956. - Vol. PGCT-3, № 4 (December).
139. Wiener, N. The Extrapolation, Interpolation and Smoothing of Stationary Time Series with Engineering Applications / N. Wiener // John Wiley & Soon, Inc. New-York, 1949.
-
Похожие работы
- Разработка методов распознавания программных средств скрытого информационного воздействия на основе системного анализа
- Сжатие цифровых данных при помощи вейвлет-преобразований и фрактального кодирования информации
- Статистический метод обнаружения локальных неоднородностей данных для расследования инцидентов информационной безопасности
- Новые эффективные методы энтропийного кодирования медиаданных
- Разработка метода фрактального сжатия графической информации в системах обработки данных
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность