Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных

Белов, Сергей Павлович

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных

доктора технических наук: Белов, Сергей Павлович
город: Белгород
год: 2012
специальность ВАК РФ: 05.13.01

Диссертация по информатике, вычислительной технике и управлению на тему «Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных»

Автореферат диссертации по теме "Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных"

На правах рукописи

БЕЛОВ Сергей Павлович

МЕТОДЫ И АЛГОРИТМЫ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ИНФОРМАЦИОННО-ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ ПРИ ХРАНЕНИИ И ПЕРЕДАЧЕ РЕЧЕВЫХ ДАННЫХ

Специальность 05.13.01 - системный анализ, управление и обработка информации (в науке и технике)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора технических наук

Белгород 2012

Работа выполнена на кафедре информационно-телекоммуникационных систем и технологий Федерального государственного автономного образовательного учреждения высшего профессионального образования «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»),

Научный консультант Жиляков Евгений Георгиевич,

доктор технических наук, профессор

Официальные оппоненты: Нечаев Юрий Борисович, доктор физико-

математических наук, профессор,

заслуженный деятель науки РФ, Воронежский государственный университет, профессор кафедры информационных систем, г. Воронеж

Пашинцев Владимир Петрович, доктор технических наук, профессор, заслуженный работник высшей школы РФ, СевероКавказский федеральный университет, профессор кафедры автоматизированных систем обработки информации и управления, г. Ставрополь

Чудинов Станислав Михайлович, доктор технических наук, профессор, заслуженный деятель науки РФ, ОАО «НИИ Супер-ЭВМ», заместитель генерального директора по научной работе, г. Москва

Ведущая организация Федеральное государственное бюджетное

учреждение науки Институт системного анализа Российской академии наук, г. Москва

Защита состоится 24 октября 2012 г. в 15.00 часов на заседании диссертационного совета Д 212.015.10 на базе ФГАОУ ВПО «Белгородский государственный национальный исследовательский университет» (НИУ «БелГУ»), по адресу: 308015 г. Белгород, ул. Победы, д. 85, ауд. 3-8, к. 15.

С диссертацией можно ознакомиться в научной библиотеке ФГАОУ ВПО «Белгородский государственный национальный исследовательский университет» (НИУ«БелГУ») по адресу: 308015 г. Белгород, ул. Победы, д. 85.

Автореферат разослан 21 сентября 2012 года

и. о. ученого секретаря диссертационного совета Д 212.015.10 доктор технических наук

С.И. Маторин

- - Актуальность работы. Современный этап развития общества характеризуется увеличением в информационно-телекоммуникационных системах (ИТС) потоков речевых сообщений как наиболее естественной для человека формы информационного обмена. Интенсивный рост запросов от пользователей на объемы последнего порождает проблему повышения эффективности ИТС, одним из направлений решения которой является минимизация затрат их частотно-временных ресурсов на основе совершенствования методов обработки данных. Это связано с тем, что возможности роста затрат указанных ресурсов существующих ИТС, под которыми в рамках диссертационной работы понимаются ширина частотной полосы и время, доступные для передачи информации в определенной системе, ограничены физическими и техническими факторами, а также объемами финансовых затрат.

В настоящее время проблема минимизации затрат частотно-временных ресурсов ИТС на хранение и передачу речевых данных интенсивно исследуется. Необходимо отметить, что эта проблема носит системный характер, так как, с одной стороны, связана с уменьшением объемов битовых представлений речевых данных на основе учета структурной избыточности речевых сигналов с точки зрения восприятия слуховой системой человека речевой информации, а с другой -с минимизацией затрат частотно-временных ресурсов каналов связи, определяемых режимами передачи этого вида информации.

Большой вклад в решение проблемы минимизации затрат частотно-временных ресурсов ИТС при хранении и передаче речевых сообщений внесли многие ученые и инженеры, среди которых следует выделить Б.С. Атала, Б. Голда, Е.Г. Жилякова, Дж. Маркела, М.В. Назарова, Э. Оппенгейма,

A.А. Пирогова, Ю.Н. Прохорова, JI. Р. Рабинера, Ч. Рейдера, В.Г. Санникова, М.А. Сапожкова, В.А. Свириденко, Р.В. Шафера, О.И. Шелухина, Д.В. Агеева, М.Д. Бенедиктова, Н. Винера, Дж. Возенкрафта, В.И. Долгова, А.Г. Зюко,

B.А. Котельникова, Д.Д. Кловского, В.Ф. Кравченко, Б.Р. Левина, Н.Т. Петровича, А.А. Харкевича, А.Я. Хинчина, JI.M. Финка, К. Шеннона, В.П. Яковлева и других российских и зарубежных ученых.

В настоящее время созданы различные методы и алгоритмы обработки речевых и канальных сигналов, применение которых позволяет до определенной степени уменьшить затраты частотно-временных ресурсов существующих ИТС при хранении и передаче речевых данных.

1. Для уменьшения объемов битовых представлений речевых данных на основе учета структурной избыточности речевых сигналов с точки зрения восприятия слуховой системой человека речевой информации широко применяются методы, основанные на обнаружении и кодировании данных, зарегистрированных в периоды пауз между слитно произнесенными звуками речи (так называемые технологии VAD (voice active detection)), и сжатии данных, соответствующих собственно звукам речи после удаления пауз, которые не свободны от следующих основных недостатков:

• существующие технологии УАЭ обладают низкой эффективностью, так как используемые в них решающие функции недостаточно чувствительны к наличию звуков речи;

• сжатие данных, принадлежащих собственно звукам речи, с использованием грубого квантования по уровню осуществляется с учетом особенностей психоакустической модели и реализуется с помощью методов, которые не являются оптимальными в смысле достижения минимальных погрешностей аппроксимации в выбранных частотных диапазонах спектров исходных сигналов.

2. Современный уровень эффективности использования ИТС для передачи речевых данных является недостаточным, так как он обеспечивается на основе применения специальных методов разделения частотно-временных ресурсов каналов связи и соответствующих классов канальных сигналов, которые обладают следующими недостатками:

• разделение канальных сигналов в системах передачи речевой информации с частотным уплотнением на основе применения фильтров с конечной импульсной характеристикой (КИХ-фильтров), из-за не прямоугольности их амплитудно-частотной характеристики (АЧХ) не оптимально в смысле достижения минимума «просачивания» энергии из соседних каналов, что приводит к необходимости расширения межканальной полосы частот для достижения приемлемого уровня их взаимного влияния, а это не позволяет достичь максимального использования выделенных частотных ресурсов;

• современные методы формирования канальных сигналов с частотным уплотнением не позволяют эффективно использовать частотно-временные ресурсы ИТС, так как не обеспечивают максимальной концентрации энергии в выделенной полосе частот при заданной длительности сеанса связи;

• в системах связи с подвижными объектами эффективность использования выделенного частотного и временного ресурсов также снижается и за счет того, что при большой неопределенности частоты, вызванной эффектом Допплера, и изменений времени прихода принимаемых сигналов для снижения взаимных помех приходится вводить защитные интервалы по частоте и времени;

• при передаче речевых данных в режиме кодового разделения ресурсов каналов связи требуются большие временные затраты на подстройку частоты несущих колебаний при реализации информационного обмена с подвижными объектами, а также не удается минимизировать выделенные частотные ресурсы из-за эффекта Допплера.

Это не позволяет говорить об удовлетворительном решении проблемы минимизации затрат частотно-временных ресурсов ИТС при хранении и передаче речевых данных.

Таким образом, разработка новых методов и алгоритмов обработки речевых сигналов, формирования и приема канальных сигналов, позволяющих

минимизировать затраты частотно-временных ресурсов ИТС при хранении и передаче речевых данных, является актуальной проблемой.

Объект диссертационных исследований - информационно-телекоммуникационные системы и процессы обработки речевых и канальных сигналов.

Предмет диссертационных исследований - методы и алгоритмы обработки речевых и канальных сигналов, минимизирующих затраты частотно-временных ресурсов ИТС при хранении и передаче речевых данных.

Целью работы является: повышение эффективности использования ИТС при хранении и передаче речевых данных на основе разработки минимизирующих затраты их частотно-временных ресурсов вариационных методов субполосной обработки речевых и канальных сигналов.

Для достижения поставленной цели были сформулированы и решены следующие основные задачи.

1. Разработка и исследование оптимальных методов и алгоритмов обработки речевых сигналов на основе субполосных представлений в задачах сжатия речевых данных.

1.1. Разработка и исследование математических основ оптимального субполосного анализа речевых сигналов.

1.2. Разработка и исследование методов обнаружения и кодирования речевых данных, принадлежащих паузам, между звуками слитно произнесенной русской речи, на основе учета различий в распределениях долей энергий по частотным интервалам выходных сигналов микрофона при речевых воздействиях и в паузах между ними.

1.3. Разработка и исследование методов уменьшения объемов битовых представлений данных об отрезках речевых сигналов, порождаемых звуками русской речи на основе квантования по уровню коэффициентов разложения по собственным векторам субполосных матриц из ^-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей.

2. Разработка и исследование методов формирования и приема канальных сигналов, минимизирующих затраты частотно-временных ресурсов ИТС при передаче речевых данных.

2.1. Разработка и исследование методов и алгоритмов оптимального анализа и синтеза канальных сигналов для систем передачи речевой информации в режиме разделения частотно-временного ресурса ИТС.

2.2. Разработка методов и алгоритмов формирования и приема широкополосных шумоподобных канальных сигналов (ШШКС), минимизирующих затраты частотно-временных ресурсов ИТС при большой неопределенности частоты, вызванной эффектом Доплера, и изменениях времени прихода принимаемых сигналов.

3. Разработка технических решений, позволяющих реализовать на основе применения элементов цифровой вычислительной техники созданные алгоритмы обработки речевых и канальных сигналов, минимизирующие затраты частотно-временных ресурсов ИТС при хранении и передаче речевых данных.

Методы и средства исследований. При решении указанных задач использовались методы теории преобразования Фурье, оптимизации, линейной алгебры и теории матриц, теории информации, теории вероятности и математической статистики, теории сигналов, включая цифровые методы их формирования и обработки, вычислительный эксперимент.

Степень достоверности результатов проведенных исследований обеспечивается корректностью проведенных математических преобразований, непротиворечивостью сформированных положений и выводов исследования установленным ранее фактам теории и практики построения ИТС и повышения их эффективности при реализации речевого информационного обмена, а также подтверждается многочисленными вычислительными экспериментами с речевыми и канальными сигналами.

Научную новизну составляют следующие результаты. Теоретические основы минимизации затрат частотно-временных ресурсов ИТС при хранении и передаче речевых данных, созданные на основе математического аппарата собственных функций субполосных ядер, включая:

• метод обработки речевых данных на основе обнаружения и кодирования пауз между звуками слитно произносимой речи с применением решающей функции, обладающей максимальной чувствительностью к наличию в отдельных частотных интервалах энергии, обусловленной звуками речи, что позволяет достичь максимальных степеней сжатия данных при сохранении высокого качества воспроизведения речевых сообщений;

• метод сжатия речевых данных на основе обнаружения и кодирования пауз в условиях изменяющихся фоновых шумов путем отображения пространства отрезков речевых сигналов на дискретное пространство заданных частотных интервалов;

• метод сжатия речевых данных с исключенными паузами на основе квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из т-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей;

• интерполяционный метод формирования канальных сигналов с максимальной концентрацией энергии в изменяющейся частотной полосе ограниченных размеров и точным восстановлением передаваемых данных при отсутствии помех;

• вариационный метод формирования канальных сигналов для систем цифровой передачи информации с частотным уплотнением, обеспечивающий при разделении каналов на основе оптимальной линейной субполосной частотной фильтрации максимальную концентрацию энергии в заданной частотной полосе и точным восстановлением передаваемых данных при отсутствии помех;

используемой для этих целей КИХ-фильтрации исключить влияние смежных каналов передачи;

• методы формирования и обработки ШШКС для систем цифровой передачи с кодовым разделением адресов, обладающих по сравнению с существующими аналогичными классами канальных сигналов значительно большим объемом слабокоррелированных форм и свойством инвариантности к допплеровскому рассогласованию по частоте, что позволяет минимизировать затраты частотно-временных ресурсов ИТС при связи между подвижными объектами за счет эффективного использования выделенной частотной полосы и обеспечения одновременного информационного обмена для большего количества абонентов.

Практическая значимость результатов исследований определяется возможностью повышения эффективности ИТС при хранении и передаче речевых данных на основе минимизации затрат их частотно-временных ресурсов с помощью разработанных методов и алгоритмов обработки речевых и канальных сигналов с применением предлагаемых технических решений.

Реализация результатов исследования осуществлена: в Белгородском филиале ОАО «РосТелеком», в ОАО «Концерн Созвездие», в НПП «СпецРадио», в учебном процессе факультета компьютерных наук и телекоммуникаций НИУ «БелГУ» при подготовке специалистов по направлению инфокоммуникационные технологии и системы связи. Внедрения подтверждаются соответствующими документами. Связь с научными и инновационными программами. Результаты диссертационных исследований были использованы при выполнении ряда проектов в рамках следующих программ фундаментальных, поисковых и инновационных исследований:

• аналитической ведомственной целевой программы федерального агентства по образованию РФ «Развитие научного потенциала высшей школы в 2006 - 2008 гг.», проект РНП 2.1.2.4974;

• федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России, 2007 - 2012 гг.», поисковые исследования в рамках Госконтракта от 26 февраля 2007 года № 02514114010;

• аналитической ведомственной целевой программы федерального агентства по образованию РФ «Развитие научного потенциала высшей школы в 2009 - 2011 гг.», проект 656;

• федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009 - 2013 годы», Государственный контракт № П964 от 27 мая 2010 г.;

• гранта РФФИ, проект №10-07-00326-а, 2009 - 2010 гг.;

• федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009 - 2013 годы», Государственный контракт № 14.740.11.0390, 2011 -2012 гг.;

• гранта РФФИ, проект № 12-07-00514-а, 2012 - 2014 гг.

Положения, выносимые на защиту.

I .Теоретические положения, совокупность которых является вкладом в развитие перспективного направления - создание методов обработки речевых и канальных сигналов, повышающих эффективность использования частотно-временных ресурсов ИТС при хранении и передаче речевых данных.

1.1. Аппарат собственных функций субполосных ядер, на основе которого адекватно сформулированы вариационные условия и решены следующие оптимизационные задачи обработки и передачи речевых данных.

• вычислений точных значений долей энергий сигналов в заданных частотных интервалах;

• наилучшей аппроксимации отрезков трансформант Фурье сигналов в заданных частотных интервалах;

• построения решающей функции максимальной чувствительности при обнаружении и кодировании пауз в речи;

• формирования и обработки канальных сигналов с максимальной концентрацией энергии в заданной частотной полосе при точном восстановлении передаваемых данных;

• формирования ШШКС с минимизацией времени на их обнаружение и синхронизацию на приемной стороне и выделяемой частотной полосы для каждого абонента при реализации связи между подвижными объектами.

1.2. Методы сжатия речевых данных на основе оптимального обнаружения и кодирования пауз и квантования по уровню коэффициентов разложения отрезков сигналов, принадлежащих собственно звукам речи, по собственным векторам субполосных матриц из да-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей.

1.3. Методы формирования и обработки канальных сигналов, оптимальных в смысле минимизации требующейся для передачи ширины частотной полосы с точным восстановлением передаваемых данных при отсутствии помех.

1.4. Методы формирования ШШКС для передачи речевых данных с кодовым разделением ресурсов ИТС, позволяющие минимизировать время на их обнаружение и синхронизацию на приемной стороне и выделяемую частотную полосу для каждого абонента при реализации связи между подвижными объектами.

2. Алгоритмы, реализующие разработанные методы обработки речевых и канальных сигналов при хранении и передаче речевых данных.

3. Результаты вычислительных экспериментов по исследованию разработанных алгоритмов обработки речевых и канальных сигналов, иллюстрирующие их преимущества при хранении и передаче речевых данных по сравнению с используемыми в настоящее время.

4.Технические решения, позволяющие реализовать созданные алгоритмы обработки речевых и канальных сигналов на основе средств цифровой вычислительной техники.

Специальность, которой соответствует диссертация.

Содержание диссертации соответствует паспорту специальности 05.13.01 -системный анализ, управление и обработка информации (технические науки) по следующим областям исследования.

п.1. Теоретические основы и методы системного анализа, оптимизации, управления, принятия решения и обработки информации.

п.4. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решения и обработки информации.

п.12. Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации.

Апробация результатов диссертационных исследований. Результаты диссертационных исследований обсуждались на 18 научно-технических конференциях: 6-й Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций (г. Уфа, 2005 г.); 5-й и 6-й Международных научно-технических конференциях «Проблемы информатики и моделирования» (г. Харьков, Украина, 2005, 2006 гг.); 8-й, 10-й и 13-й Международных конференциях и выставках «Цифровая обработка сигналов и ее применение» (г. Москва, 2006, 2008, 2011гг.); на международном научно-техническом семинаре «Системы синхронизации, формирования и обработки сигналов для связи и вещания» (г. Белгород, 2006 г.; г. Воронеж, 2009 г.; г. Нижний Новгород, 2010 г.; г. Одесса, Украина, 2011 г.); 13-й Международной научно-технической конференции «Радиолокация, навигация, связь» (г. Воронеж, 2007 г.); Международной научно-практической конференции «Информационные технологии и компьютерная инженерия» (г. Винница, Украина, 2010 г.); 10-й и 11-й Международных научно-практических конференциях «Исследование, разработка и применение высоких технологий в промышленности» (г. Санкт-Петербург, 2010, 2011гг.); 2-й Международной научно-практической конференции «Информационные технологии и компьютерная инженерия» (г.Харьков, Украина, 2011г.); XII Международной научно-практической конференции «Кибернетика и высокие технологии XXI века» (г. Воронеж, 2011г.); 2-й Международной научно-технической конференции «Компьютерные науки и технологии» (г. Белгород, 2011 г.).

По результатам исследований опубликована 81 работа, из них 30 работ в изданиях из списка ВАК РФ, 2 монографии, получено 12 авторских свидетельств, 4 патента РФ и 18 свидетельств Роспатента РФ о государственной регистрации программ для ЭВМ.

Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и приложений, в которых приведены ряд результатов экспериментальных исследований, блок-схемы разработанных алгоритмов и документы, подтверждающие новизну результатов, полученных в работе.

Работа изложена на 291 странице машинописного текста, включающего 105 рисунков, 26 таблиц и список литературных источников из 281 наименования.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность работы, сформулированы ее цель, научная новизна, практическая значимость результатов исследования и основные положения, выносимые на защиту.

Глава 1. Методы и алгоритмы обработки речевых и канальных сигналов при хранении и передаче речевых данных в ИТС. Современное состояние и постановка задач исследований. В этой главе основное внимание уделено рассмотрению эффективности существующих в настоящее время методов решения проблемы минимизации затрат частотно-временных ресурсов ИТС при хранении и передаче речевых данных. На основе проведенного анализа сформулированы конкретные задачи диссертационного исследования, решение которых позволяет достичь основной цели работы.

Глава 2. Разработка и исследование математических основ обработки речевых и канальных сигналов.

Отмечается, что разработка методов и алгоритмов минимизирующих затраты частотно-временных ресурсов ИТС при хранении и передаче речевых данных должна основываться на субполосных представлениях, так как они позволяют адекватным образом сформулировать задачи анализа свойств речевых сигналов и синтеза канальных сигналов на основе соотнесения их с выделенными, исходя из тех или иных соображений, частотными интервалами (полосами).

В работе такой подход предлагается называть субполосной обработкой сигналов и использовать в задачах сжатия данных об отрезках речевых сигналов и формирования канальных сигналов в системах передачи информации с частотным уплотнением. Его основой является теория Фурье-анализа, и один из ее важнейших результатов - равенство Парсеваля:

X Т

||Г((У)|2 <Лсо12п= |/2(0Л. (1)

где - трансформанта Фурье исходного сигнала/(/), длительностью Т

В качестве основного приема субполосного анализа/синтеза в работе используется представление вида:

= (2)

где Рк - части энергии

Рк= | ¿шНя, (3)

П>€ П,

попадающие в частотные интервалы вида

Показано, что вычисление этих частей энергии (3) можно осуществить непосредственно во временной области, используя следующее соотношение:

т т

Рк = \\ т/иШ'-^ах, (5)

и и

где

(ис'Л,

- субполосное ядро.

Необходимо отметить, что соотношение (5) позволяет не только вычислить части энергии в частотных интервалах вида (4), но и определить такой их набор, в котором сосредоточена подавляющая доля энергии всего отрезка речевого сигнала, например, 90%, 95%, 98% и т.п. Естественно предполагать, что в этом наборе частотных интервалов будет сосредоточена основная информация о речевом сообщении или канальном сигнале. Поэтому, с точки зрения уменьшения структурной избыточности, в анализируемых отрезках речевых сигналов необходимо обеспечить выделение соответствующих информационных компонент, имея в виду представление исходного сигнала в виде суммы аддитивных компонент:

/(') = £ )\ ('),'£ [О, Т]. (7)

*=1

гдеу;. (О - компоненты отрезка сигнала, соотнесенные с частотными интервалами.

В качестве основного принципа выделения таких компонент в работе предлагается использовать идеализированное требование:

¡Р(й)),й)<Е П..

где ^ -трансформанта Фурье соответствующей компоненты в представлении (7):

(9)

Точное выполнение условия (8) при конечной длительности выделяемой компоненты, как известно, невозможно, поэтому в работе предлагается воспользоваться его аппроксимацией, минимизируя некоторую меру уклонения.

В качестве адекватной меры уклонения трансформант Фурье искомых компонент от идеализированного условия (8) целесообразно использовать функционал следующего вида:

Ф(Л)= | ^(л-Ь-ВД!2 А-/2л-+ |\Рк(х)\2 ¿х/2х, (10)

д-еО, "О,

т.е. евклидову норму погрешности уклонения от идеализированного условия. Естественным требованием к искомой компоненте является

Ф(Л) = тт. (11)

Этот минимум ищется на множестве трансформант Фурье вида (9), где подынтегральная функция является непрерывной и обладает ограниченной евклидовой нормой (энергией).

В работе показано, что решением вариационной задачи (11) является функция

/»(')= |/(/,Н('-',И,'€[0.г]. (12)

Таким образом, получено выражение для оптимального выделения компонент сигнала, которое отражает свойства его анализируемого отрезка, определяемые соответствующими частотными интервалами.

Подстановка в представление (12) первого из определений (6) позволяет получить важное свойство выделяемой компоненты:

Л(0= I ^(*)ехр(уд:0А/(2,г), (13)

лгеП,

т.е. она полностью определяется отрезком трансформанты Фурье исходного сигнала из заданного частотного интервала и не зависит от энергии сигнала из соседних частотных интервалов.

Те частотные интервалы, доли энергии в которых значительно больше, чем в остальных, определяют компоненты исходного отрезка сигнала, которые можно назвать квазициклическими, если для ширины соответствующих интервалов выполняется условие

Пы-Пи*2х/Т. (14)

Поэтому в работе указано, что одним из важнейших направлений субполосной обработки речевых и канальных сигналов является вычисление долей энергий их отрезков:

0„ ./II /II2- (15)

В рамках данной работы вычисление Д. называется отображением пространства речевых или канальных сигналов на дискретное пространство частотных интервалов и осуществляется с помощью субполосных ядер вида (6). Так как они являются симметричными и положительно определенными, то справедливо представление

4(/-*) = £ Л^д(0£Гд.М , (16)

¡=1

гДе £»(') _ собственные функции ядра, соответствующие собственным числам Яд, удовлетворяющим уравнениям

А,£„(')= = (17)

и для которых выполняется условие ортонормальности:

(£„,*. gll■) = }*„» С,)«» С, = (1''=(18)

„ [0,1* т.

Введя выражение для трансформанты Фурье собственных функций субполосных ядер:

САсо)=^к(1)е-'"сЛ, (19)

из соотношения (17) после ряда преобразований получаем соотношение:

4= | ]Сл.(Д-)12Л-/(2Я)<1, (20)

которое позволяет утверждать, что собственные числа численно равны долям энергий собственных функций, попадающим в соответствующие частотные интервалы, а их значения лежат в пределах 0 < < ].

В работе также показано, что собственные числа, индексы которых превосходят величину

Л=2[7ЧП21-Пи)/(2,г)] + 2, (21)

пренебрежимо малы по сравнению с единицей. Поэтому с высокой степенью точности представление (16) можно привести к виду

А ('" *) = £ 4 (')£,*(*)• (22)

(=1

При подстановке этого выражения в (12) получаем представление для выделяемых компонент:

/,(0 = Е (23)

где а<к - проекции отрезка сигнала на соответствующую собственную функцию (скалярные произведения):

«*=(/.&) = )ПШ№. (24)

Из соотношения (23) с учетом ортонормальности собственных функций следует соотношение для энергии выделяемой компоненты:

||ЛГ=1;Л№, (25)

а также выражение трансформанты Фурье этой компоненты через трансформанты Фурье собственных функций:

= (26)

Отметим, что правая часть последнего соотношения определяет аппроксимацию отрезка трансформанты Фурье исходного сигнала в соответствующем частотном интервале, оптимальную в смысле минимума критерия (10) (вариационное условие (11)).

В свою очередь подстановка аппроксимации субполосного ядра (22) в соотношение (5) позволяет привести последнее к виду:

(27)

Известно, что построенные на основе многочисленных исследований модели человеческого слуха свидетельствуют о том, что он реагирует на энергию в определенных частотных диапазонах, поэтому полученные

соотношения являются эффективным инструментом для достижения потенциально возможных степеней сжатия речевых данных. Именно наличие в речевом сигнале квазициклических компонент проявляется в необходимости сохранения информации о трансформанте Фурье в одном или нескольких сплошных частотных интервалах конечной ширины, которые определяются длительностью обрабатываемого отрезка.

На этой математической основе были разработаны алгоритмы отображения пространства отрезков речевых сигналов на дискретное пространство частотных интервалов. Реализация созданных алгоритмов осуществлялась в два этапа. На первом этапе определялись частотные интервалы, с которыми связана информативность речевого сообщения (называемые в работе /«-информационными частотными интервалами), и вычислялись их такие минимальные суммарные ширины, где сосредоточена заданная доля (т) общей энергии отрезка речевого сигнала, второй этап заключался в адекватном ее отображении с помощью минимально возможного объема битовых представлений речевых данных.

Одним из важнейших параметров этих алгоритмов при выделении «(-информационных частотных интервалов является длительность обрабатываемых отрезков, поэтому в работе осуществляется обоснование ее выбора.

Для вычисления попадающей в заданный частотный интервал части энергии отрезка речевого сигнала в работе на основе (27) используются проекции (24), которые в области частот имеют представление

ви = 28)

где Ол((у) - трансформанта Фурье собственных функций субполосных ядер, а звездочка означает комплексное сопряжение.

Для близких к единице собственных чисел в силу соотношения (20) будут выполняться равенства:

а!к = | Р\х)01к(а)<Ы(2я), (29)

леП,

т.е. скалярные произведения будут отражать свойства трансформант Фурье отрезка сигнала в заданном частотном интервале.

В противоположность этому скалярные произведения (28), соответствующие малым собственным числам будут определяться трансформантой Фурье отрезка сигнала вне выбранного частотного интервала.

Отсутствие близких к единице собственных чисел говорит о том, что период гармонического колебания (синуса или косинуса):

£>£>,= 4л7(П„+Пц), (30)

больше, чем длительность анализируемого отрезка, т.е. это колебание не успевает сформироваться, и для адекватных выводов о наличии в сигнале квазициклических компонент с выбранной частотой необходимо согласовать с величиной (30) длительность отрезка.

С другой стороны, по многим причинам и, прежде всего, нестационарности речевых сигналов, нецелесообразно выбирать слишком

большую длительность анализируемых отрезков речевых сигналов. В связи с этим в работе на основе результатов численных исследовании свойств собственных чисел и функций субполосных ядер показано, что компромисс между шириной частотных интервалов и длительностью обрабатываемых отрезков речевых сигналов достигается, когда для определяемого соотношением (21) параметра выполняется условие Jt гбн-8, так что

7-(П,,-Пи) = (6-8)л-. (31)

Важным аспектом является правильный выбор способа вычисления собственных чисел и функций субполосных ядер, чтобы на этой основе реализовать соотношения (23) и (27), так как использование компьютерных средств предполагает дискретизацию области определения. Поэтому для осуществления этих вычислений предлагается использовать квадратурные формулы, однако, выбор конкретной формы осложняется решаемой задачей: определением собственных функций и чисел, т.е. конечномерная аппроксимация интегралов должна позволять осуществлять вычисления на основе матричных операций. В связи с этим в работе на основе анализа существующих квадратурных формул делается вывод, что адекватные результаты при вычислении интегралов дает квадратурная формула прямоугольников, так как она сохраняет симметрию матриц.

Вычисление скалярных произведений вида (24) также реализуется с использованием квадратурных форм прямоугольников. В связи с этим возникает вопрос выбора минимальной частоты дискретизации речевых и канальных сигналов, при которой не возникает недопустимых искажений в оценке долей энергий в заданных частотных интервалах. В работе показано, что:

1)для аппроксимации собственных функций субполосных ядер набором собственных векторов субполосных матриц с точностью до третьего знака после запятой допустимо осуществлять их дискретизацию с частотой, превышающей утроенную частоту верхней границы соответствующего частотного интервала;

2) при частоте дискретизации речевого сигнала выше 12000 Гц результаты вычислений долей энергий искажаются незначительно, а выбор частоты дискретизации ниже этого значения для отдельных звуков речи может привести к значительным погрешностям, что объясняется эффектом наложения частот, определяемым на основе теории дискретизации Найквиста.

Глава 3. Разработка методов и алгоритмов уменьшения объемов битовых представлений данных об отрезках речевых сигналов при их хранении и передаче.

Проведенный в работе анализ тонкой структуры распределения энергий отрезков речевых сигналов по сетке частотных интервалов, состоящих из звуков речи и пауз с применением для этих целей метода отображения пространства отрезков исходных речевых сигналов на дискретное пространство частотных интервалов, описанного в главе 2, позволил установить, что характеристическим свойством отрезков сигналов, порождаемых звуками речи или паузами, является существенное различие в распределении их энергий по сетке частотных интервалов, что явилось основой для разработки методов

уменьшения объемов битового представления речевых данных за счет обнаружения и кодирования пауз.

Метод минимизации объемов битовых представлений речевых данных на основе обнаружения и кодирования пауз между звуками слитно произносимой речи с применением решающей функции, обладающей максимальной чувствительностью к наличию в отдельных частотных интервалах энергии, обусловленной звуками речи.

Уточним формулировку задачи обнаружения звуков речи применительно к анализу отрезков речевых сигналов.

Пусть зафиксирован отрезок (вектор) .г = (л-,,..,^)1"отсчетов речевого сигнала длительности (размерности) N. Основная (начальная) гипотеза формулируется следующим образом:

Н„: отсчеты речевого сигнала принадлежат паузе в речи (шумы регистрирующих приборов).

Символически это означает, что

Ив:х = й = (»,,. .,1/А.),г (32)

где символ I/, означает отсчет шума.

Формулировка альтернативной гипотезы имеет следующий вид.

/-/,: хотя бы часть отсчетов порождена как шумами, так и под воздействием акустических колебаний, возбуждающимися звуками речи:

Н1:х = г + й, (33)

где г =(г,,..,гх,)г - обусловленный речевым сообщением вектор, некоторые из компонент которого могут быть равны нулю (например, когда речь отсутствует), причем предполагается, что шумы от речи не зависят.

Основу любой решающей процедуры составляет решающая функция (РФ):

Р = Р(х), (34)

которая определяет способ обработки вектора анализируемых данных с тем, чтобы при выполнении условия

(35)

отвергнуть проверяемую гипотезу.

Здесь Оп - критическая область, выбираемая из требования

Р{Р Нй) = сс«\\ (36)

где Р - символ вероятности; а - вероятность ошибок первого рода.

В работе в качестве основы построения РФ предлагается использовать характеристику распределения энергий анализируемого отрезка сигнала по сетке частотных интервалов:

Р,(х) = хгАкх,к = \,..,Я, (37)

где А,. = {а*}, ;,у = - субполосные матрицы с элементами:

о*= | ехр(-уш(;-у))г/а)/2л- = 281п(ЛК,(1-у)/2)*со5(й;,(/-7))/я-(/-Л (38)

-к п,

где Д^, =(£!,,-Оц)Д/=(Пи+Пи)Д//2 ; а ДI - шаг эквидистантной дискретизации.

Пусть М - символ математического ожидания.

Предполагая, что сигналы в паузах речи являются стационарными, имеют равное нулю математическое ожидание

ЛУ[».] = 0,; = 1,..,;У (39)

и автокорреляционную функцию (АКФ)

С„('-Л = М[11;11,Ъ iJ = l,..,N, (40)

из определения (37) получаем выражение для условных математических ожиданий соответствующих частей энергий отрезков шума:

М[Рк (х) / Я„ ] = Ьк = М[Рк (»)] = £ ф. О - Л (41)

а при некоррелированности шумов

О.(/-у) = 0. ¡^

с учетом (38) имеем:

М[Рк(х)/И0)] = Ьк=М[Рк(Г1)]^а;^АУк/я. (43)

В работе показано, что в предположении гауссовского распределения вероятности сигналов в паузе и выполнения условия (42) имеет место

М[Р- (х) ///„)] = М[Р; (¡7)] = (ст,;М\ Ук / я) + а*ЩА Ук / я). (44)

Поэтому условная дисперсия равна

=М[Р?(х)/Н0)]-{М [Р1(х)/Н0]}2^2ст:щ&Ук/я). (45)

Отсюда с учетом (43) получаем соотношение

(46)

которое при выполнении гипотезы Я0 в оговоренных выше условиях определяет закономерность изменений отношения среднеквадратического отклонения части энергии отрезка шума к его математическому ожиданию. Из соотношения (46) видно, что с ростом длительности анализируемого отрезка сигнала в паузе это отношение стремится к нулю.

Как было показано во второй главе, соотношение (37) представимо в виде

= (47)

где ак] - скалярные произведения:

= (*,?*) = !>$. (48)

А = 2[Л,ДК, /2я] + 2.

Поэтому ввиду гауссовости при выполнении гипотезы Я0 распределения случайных величин (48) и их независимости, можно показать, что характеристическая функция случайной величины (47) имеет вид

ес///0)=п (1-А^). (49)

Дифференцируя это выражение по известным правилам, можно получить соотношения для любых условных начальных моментов. В частности, имеет

место следующее представление для условной функции плотности вероятностей вычисляемой части энергии:

w,,(y/H0)= J П (l-MAi)exp(-jyi)c/t, (50)

-г i-I

которое позволяет вычислить границы критической области, исходя из заданной вероятности ошибок первого рода при проверке справедливости гипотезы Я0. Положим

= (51)

тогда в общем случае (33) имеет место:

S(a>k ,х) = (Рк (й) + г тЛкЯ + Рк (г)) / Ък. (52)

Отсюда с учетом предыдущих условий и результатов получаем:

c[>c¡=\, (53)

c° = M[S(a)k,x)/Ha] = \, с; = M[S(cok, х) / Я, ] = 1 + М[Рк (?)] / Ьк = M{{Sk(x)-\f I= ИN. В работе показано, что для узкополосных полезных сигналов вида

zk =ytcos(ek + ip),k = \,..,N, (54)

где <р - случайная равномерно распределенная в интервале [-тг;ти] фаза;0 -нормированная круговая частота из интервала [0;л]; ук - так называемая огибающая, математическое ожидание функции (52) достигает максимума:

тах М[Рк (?)] = Р0(у) = ¿ am,y„y,„, (55)

если выполняется условие:

4=0- (56)

Здесь в соответствии с (38) я°„ = sm(hVk{n-m)12)Iтг(п-т).

X Ji

Положим далее Д тогда Р„(у) = ^Р* и после

».i f=i

дифференцирования по всем Д получаем

= 57)

ад эд, )

так что

Pa(P) = {gradP,gradP)l2. (58)

Иными словами, изменение соответствующего математического ожидания в (53) осуществляется в направлении градиента, что обеспечивает максимальное приращение линейной части функции (разложение по формуле Тейлора) по сравнению с отсутствием сигнала (Д=0).

Таким образом, функция (51) в этом смысле обладает максимальной чувствительностью к появлению квазигармонического сигнала. Это свойство, а также достижение глобального максимума только при выполнении условия (56) являются основанием для использования в качестве РФ статистики

F(x) = max5(<u, ,x),Vk = I,..,/?. (59)

а при проверке гипотезы/-/„решающего правила

maxS^.i) >%), (60)

i^tiji

где h(ak) - некоторый порог, который в общем случае для разных центров частотных интервалов может быть различным.

При выполнении неравенства (60) Я0 отвергается.

Пороги в правой части (60) целесообразно определять непосредственно для конкретных условий обработки данных, используя при этом их последовательность достаточной длительности при заведомо отсутствующих данных, принадлежащих слитно произносимой речи, т.е. рекомендуется использовать режим обучения. Очевидно, что при этом необходимо достаточно точно оценивать знаменатели в (51) и порог в правой части (60).

После вынесения решения о принадлежности анализируемого отрезка определенной длины речевого сигнала к паузе осуществляют процесс её кодирования, при этом код каждой паузы содержит информацию о моменте начала и продолжительности паузы.

На основе разработанного метода был создан соответствующий алгоритм обнаружения и кодирования пауз.

Для оценки работоспособности и эффективности предлагаемых метода и алгоритма в работе были проведены детальные экспериментальные исследования по выявлению их чувствительности к увеличению энергии сигнала и влиянию различного вида мешающих воздействий. Анализ полученных результатов свидетельствуют о том, что применение предлагаемой РФ позволяет обнаруживать границу (шумов в паузе)/(звук речи) на достаточно коротком интервале анализа, что говорит о высокой точности обнаружения границы пауза/звук.

Для реализации рассмотренного выше метода минимизации объемов битовых представлений речевых данных на основе обнаружения и кодирования пауз между звуками слитно произносимой речи требуется определенное время для оценки статистических характеристик шумов регистрирующих приборов в паузе в режиме молчания диктора. Для условий быстро изменяющейся помеховой обстановки, когда недостаточно временных ресурсов для реализации этапа обучения, в диссертации разработан соответствующий метод.

Метод обработки речевых данных для обнаружения и кодирования пауз в условиях изменяющихся фоновых шумов на основе отображения пространства отрезков речевых сигналов на дискретное пространство заданных частотных интервалов.

В основе этого метода используется понятие га-информационных частотных интервалов, в которых сосредоточена заданная доля да-энергии анализируемого отрезка, т.е. множество частотных интервалов Rm, когда выполняется равенство

£ Pt = /л||5||2, т е [0,8 - 0,95] (61)

Суммарная ширина их удовлетворяет неравенству

ыд -(/,)/*< г,,,, (62)

где К, =П(Д/; Л? - интервал дискретизации по времени; 7"1 - так называемая частотная концентрация; ¡тЛ„, - мощность множества частотных интерваловЛ,„, где сосредоточена заданная доля (от) энергии анализируемого отрезка речевого сигнала.

Для правой части этого неравенства в зависимости от звука речи при 0,8 < т < 0,95 выполняется

0.25 < у < 0.5, (63)

причем правая часть здесь достигается редко (только для шипящих). В то же время энергия фрагмента сигнала, соответствующего паузе, распределена относительно равномерно по всему частотному диапазону, и в этом случае у,„> 0.6.

Суть предлагаемого метода состоит в следующем.

На первом этапе формулируется нулевая гипотеза Щ: анализируемый отрезок сигнала относится к шумам в паузе между звуками речи.

Для оценки степени сосредоточенности энергии отрезка сигнала в качестве решающей функции используется величина частотной концентрации вида (62), где в числителе слева стоит минимальное количество /«-информационных частотных интервалов (частотная концентрация), в которых сосредоточена заданная доля энергии отрезка сигнала, принадлежащая, собственно звукам речи, так что имеет место

¡п[Л,„= ття^'. (64)

Здесь для правых частей выполняется неравенство

¿^т - II * 1|: = > (65)

¿=1 »и

причём индекс в скобках у слагаемых суммы слева соотношения (65) означает, что части энергий Я, упорядочиваются по убыванию, то есть формируется так называемая порядковая статистика:

Ра1е{Рк,к = 1..,1{}-,Р1^<Р<к),к = 1..,11-\. (66)

Решение о принадлежности отрезка сигнала к паузе принимается, если для вычисляемой на основе (62) текущей частотной концентрации выполняется неравенство:

Ут ^ Уротая , (67)

где у°!„ти- пороговое значение частотной концентрации, которое определяется как максимальное для всех звуков речи.

Если неравенство (67) не выполняется, то отрезок сигнала относится к участку отрезка сигнала, принадлежащего, собственно звуку речи.

На основе разработанного метода был создан алгоритм обнаружения и кодирования пауз.

Для оценки работоспособности и эффективности предлагаемых метода и алгоритма в работе были проведены детальные экспериментальные исследования по выявлению их чувствительности к увеличению энергии сигнала и влиянию различного вида мешающих воздействий. В целом, анализ результатов проведенных экспериментальных исследований РФ на основе частотной концентрации заданной доли энергии анализируемого отрезка речевого сигнала показывает, что она чувствительна к увеличению отношения шум/сигнал и может быть использована только в тех случаях, когда это отношение не велико.

В работе для дальнейшего уменьшения объемов битовых представлений данных об отрезках речевых сигналов после удаления пауз между звуками слитно произнесенной речи разработан следующий метод.

Метод и алгоритм сжатия речевых данных без пауз на основе оптимального квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из /«-информационных частотных интервалов.

Осуществляется обработка отдельных отрезков (векторов отсчетов) сигнала речи:

5 = (*„..,*.„/ (68)

в соответствии с выбранным ранее равномерным разбиением полосы нормированных частот 0 < со < к на Л интервалов V вида:

К-2 ~ К-1 КМ=К*, г = 1,..,Л-1 (69)

одинаковой ширины.

В основе сжатия данных используется свойство концентрации энергии речевых сигналов в малой доле частотной полосы, что позволяет использовать аппроксимацию

* = (70)

где

х,.=А,.-х, (71)

коэффициент а при сумме выбирается из условия | * ||2= т | х ||2, что дает:

(72)

111^.11'

где К,„ - множество частотных интервалов минимальной суммарной ширины, для которых выполняются условия

£рг(*) = /ир||2 , (73)

геК,,,

0,85 < т < 0,98, (74)

т.е. множество /и-информационных частотных интервалов.

Выше было указано, что соответствующая некоторому частотному

интервалу компонента вида (71) допускает представление

-v, = S > а>>- = > q'i) • (75)

подстановка которого в аппроксимацию (70) дает разложение по набору собственных векторов:

* = XZ/u;, (76)

i €Ä„, ( = 1

где

Д, =£7Л>,.,, i = l,..,Jr. (77)

Так как наборы собственных векторов q' предполагаются известными, то для восстановления исходного отрезка достаточно сохранять информацию о соответствующих коэффициентах разложения.

Проведенные исследования показали, что мощность множества частотных интервалов (int Rm) почти для всех звуков русской речи удовлетворяет соотношению

int Rm = 0, ЗД . (78)

Поэтому с учетом равенства J = N/R получаем коэффициент сжатия за счет использования аппроксимации (70) (по количеству сохраняемых чисел):

СН = N /(int Rm * J) = 3. (79)

Следующий шаг заключается в применении к коэффициентам разложения квантования по уровню с малым их количеством. В общем виде процедура квантования описывается следующим образом, если выполняется условие:

А е 6,,,=[?„,_„?>„,), (80)

то положить

ßl=dm,m = \,...,K, (81)

где К - количество используемых уровней квантования.

Проблема заключается в оптимальном выборе границ отрезков в (80) и значений clm в (81) в смысле минимизации погрешностей аппроксимации исходных данных квантованными значениями:

*,3=Z I iß.-djli = 1.....J),r еR,„, (82)

H|=I ß„<-sn,

где Sm - множество значений Д,, удовлетворяющих условию (80).

В работе показано, что при заданных отрезках Öm в (80) минимум правой части (82) достигается на множестве уровней квантования, равных соответствующим средним значениям:

d„, = Z ß>r /(int 5,,,),»; = 1,...,ЛГ, (83)

А,

где int5,„ - мощность множества S, „(количество попадающих в них значений Д,.).

Введем положительную неубывающую последовательность:

0<гк <г^,к = 1,...,ЫК -1, (84)

NK = J*mtRa, (85)

причем

г*б{|Дг|}/у,/ = 1,...,У;гбЛ.1, (86)

у = тахгеЛ„.

Показано, что выполнение условий

=шах; (87)

н/=1 К

X1~=NK> (88)

где

(89)

а также выбор уровней квантования в виде

Я, = Z„,,/77 = I,...,A: (90)

дает минимум погрешности аппроксимации ^ квантованными значениями

(91)

когда выполняется условие

(92)

Реально вместо операции (91) следует использовать кодирование

codzt = log, т, (93)

имея в виду, что номера уровней квантования целесообразно обозначать двоичными числами разрядности р, так что

К= 2". (93)

Таким образом, количество уровней квантования целесообразно выбирать из множества (2,4,8,...). В соответствии с этим в работе разработан алгоритм решения задачи (87), (88) с последовательным делением подпоследовательностей на две части, каждая из которых удовлетворяет этим условиям со своими параметрами /„, и dm (так как деление на две последовательности любой длины несложно реализуется последовательным перебором).

Использование стандартизованных последовательностей вида (84)-(86) позволяет не хранить значения уровней (90), а для восстановления данных использовать уровни из заранее сформированной кодовой книги, удовлетворяющей условию

где

£>, =Ц',...,<•}, <...<4- (95)

В диссертации такие кодовые книги сформированы при К= 2,4,8 с учетом всех звуков русской речи с усреднением по множеству дикторов.

Для иллюстрации работоспособности и эффективности разработанных метода и алгоритма в работе были проведены экспериментальные исследования, которые показали, что разборчивость речи сохраняется уже при К= 2. Таким образом, с учетом необходимости сохранения знакового разряда и значения /достигаемый максимальный коэфф1 щент сжатия может быть равен

СН1та= \2М/(И + \2), (96)

(в предположении 8-разрядности исходных отсчетов).

Т.е. если Л'достаточно велико, то

СЯ_г12. (97)

Известно, что паузы в речи могут составлять 40% - 50% от продолжительности диалога, поэтому общий коэффициент сжатия как за счет обнаружения и кодирования пауз, так и за счет квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из т-информационных частотных интервалов может достичь 20 + 25.

Глава 4. Разработка методов и алгоритмов формирования канальных сигналов конечной длительности, оптимальных в смысле максимальной концентрации энергии в заданной частотной полосе.

В главе приведены результаты разработки новых оптимальных методов и алгоритмов формирования канальных сигналов конечной длительности, применение которых позволит минимизировать затраты выделенных на передачу речевых сообщений частотно-временных ресурсов ИТС с обеспечением высокой точности их восстановления на приемной стороне.

Интерполяционный метод формирования канальных сигналов конечной длительности с максимальной концентрацией энергии в изменяющейся частотной полосе ограниченных размеров, обеспечивающий точное восстановление передаваемых данных при отсутствии помех.

В работе отмечается, что разработка предлагаемого метода связана с тем, что достаточно часто в ИТС в качестве физической среды распространения используются неоднородности ионосферы, параметры которых, как известно, существенно изменяются. В этих условиях главной задачей является формирование таких канальных сигналов, которые имеют максимальную концентрацию энергии в заданной ограниченной полосе частот, причем с возможностью адаптивного изменения ее ширины и значений несущего колебания, что позволяет эффективно использовать существующий частотный ресурс, минимизируя при этом уровень искажений, вызванных указанной нестабильностью.

Суть метода заключается в следующем.

Для передачи вектора информационных данных (информационного вектора)

J' = (v„..,r.,)r (98)

в частотном интервале вида (4) формируется канальный сигнал (вектор)

.i = (,v1,..,.vv)', (99)

который удовлетворяет вариационным условиям

|| х ||2 -Pt = хт(1 - Лк)х = min, (100)

=yjJ = U-/ . (101)

где N = £>(./-1) +1; I = diag{\,..,\) -единичная матрица.

Здесь и ниже D > 1 - коэффициент увеличения длительности, от величины которого зависит достигаемый минимум левой части (100).

Восстановление исходного информационного вектора при таком подходе сводится к осуществлению соответствующей выборки из результатов регистрации канального сигнала на приёмной стороне, то есть в общем случае будут получены оценки

йу-поч =>'/+"(;-!),ы.У = 1.--.-Л (1 °2)

где u.,i = \,..,N - случайные погрешности, обусловленные различными неконтролируемыми воздействиями.

В качестве меры погрешности восстановления информационного вектора в работе используется отношение квадратов норм:

=11 у-у II2 / II у ll:= £ W, / £yj ■ (103)

í=I /и

Полагая

М[и,] = 0; М[и;] = а\,/ = 1,.., N, (104)

где символ М означает оператор математического ожидания, получим

M[82] = J<j]/\\y\f. (105)

Определение не совпадающих с (101) компонент формируемого сигнала реализуется следующим образом. Пусть

В = /-Л=1 (106)

а квадратная матрица 5. размерности N. = N-./ = (£>-1)(J-1) получена удалением из матрицы (106) строк и столбцов, номера которых принадлежат множеству индексов

i,ke{(j-\)D + l},j = \,..,J. (107)

Обозначение В, используется далее для квадратной матрицы размерности Je элементами 5, = = 1, ■.,•/ •

Положим

y¡bÚ-DO" = (c|>-.-C(J-l)D»l)r ' (108)

J-I

где Е; - столбец матрицы В. (прореженные). Введем вектор свободных компонент

Z={2y..^.....(109)

дополняющий вектор v до канального вектора по правилу

х = (y],z]...,ztJ_l,y2,zD,...,z{ltmD_¡),yJ )r. (110)

Тогда вариационную задачу (100), (101) можно сформулировать относительного вектора I:

zT B.I + 2zTc + yrBty = mill, (111)

причём поиск минимума должен осуществляться на множестве вещественнозначных векторов вида (109).

В работе отмечается, что ввиду условия (21) для собственных чисел субполосного ядра матрица Д. будет неособенной. Поэтому решение задачи (111) имеет вид

z = -В~]с . (112)

Так как вектор с определяется на основе исходного вектора у, то с помощью соотношения (108), его можно преобразовать к виду

c = Gs.y = (b;,..,b-j_UD<i)y,

поэтому (112) принимает

z=-B:'G>.y. (113)

С учетом этих обозначений можно получить представление минимума просачивания энергии канального сигнала за пределы выделенной частотной полосы:

min(||í||2 -Pt) = f(By-GlB~lGy)y. (114)

Ясно, что определяемый из представления (114) вектор даёт решение исходной вариационной задачи.

Для коэффициента увеличения длительности в работе получено соотношение

D = 7rl(ulk-vít)M = R, (115)

определяющее допустимый уровень избыточности канального вектора по сравнению с информационным. Таким образом, избыточность D компонент канальных векторов по сравнению с информационным вектором определяется долей ширины выделенной полосы во всём частотном ресурсе канала. В частности, если используется весь частотный ресурс (Л = 1), то избыточности не требуется.

Указанная избыточность является платой за возможность создания канальных сигналов с наименьшим просачиванием энергии за пределы сколь угодно узких частотных интервалов при обеспечении возможности точного восстановления информационных векторов в условиях отсутствия мешающих шумов.

данных при отсутствии шумов с использованием рассматриваемого алгоритма не превышает погрешности вычисления.

В случае использования для передачи информации систем с частотным уплотнением на приемной стороне возникает проблема выделения сигнала в заданной частотной полосе из смеси

.7=5, +*,+...+ , (116)

одновременно присутствующих сигналов из других каналов.

В настоящее время для этих целей используются КИХ-фильтры, однако из-за невозможности создания идеально прямоугольной АЧХ фильтра не удается обеспечить бесконечно большое подавление в полосе непропускания и, следовательно, исключить «просачивание» в выбранный частотный интервал энергии из соседних частотных областей, причем в зависимости от соотношения энергий в заданном частотном интервале и смежных частотных областях просочившаяся энергия может стать сравнимой по величине с имеющейся.

В связи с этим в работе для выделения канальных сигналов в системах цифровой передачи с частотным уплотнением предлагается применять разработанный метод оптимальной линейной субполосной частотной фильтрации, основанный на использовании соотношения вида:

(117)

так как получаемый при этом вектор является оптимальным в следующем смысле:

| | (<а)|2 Л/2л-+ j \1Г{а)\2 Л = шт

среди всех трансформант Фурье 7У-мерных векторов.

Отметим также, что как показано во второй главе, вектор (117) не зависит от энергий суммарного сигнала, попадающих в другие частотные полосы. Поэтому при выполнении определенных условий с высокой точностью будет выполняться соотношение

О18)

где хк=(х1к,...,хж) - вектор, сформированный для передачи информационного вектора вида (98); N = £>(./ -1) +1.

Так как в общем случае векторы й- и хк не совпадают, то для однозначного восстановления информационных компонент разработан соответствующий метод.

Вариационный метод формирования канальных сигналов для систем цифровой передачи информации с частотным уплотнением, обеспечивающий при разделении каналов на основе оптимальной линейной субполосной частотной фильтрации максимальную концентрацию энергии в заданной частотной полосе с точным восстановлением передаваемых данных при отсутствии помех.

Метод основан на решении вариационной задачи:

\\х\\--Рк = .V7 (/- Ак)х = тт, (119)

= i•■■■/, (120) которое отличается от задачи (100), (101) другим типом ограничений. Положим

* = (121)

где Q[ =(i/*,f7i,L - некоторое целое положительное число. Тогда задача (119), (120) преобразуется к виду:

¿(1-Я,)а,2=тт,УаеЛ' , (122)

Вка = у, (123)

где матрица Вк состоит из строк матрицы О* с номерами £>(/-l) + I,/ = l.....J.

Предполагая, что собственные числа упорядочены по убыванию:

Я,* >л! >...>я* ,

можно видеть, что решение задачи (122), (123) достигается при выборе

L = J (124)

и решении системы линейных уравнений (123). В работе показано, что матрица В будет неособенной при выполнении условия

N*{un-u,k)MU+2 = J. (125)

Таким образом, оптимальный канальный сигнал должен иметь вид:

х = (126)

Для иллюстрации работоспособности и эффективности разработанных метода и алгоритма в процессе выполнения диссертационного исследования были проведены вычислительные эксперименты с использованием созданной для этого программно-алгоритмической поддержки. Анализ результатов исследований позволил установить, что применение созданного на основе метода оптимальной линейной субполосной частотной фильтрации алгоритма позволяет достичь практически нулевого «просачивания» энергии за пределы выбранного частотного диапазона при восстановлении исходных данных с точностью, не превышающей погрешность вычислений.

Полученные в четвертой главе соотношения представляют собой новый математический аппарат, который может служить основой для формирования и решения вариационной задачи поиска вектора конечной размерности с максимальной концентрацией энергии в заданной частотной полосе и точным восстановлением передаваемых данных при отсутствии помех.

Глава 5. Разработка методов формирования широкополосных шумоподобных канальных сигналов, минимизирующих затраты частотно-временных ресурсов ИТС.

При организации информационного обмена с подвижными объектами на основе применения узкополосных сигналов эффективность использования выделенных частотного и временного ресурсов канала передачи снижается из-за большой неопределенности частоты, вызванной эффектом Допплера, и изменений времени прихода принимаемых сигналов. Вместе с тем, известен класс сигналов с линейной частотной модуляцией (JI4M), обладающий свойством инвариантности к допплеровскому рассогласованию по частоте, а, следовательно, на их основе достаточно просто может быть решена задача

построения беспоисковых по частоте систем связи. Однако данный класс сигналов имеет малый ансамбль слабокоррелированных форм, что не позволяет применять его в системах с кодовым разделением ресурсов каналов связи при одновременной передаче информации большим количеством абонентов из-за высокого уровня внутрисистемных помех. В то же время ШШКС, полученные на основе модуляции по фазе гармонического колебания по закону псевдослучайных последовательностей (ПСП) нашли применение в системах с кодовым разделением ресурсов каналов связи из-за достаточно большого ансамбля слабокоррелированных форм, но у этих сигналов отсутствует свойство инвариантности к допплеровскому рассогласованию по частоте.

В связи с этим в работе были разработаны методы формирования и обработки ШШКС для систем цифровой передачи с кодовым разделением адресов, в которых объединены положительные свойства как ЛЧМ сигналов, так и ПСП - они имеют большой объем слабокоррелированных форм при сохранении свойства инвариантности к допплеровскому рассогласованию по частоте а, следовательно, позволяют минимизировать затраты частотно-временных ресурсов ИТС при связи между подвижными объектами за счет эффективного использования выделенной частотной полосы с обеспечением одновременного информационного обмена для большего количества абонентов:

ЛЧМ сигналы с внутриимпульсной фазовой манипуляцией по закону ПСП (ЛЧМ ФМ), модель которых имеет вид:

5(0=

•ехрЬ/'у I "ри

(127)

0; при других I

где Бо - амплитуда огибающей сигнала, в дальнейшем постоянная величина, равная 1; // - крутизна модуляционной характеристики ЛЧМ радиоимпульса (скорость изменения частоты), связанная с девиацией частоты ДР и длительностью сигнала Т соотношением (и = 2 л- Д/г/7"; тэ - длительность элемента ПСП; Ы-количество элементов ПСП; ^ - коэффициент, характеризующий состояние кодирующей последовательности, принимает значения +1 или -I, гесфс) - прямоугольная «срезающая» функция, задаваемая

выражением: гес/(х) =

при

I I 2

О, при |д'| > —

уже вызывали к себе повышенный интерес в области радиолокации, поскольку их использование обеспечивает лучшее одновременное разрешение по дальности и скорости, чем обычный ЛЧМ сигнал. Вместе с тем, в известных работах отсутствуют результаты исследований по оценке объема ансамбля слабокоррелированных форм этих сигналов при изменении различных их параметров. Однако при создании многоканальных систем передачи информации с кодовым разделением ресурсов знание этой характеристики сигналов является определяющим. В связи с этим в работе была проведена

оценка степени ортогональности анализируемых сигналов при произвольном временном и частотном сдвиге на основе полученного математического выражения для огибающей ФВН ЛЧМ ФМ сигналов, которое имеет вид:

хЛг,г„)

+ + И)

2жР„ + М(\р\т,+\в\)

-;--\в\

"НИ

2жР1 + у(\р\т>+\в\)

(2/-1).

2 151

2^Р, + р{\р\т,+\в\) 2

, (128)

где т = рту+в. - временной сдвиг между сигналами; О<|0|<г,.;

р = ±(о, 1,2, ..., N-1, Л'),;.Р1) - допплеровский сдвиг частоты; у', у' - элементы ПСП /-ого иу'-ого ЛЧМ ФМ сигналов; N - число элементов ПСП.

Анализ результатов экспериментальных исследований огибающих ФВН ЛЧМ ФМ сигналов позволил установить, что при больших отношениях базы ЛЧМ радиоимпульса к базе ПСП АР *Т1Ы » юни обладают инвариантностью к допплеровскому рассогласованию по частоте, а их спектр, как известно, в этом случае равномерно распределен в диапазоне АР. Кроме этого, в работе было показано, что объем ансамбля ЛЧМ ФМ сигналов с одинаковой крутизной модуляционной характеристики ЛЧМ радиоимпульсов равен ансамблю ПСП, а объем ансамбля ЛЧМ ФМ сигналов с различной крутизной модуляционной характеристики ЛЧМ радиоимпульсов равен произведению ансамблей ПСП и ЛЧМ радиоимпульсов.

Таким образом, исследуемый класс сигналов обладает большим, нежели ЛЧМ радиоимпульсы, объемом слабокоррелированных форм, однако уровень боковых лепестков их взаимнокорреляционных функций определяется свойствами псевдослучайных последовательностей, а степень инвариантности к допплеровскому рассогласованию по частоте зависит от отношения базы ЛЧМ радиоимпульса к базе ПСП. Указанные особенности ЛЧМ ФМ сигналов в некоторых случаях снижают эффективность их применения в качестве

переносчиков информации в многоканальных системах спутниковой связи с кодовым разделением ресурсов при нахождении ретранслятора на высокоэллиптической орбите, а также в системах связи с подвижными объектами.

Исходя из этого, в работе предлагается для указанных систем связи использовать:

ШШКС на основе временной манипуляции (по задержке) ЛЧМ радиоимпульсов по закону ПСП (ПС ЛЧМ), математическая модель которого имеет вид:

-('■'Я

"('-'Я

I - 1-- Г. /V

I- '-'тг-г„

'"'У- -

О, ¡де ^ К ~ ' ■ Т + 7~„ + (] - I' ,. )- г,,1 1< О

(129)

где Бо - амплитуда огибающей сигнала, в дальнейшем постоянная величина,

равная 1; ум - коэффициент, характеризующий состояние ПСП и принимающий значения +1 или 0; со0- средняя частота ЛЧМ радиоимпульса; Т - длительность информационной посылки; Т0 - длительность ЛЧМ радиоимпульса; т0 - величина задержки между началом ЛЧМ радиоимпульса и началом

элемента ПСП, соответствующего нулевым значениям коэффициентов ; ¡л - крутизна модуляционной характеристики ЛЧМ радиоимпульса (скорость изменения частоты), связанная с его девиацией частоты ДР и длительностью Тп соотношением ^ = 2 ■ л- ■ Д^ / Г„.

Для оценки степени ортогональности анализируемых сигналов при произвольном временном и частотном сдвиге, как и при исследовании свойств ЛЧМ ФМ сигналов, используется огибающая ФВН, которая имеет вид:

N /V /V, Л',

--С--;--Ч

Л, Л',

¡-•схр +

+яР,(7—■-I—)+лйГ(<7—-/—га + УУ^.С!-"',,..)"

N N N N

-:—т-а--—)

^ Ы, NJ Л/ Nj

(/1(1 г | -/ + V - г„) + 2яЪ )Т„ I г I -/1- +1/1- - г„

N N N N

-:—г-с--—)

т т т т

*ехрО'(<Ч,(9—-/—+ "-/—--г0)4

0))+ X IС-"'мН'

1 Л/ Л'. " ° № Л',

-1 I --(1--=-'-)

*ехр + + (130)

Необходимо отметить, что слагаемые в (130) существуют при следующих значениях т:

Т Т Т Т

1) первое и четвертое слагаемые - при /--д--Т0<т<1—— + Г„,

N. Nj ЛГ.

т т т т

2) второе слагаемое - при /--а--т.,-т..<т<1— + <?—+Г„-г„,

у N. N¡ Nj

т т т т

3) третье слагаемое- при /—-<? — +г0-Г0 <г</—+ г+г„, ,

Л', И, NJ

Анализ результатов экспериментальных исследований огибающих ФВН ПС ЛЧМ сигналов и их сечений плоскостью Рг)=0 при различных значениях их параметров позволяет сделать вывод, что при модуляции ЛЧМ радиоимпульсов по задержке с помощью ПСП с различным числом элементов (Л^- Ф Щ максимальный уровень бокового выброса огибающей ФВН не превышает величины

(131)

где к - коэффициент, характеризующий число совпадений моментов возникновения одинаковых по значению элементов ПСП у различных ПС ЛЧМ сигналов (число совпадений моментов возникновения ЛЧМ радиоимпульсов), поэтому для обеспечения минимального уровня (131) N1 и /V, должны быть взаимно простыми числами.

Проведенные в работе исследования частотных характеристик этого класса сигналов показали, что ПС ЛЧМ сигналы выгодно отличаются от ЛЧМ-ФМ сигналов, так как ширина занимаемой им полосы частот остается постоянной, несмотря на изменение значений (ЬР*Т)1 N.

Таким образом, предложенные классы сигналов, по сравнению с существующими, при их использовании в многоканальных системах передачи информации с кодовым разделением адресов при организации связи с

подвижными объектами позволяют обеспечить меньшие затраты частотно-временных ресурсов ИТС из-за отсутствия дополнительных временных затрат на поиск и синхронизацию, необходимости введения защитных интервалов по частоте при воздействии эффекта Допплера и возможности одновременной передачи информации большему количеству абонентов.

В шестой главе приводятся предложения по технической реализации разработанных алгоритмов обработки речевых и канальных сигналов, минимизирующих затраты частотно-временных ресурсов ИТС на хранение и передачу речевых данных.

В заключении приведены основные результаты диссертационной работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ РАБОТЫ

1. Разработаны оптимальные методы и алгоритмы обработки речевых и канальных сигналов, позволяющие повысить эффективность ИТС при передаче и хранении речевых данных на основе минимизации затрат их частотно -временных ресурсов.

1.1.Созданы теоретические положения оптимального частотного анализ/синтеза сигналов на основе математического аппарата собственных функций субполосных ядер, позволившие адекватно сформулировать вариационные условия и получить решения следующих оптимизационных задач:

• вычисления точных значений частей энергий отрезков сигналов в заданных частотных интервалах;

• наилучшей аппроксимации отрезков трансформант Фурье сигналов в заданных частотных интервалах;

• построения решающей функции максимальной чувствительности при обнаружении и кодировании пауз в речи;

• формирования широкополосных шумоподобных канальных сигналов с минимизацией времени на их обнаружение и синхронизацию на приемной стороне и выделяемой частотной полосы для каждого абонента при реализации связи между подвижными объектами.

1.2. Разработаны методы и алгоритмы эффективного сжатия речевых данных на основе оптимального обнаружения и кодирования пауз в речевых сообщениях и оптимального квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из совокупности ш-информационных частотных интервалов, которые определяют наилучшую, в смысле минимума евклидовой нормы погрешности, аппроксимацию соответствующих отрезков трансформант Фурье.

1.3. Созданы методы и алгоритмы формирования оптимальных канальных сигналов для передачи речевых данных по каналам связи,

обладающих максимальной концентрацией энергии в ограниченной частотной полосе при точном восстановлении исходных данных в условиях отсутствия помех.

1.4. Разработаны методы формирования широкополосных шумоподобиых канальных сигналов для передачи речевых данных с кодовым разделением ресурсов ИТС, позволяющие минимизировать время на их обнаружение и синхронизацию на приемной стороне и выделяемую частотную полосу для каждого абонента при реализации связи между подвижными объектами.

2. Разработаны предложения по технической реализации созданных алгоритмов обработки речевых и канальных сигналов на основе средств цифровой вычислительной техники.

3. Получены оценки частотных концентраций энергий отрезков речевых сигналов для всех звуков русской речи как отношений минимальных суммарных размеров совокупности частотных интервалов, где сосредоточена заданная доля энергии т к ширине всей частотной полосы и введено понятие ш-информационных частотных интервалов.

4. Показано, что оптимальная линейная субполосная частотная фильтрация на основе наилучшей в смысле минимума евклидовой нормы погрешности аппроксимации в заданном частотном интервале отрезка трансформанты Фурье исходного сигнала позволяет получить сигнал, который не зависит от энергии в смежных частотных интервалах, что доказывает целесообразность её применения при разделении канальных сигналов при передаче информации в режиме частотного уплотнения.

5. Установлены основные свойства вероятностей ошибок первого и второго .^родов при обнаружении пауз в речевых сигналах с помощью разработанной решающей функции максимальной чувствительности, что позволило разработать алгоритм обучения по реальным данным с целью установления границ критической области.

6. На основе разработанного аппарата субполосного анализа проведены детальные исследования влияния дискретизации на точность вычислений основных субполосных характеристик речевых сигналов, что позволило установить нижнюю границу для частоты дискретизации.

7.Созданы кодовые книги квазиоптимальных квантователей коэффициентов разложений отрезков речевых сигналов, соответствующих разным звукам русской речи, по собственным векторам субполосных матриц совокупности ш-информационных частотных интервалов.

8. Основные выводы диссертационной работы:

• аппарат собственных функций субполосных ядер является адекватной математической основой решения проблемы повышения эффективности ИТС при хранении и передаче речевых данных на основе разработки методов и алгоритмов обработки речевых и канальных сигналов, оптимальных в смысле минимизации затрат их частотно -временных ресурсов;

• разработанные в диссертации методы и алгоритмы обработки речевых сигналов позволяют сжать речевые данные в 20 - 25 раз без

существенной потери качества восстановления исходных речевых сообщений;

• разработанные алгоритмы достаточно просто и эффективно могут быть реализованы с помощью средств современной цифровой вычислительной техники;

• применение разработанных методов формирования и обработки канальных сигналов позволяет повысить эффективность использования частотных ресурсов каналов связи в 1,3- 1,5 раз по сравнению с используемыми в настоящее время.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи в журналах из перечня ВАК

1. Белов, С.П. Вариационные методы частотного анализа речевых сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Труды учебных заведений связи. - СПб., 2006. -№174. - С. 152-162.

2. Белов, С.П. Новый метод сжатия речевых данных [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Труды учебных заведений связи. -СПб., 2006. - №175. - С. 163-170.

3. Белов, С.П. Уменьшение объема битового представления речевых данных на основе нового метода удаления пауз [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ)». - М., 2007. - Вып. 2. - С. 124-139.

4. Белов, С.П. Оптимальное формирование дискретных канальных сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, И.Ю. Мисливец // Вопросы радиоэлектроники. Серия «РЛТ». -М., 2007. - Вып. 4. - С. 91-104.

5. Белов, С.П. Новый метод оптимальной линейной фильтрации для обработки речевых данных на ЭВМ [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ)». - М., 2008. - Вып. 1. - С. 132-143.

6. Белов, С.П. Возможность применения одного класса сложных сигналов с ЛЧМ для передачи речевых данных в цифровых мобильных системах связи [Текст] / Е.Г. Жиляков, С.П. Белов, A.C. Белов // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ) ». - М., 2008. - Вып. 1. -С. 161-171.

7. Белов, С.П. Исследование функции неопределенности псевдослучайных сигналов с линейной частотной модуляцией [Текст] / Е.Г. Жиляков, С.П. Белов, И.А. Сидоренко // Вопросы радиоэлектроники. Серия «РЛТ». - М., 2008. -Вып. 4. - С.100-109.

8. Белов, С.П. О различиях частотных свойств информационных и неинформационных звуковых сигналов речевого диапазона [Текст] / С.П. Белов, A.C. Белов // Научные ведомости БелГУ. Сер. Информатика. - Белгород: Изд-во БелГУ, 2008. -№ 10 (50), Вып. 8/1. - С. 86-94.

9. Жиляков, Е.Г. Частотное уплотнение и разделение дискретных канальных сигналов ограниченной длительности [Текст] / Е.Г. Жиляков, A.A. Лучин, С.П. Белов//Радиотехника. - 2008. - № 12.-С. 10-16.

10. Жиляков, Е.Г. Новый метод обнаружения пауз в речевых сигналах при их хранении и передаче в информационно-телекоммуникационных системах (ИТС) [Текст] / Е.Г. Жиляков, С.П. Белов // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ) ». - М., 2009. - Вып. 1. - С. 128-133.

П.Белов, С.П. О возможности использования одного класса сложных ЛЧМ сигналов для многоканальной передачи данных [Текст] / Е.Г. Жиляков, С.П. Белов // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ)». - М„ 2009. - Вып. 1.-С. 142-147.

12. Белов, С.П. Метод частотно-временного анализа сигналов [Текст] / С.П. Белов, A.C. Белов, Е.И. Прохоренко// Научные ведомости БелГУ Сер.: Информатика. - Белгород: Изд-во БелГУ, 2009. - № 1(56), Вып. 9/1. - С. 5-12.

13. Белов, С.П. Исследование особенностей комбинированной обработки сложных сигналов с линейной частотной модуляцией [Текст] / С.П. Белов, Д.И. Ушаков, И.А. Старовойт // Научные ведомости БелГУ Сер.: Информатика. -Белгород: Изд-во БелГУ, 2009. -№ 7(62), Вып. 10/1. - С 194-201.

14. Белов, С.П. Метод и алгоритм разделения канальных сигналов в информационно-телекоммуникационных системах с частотным уплотнением [Текст] // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ)». - М., 2010. - Вып. 1.-С. 135-146 .

15. Жиляков, Е.Г. Вариационные методы синтеза сигналов на основе частотных представлений [Текст] / Е.Г. Жиляков, С.П. Белов, A.A. Черноморец // Вопросы радиоэлектроники. Серия «Электронная вычислительная техника (ЭВТ)». - М.,2010. - Вып. 1.-С. 5-10.

16. Белов, С.П. Вариационные методы анализа сигналов на основе частотных представлений [Текст] / Е.Г. Жиляков, С.П. Белов, A.A. Черноморец // Вопросы радиоэлектроники. Серия «Электронная вычислительная техника (ЭВТ)». - М.,2010.-Вып. 1.-С. 10-26 .

17. Жиляков, Е.Г. Об эффективности различных подходов к сегментации речевых сигналов на основе обнаружения пауз [Текст] / Е.Г. Жиляков, С.П. Белов, A.C. Белов, A.A. Фирсова // Научные ведомости БелГУ Сер.: Информатика. - Белгород: Изд-во БелГУ, 2010. -№7(78), Вып. 14/1. - С. 187-1193.

18. Белов, С.П. Выбор и обоснование параметров решающей функции для обеспечения максимального различия информационных и неинформационных компонент речевых сигналов в частотной области [Текст] / A.B. Глушак, Е.Г. Жиляков, С.П. Белов, A.C. Белов, A.B. Курлов // Научные ведомости БелГУ. Сер.: Информатика. - Белгород: Изд-во БелГУ, 2010. -№13(84), Вып. 15/1. -С. 163-168.

19. Жиляков, Е.Г. Компьютерное моделирование формирования канальных сигналов на основе собственных векторов субполосных матриц [Текст] / Е.Г. Жиляков, С.П. Белов, Д.И. Ушаков, И.А. Старовойт // Вопросы радиоэлектроники. Сер. «Электронная вычислительная техника (ЭВТ)». -М„2011.-Вып. 1.-С. 131-141.

20. Жиляков, Е.Г. О возможности повышения эффективности использования выделенного частотного ресурса в системах с OFDM [Текст] / Е.Г. Жиляков, С.П. Белов, Е.М. Маматов, Д.И. Ушаков, И.А. Старовойт //

Информационные системы и технологии. - Орел: Изд-во ОГТУ 2011 -№ 1 (63). - С. 39-46.

21.Жиляков, Е.Г. О наилучшем ортогональном базисе для субполосного анализа и синтеза сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, C.B. Туяков, Д.В. Урсол // Информационные системы и технологии. - Орел: Изд-во ОГТУ, 2011,- №2(64).- С. 26-34.

22. Белов, С.П. Обнаружение звуков речи на фоне шумов [Текст] / С.П. Белов, Е.Г. Жиляков // Научные ведомости БелГУ. Сер.: Информатика. -Белгород: Изд-во БелГУ, 2012. -№7(126), Вып. 22/1. - С. 182-189.

Монографии

1. Жиляков, Е.Г. Методы обработки речевых данных в информационно -телекоммуникационных системах на основе частотных представлений [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко. - Белгород: Изд-во БелГУ, 2007.- 138 с.

2. Жиляков, Е.Г. Моделирование речевых сигналов на основе частотных представлений [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко, A.A. Черноморец, Н.С. Поболкова. - Белгород: Изд-во ООО «ГиК», 2010. - 157 с.

Публикации в сборниках научных трудов

1. Белов, С.П. О кодировании пауз в речевых сигналах [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко //Материалы 6-й Междунар. науч.-техн. конф. «Проблемы техники и технологии телекоммуникаций. - Уфа, 2005.-С. 73-74.

2. Жиляков, Е.Г.О сжатии речевых сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Материалы 5-й Междунар. науч.-техн. конф. «Проблемы информатики и моделирования». - Харьков, 2005. - С. 4.

3. Белов, С.П. О субполосном преобразовании звуковых сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Труды Российского научно-технического общества радиотехники, электроники и связи им. A.C. Попова. Сер. «Цифровая обработка сигналов и ее применение» - М., 2006. - Вып. VIII-1. -С. 167-169.

4. Белов, С.П. Вариационный метод интерполяции для формирования дискретных канальных сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, И.Ю. Мисливец // Труды Российского научно-технического общества радиотехники, электроники и связи имени A.C. Попова. Сер. «Системы синхронизации, формирования и обработки сигналов для связи и вещания». -Белгород, 2006. - С. 94-96.

5. Жиляков, Е.Г. Метод обнаружения пауз в речевых сигналах [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Труды Рос. науч.-техн. общества радиотехники, электроники и связи имени A.C. Попова. Сер. «Системы синхронизации, формирования и обработки сигналов для связи и вещания». - Белгород, 2006. - С. 96-98. .

6. Жиляков, Е.Г. Новый метод вычисления спектрограмм речевых сигналов [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко // Сборник докладов 13-й Междунар. науч.-техн. конф. «Радиолокация, навигация, связь». -Воронеж, 2007. - Т. 1. - С. 278-283.

7. Белов, С.П. Об оптимальной линейной фильтрации [Текст] / Е.Г. Жнляков, С.П. Белов, Е.И. Прохоренко, А, С. Белов // Труды Российского научно-технического общества радиотехники, электроники и связи им. A.C. Попова. Сер. «Цифровая обработка сигналов и ее применение». -М„ 2008.-Вып. 10-1.-С. 146-148.

8. Жиляков, Е.Г. Об одном методе обнаружения пауз в речевых сигналах [Текст] / Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко, А, С. Белов // Труды Российского научно-технического общества радиотехники, электроники и связи имени A.C. Попова. Сер. «Цифровая обработка сигналов и ее применение». -М.,2008.-Вып. 10-1.-С. 153-155.

9. Белов, С.П. О потенциальных возможностях селекции информационных и неииформационных компонент речевых сигналов [Текст] / С.П. Белов,

A.C. Белов // Тезисы докладов Междунар. науч.-практ. конф. «Информационные технологии и компьютерная инженерия». - Винница, 2010. - С. 137-139.

10. Жиляков, Е.Г. Информационная технология вариационной автоматической классификации распределений долей энергий отрезков русской речи в частотной области [Текст] / Е.Г. Жиляков, С.П. Белов, A.C. Белов, Е.М. Маматов, Д.В. Урсол, Д.И. Ушаков // Сб. науч. тр. Всерос. науч. конф. с элементами научной школы для молодежи «Параллельная компьютерная алгебра». - Ставрополь, 2010. - С. 292-297.

11. Жиляков, Е.Г. Об одном методе повышения эффективности использования выделенного частотного ресурса в системах с OFDM[TeKCT] / Е.Г. Жиляков, С.П. Белов, Д.И. Ушаков // Труды Рос. науч.-техн. общества радиотехники, электроники и связи им. A.C. Попова. Сер. «Цифровая обработка сигналов и ее применение». - М., 2011. - Вып. 13 -1. - С. 188-191.

Патенты и авторские свидетельства на изобретение

1. Авторское свидетельство № 1272954 от 22 июля 1986 г. «Устройство для формирования шумоподобных сигналов с линейной частотной модуляцией»

B.Д. Пашовкин, С.П. Белов, A.B. Брезгунов, Г.П. Давыдов, И.В. Рогожин.

2. Авторское свидетельство №1360557 от 15 августа 1987 г. «Система передачи дискретной информации» С.П. Белов, A.C. Оводков, К. А. Сугонякин

3. Авторское свидетельство № 1554751 от 1 декабря 1989 г. «Устройство передачи дискретной информации» С.П. Белов, В.И. Корыстин, С.И. Крохмаль, JI.B. Войченко.

4. Авторское свидетельство № 1581194 от 22 марта 1990 г. «Устройство для приема шумоподобных сигналов с линейной частотной модуляцией»

C.П. Белов, Г.П. Давыдов, В.Д. Пашовкин, В.А. Скрынник.

5. Авторское свидетельство № 1660564 от 1 марта 1991 г. «Цифровой формирователь линейно-частотно-модулированных сигналов» С.П. Белов, Г.П. Давыдов, В.Д. Пашовкин, В.А. Скрынник.

6. Патент России № 2317595 от 20 февраля 2008 года Способ обнаружения пауз в речевых сигналах и устройство его реализующее» С.П. Белов, А. С. Белов, Е.Г. Жиляков, Е.И. Прохоренко.

7. Патент России № 2365039 от 20 августа 2009 года «Цифровое устройство для формирования речевых сигналов в системах связи с частотным разделением каналов» С.ГГ. Белов, Е.Г. Жиляков, Е.И. Прохоренко, Д.В. Урсол.

8. Патент России № 2399101 от 10 сентября 2010 года «Способ обнаружения пауз в речевых сигналах и устройство его реализующее» С.П. Белов, Е.Г. Жиляков, A.C. Белов, В.В. Муромцев.

Свидетельства о государственной регистрации программ для ЭВМ

1. «Программная система цифровой обработки речевых данных» Отраслевой фонд алгоритмов и программ «Государственный координационный фонд информационных технологий», 2006.-№ 50200601604 Е.Г. Жиляков, С.П. Белов, Е.И. Прохоренко.

2. «Программная система отображения частотно-временных энергетических характеристик речевых данных» Свидетельство о государственной регистрации программ для ЭВМ, № 2007612714 от 22 июня 2007 года С.П. Белов, Е.Г. Жиляков, Е.И. Прохоренко.

3. «Система обработки речевых данных в информационно телекоммуникационных системах» Свидетельство о государственной регистрации программ для ЭВМ, № 2007610093 от 9 января 2007 года

С.П. Белов, Е.Г. Жиляков, Е.И. Прохоренко.

4. «Программная система обработки информационных и неинформационных звуковых сигналов» Свидетельство о государственной регистрации программ для ЭВМ, №2008614716 от 6 августа 2008 год

С.П. Белов, Е.Г. Жиляков, A.C. Белов, В.В. Муромцев, A.B. Курлов.

5. «Программная система очистки речевых сигналов от шума на основе частотных представлений» Свидетельство о государственной регистрации программ для ЭВМ, № 2009613656 от 9 июля 2009 года Е.Г. Жиляков,

С.П. Белов, A.C. Белов, A.B. Курлов, П.Г. Лихолоб.

6. «Программная система расчета оптимальных канальных сигналов для передачи в режиме частотного уплотнения» Свидетельство о государственной регистрации программ для ЭВМ, № 2010611077 от 5 февраля 2010 года С.П. Белов, Е.Г. Жиляков, Д.В. Урсол.

7. «Программная реализация информационной технологии формирования канальных сигналов с минимальным уровнем внеполосных излучений» Свидетельство о государственной регистрации программы для ЭВМ № 2011615973 С.П. Белов, Е.Г. Жиляков, Д.И. Ушаков.

Подписано в печать 20.07.2012. Гарнитура Times New Roman.

Формат 60*84/16. Усл. п. л. 2,0. Тираж 100 экз. Заказ 204. Оригинал-макет подготовлен и тиражирован в ИД ((Белгород» 308015 г. Белгород, ул. Победы, 85

- 199 12

2012095414

Оглавление автор диссертации — доктора технических наук Белов, Сергей Павлович

ВВЕДЕНИЕ.9

ГЛАВА 1. МЕТОДЫ И АЛГОРИТМЫ ОБРАБОТКИ РЕЧЕВЫХ И КАНАЛЬНЫХ СИГНАЛОВ ПРИ ХРАНЕНИИ И ПЕРЕДАЧЕ РЕЧЕВЫХ ДАННЫХ В ИТС. СОВРЕМЕННОЕ СОСТОЯНИЕ И ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЙ.24

1.1Проблема минимизации затрат ресурсов ИТС при хранении и передаче речевых данных.24

12 Процедуры регистрации, хранения и передачи речевых данных с применением компьютерных средств.29

1.3 Модели речеобразования и восприятия звуков речи слуховой системой человека, как основа сжатия речевых данных.36

1.4 Методы и алгоритмы обработки речевых данных, уменьшающих объемы их битовых представлений при хранении и передаче.50

1.5 Распределение частотно-временных ресурсов ИТС при передаче речевых данных.59

1.6 Задачи исследований.75

ГЛАВА 2. РАЗРАБОТКА И ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ

ОСНОВ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ.79

2.1 Субполосные представления в задачах обработки речевых и канальных сигналов. Характеристика проблемы.79

2.2 Разработка математических основ обработки речевых и канальных сигналов при хранении и передаче речевых данных в ИТС.89

2.3 Разработка алгоритмов отображения пространства отрезков речевых сигналов на дискретное пространство частотных интервалов.103

2.4Вычислительные эксперименты по оценке эффективности разработанных алгоритмов.116

2.4.1 Оценивание точности аппроксимации собственных функций субполосных ядер набором собственных векторов субполосных матриц.116

2.4.2 Оценивание погрешностей вычислений долей энергий отрезка речевого сигнала в заданных частотных интервалах на основе квадратурной формулы прямоугольников.125

Введение 2012 год, диссертация по информатике, вычислительной технике и управлению, Белов, Сергей Павлович

Актуальность работы. Современный этап развития общества характеризуется увеличением в информационно - телекоммуникационных системах (ИТС) потоков речевых сообщений, как наиболее естественной для человека формы информационного обмена. Для реализации эффективного удаленного взаимодействия на основе речевых сообщений в ИТС используются каналы различной физической природы. В настоящее время наблюдается устойчивая тенденция развития средств индивидуального взаимодействия пользователей, что приводит к росту числа ИТС, в которых для информационного обмена с использованием речевых сообщений применяются технологии беспроводного доступа с использованием канальных сигналов, параметры которых в кодированном виде содержат передаваемую информацию.

Однако возможности роста затрат частотно-временных ресурсов ИТС, под которыми в рамках этой работы понимается ширина частотной полосы и время, доступные для передачи информации в определенной системе, ограничены физическими и техническими факторами, а также объемами финансовых затрат. Это вызывает необходимость поиска путей улучшения использования частотно-временных ресурсов уже существующих каналов связи без существенного изменения их физических и технических характеристик, а также повышение эффективности информационных хранилищ.

Следует отметить, что сегодня решение указанной проблемы, в основном базируется на разработке способов минимизации затрат на хранение и передачу речевых сообщений за счёт уменьшения объёмов их битовых представлений (сжатия) и разработки новых методов передачи информации, основанных на формировании канальных сигналов, энергия которых максимально сосредоточена в заданном диапазоне частот при определенной их длительности

1,6-8,10,34-35,37,39-40,50-57,59,65,67,75,82-83,85,108,112,117-118,121-126,128

130,133,146-150,153-155,158-159,164,178,182-185,191-192,196,198

199,201,205,208-210,235-237,253-2545,256,258-260,266-269,271-272,274].

В области сжатия речевых данных в настоящее время основное внимание исследователей акцентируется на двух основных аспектах [1,6,10,37,39-40,53,56-57,67,110,121-126,128-131,149-150,155,158,164,180,184,187,191-192,198-199,209217-218,223,236-237,255-256,258-259,267-269]:

• обнаружение и кодирование пауз, возникающих между отдельными словами, которые в режиме диалога занимают до 50% его длительности;

• уменьшение объемов битовых представлений речевых сигналов, порождаемых собственно звуками речи.

Используемые сегодня в ИТС методы обнаружения пауз основываются на учете различий спектральных характеристик последовательности, принадлежащей звуку речи от последовательности данных в паузе (шуме) с применением так называемых фильтров линейного предсказания [40,67,128129,27,150,158,164,182-184,196,198,236-237,256].

Однако данный фильтр обладает рядом свойств, которые трудно отнести к достоинствам: наличие в решающей функции «мертвых зон», когда изменение одних параметров компенсируется изменениями других, возможное совпадение максимумов энергетических спектров шума и звука, что приводит к совместному их подавлению и ошибочному отнесению анализируемого участка к паузе, принятие мер по повышению достоверности принятия решения о наличии паузы приводят к необходимости анализа достаточно больших отрезков (до 0,6 с), что не позволяет достигать максимального уменьшения объемов битовых представлений речевых данных за счет обнаружения с последующим кодирование пауз. Это является следствием неадекватности математического аппарата, который лежит в основе алгоритмов обработки исходных речевых данных.

Для уменьшения объемов битовых представлений собственно звуков речи также разработаны различные процедуры обработки. Основой этих процедур служат необратимые преобразования исходных данных либо за счет более грубого квантования по уровню, либо путем построения моделей генерации, позволяющих осуществить их воспроизведение (вокодеры) [6,10,40,53,56,86,121-126,149,158,164,182-185,191-192,196,198-199,209,236-237,256,259,267-269]. Наибольшей степени сжатия удается достичь в случае применения вокодеров. Однако, при этом, наряду с разборчивостью воспроизводимой речи существенно искажается тембр и другие характеристики, что часто бывает неприемлемым, особенно при высоких требованиях к качеству воспроизведения исходных речевых сообщений.

Существующие методы уменьшения объемов битовых представлений собственно звуков речи с использованием грубого квантования по уровню основываются на психоакустической модели, что приводит к необходимости применения так называемых субполосных преобразований отрезков (векторов) отсчетов речевых сигналов [2-6,56-57,85,121-123,125-126,185,199]. В настоящее время для субполосного преобразования принято использовать процедуру прореживания выходных последовательностей КИХ - фильтров (фильтров с конечной импульсной характеристикой), настроенных на соответствующие участки оси частот [6,37,41,69-71,78,116,121-123,140,166,185,194-195,198199,232]. После квантования этих данных по уровню они могут либо сохраняться, либо подвергаться арифметическому кодированию для достижения большей степени сжатия. Восстановление исходных данных для воспроизведения речи принято осуществлять с использованием специально рассчитанных КИХ - фильтров. Такая процедура субполосного преобразования не является оптимальной в смысле минимума погрешностей аппроксимации спектров исходных векторов в выбранных частотных диапазонах, что приводит к увеличению погрешностей восстановления данных по квантованным значениям и, как следствие, к ухудшению качества воспроизводимой речи.

Таким образом, существует реальная необходимость осуществить разработку эффективных методов и алгоритмов сжатия речевых данных для минимизации затрат частотно-временных ресурсов ИТС при их хранении и передачи.

При передаче сжатых речевых данных минимизация затрат частотно-временных ресурсов ИТС сегодня в основном решается на основе применения методов, которые базируются на принципах формирования канальных сигналов с различными видами манипуляции, позволяющими в определенной степени сузить занимаемую полосу частот или повысить помехоустойчивость их приема [34-35,50-52,54-55,59,65,75,82-83,108,112,133,146,147-148,153

154,159,178,104,253-254,260,266,271,272,232]. Например, в системах мобильной связи GSM передача речевых сообщений осуществляется посредством применения канальных сигналов с GMSK манипуляцией (Gaussian Minimum Shift Keying) [50,59,75,108,112,148,235,272]. Эта гауссовская двухпозиционная частотная манипуляция с минимальным сдвигом обладает двумя особенностями, одна из которых - "минимальный сдвиг", другая - гауссовский вид огибающей модулирующего символа. Обе особенности направлены на сужение полосы частот, занимаемой GMSK-сигналом в канале радиосвязи. Однако эти модификации приводят к тому, что помехоустойчивость у таких сигналов не велика.

Методы передачи, обладающие высокой помехоустойчивостью (BPSK-двоичная фазовая манипуляция) как правило, занимают довольно широкую частотную полосу, что приводит к нерациональному использованию выделенных частотных ресурсов канала связи и, как следствие, к возникновению специфических видов помех, которые принято называть интерференционными [48,54,59,146,148,107,118,120,181,200,213,222,233]. Для уменьшения влияния этого типа помех на достоверность принимаемой информации приходится вводить защитные частотные или временные интервалы между соседними каналами связи, что также снижает эффективность использования имеющихся частотно-временных ресурсов ИТС.

Вместе с тем, применение новой разработки - технологии ортогонального частотного уплотнения (OFDM), в последнем поколении систем беспроводного широкополосного доступа (WiMAX), позволило обеспечить достаточно низкий уровень интерференционных помех и тем самым уменьшить защитные частотные интервалы (полосы) между соседними каналами [35,50-52, 75,108,112,210, 235,253-254,260,266,271,272,274,281]. Однако минимизировать уровень этого вида помех при использовании указанной технологии для передачи информации не представляется возможным из-за применения в качестве канальных сигнальных конструкций ортогональных базисов с прямоугольной формой модулирующего импульса.

Все рассмотренные выше классические методы узкополосной модуляции разработаны с целью достижения максимальной спектральной эффективности, т. е. передачи информации с возможно большей скоростью в возможно более узкой полосе частот [59]. Проблема заключается в том, что с увеличением числа пользователей количество каналов, выделенных для связи, должно возрастать. В то же время, как было указано выше, общий частотный ресурс ИТС является ограниченной величиной, и, более того, невозможно бесконечно уменьшать полосу частот, в которой осуществляется передача информации [59]. В системах связи с простыми сигналами эффективность использования выделенного частотного ресурса дополнительно снижается за счет того, что при большой неопределенности частоты, вызванной эффектом Допплера, и изменениях времени прихода принимаемых сигналов для снижения взаимных помех приходится вводить защитные интервалы по частоте [55].

Одним из методов, позволяющим кардинально увеличить число пользователей при ограниченном частотном ресурсе ИТС, является использование модулированных сигналов с расширенным спектром, иначе называемых сигналами с шумоподобным спектром или широкополосными шумоподобными канальными сигналами (ШШКС) [55,59,64,82,181,200,233,4244,109,177,215,219,233,238]. Основная идея применения сигналов с расширенным . спектром заключается в том, чтобы вместо узкополосного модулированного сигнала, осуществляющего передачу информации в выделенном ограниченном участке спектра, использовать сигнал с расширенным спектром, занимающим весь выделенный для системы связи участок спектра [59]. Но при этом значительное количество пользователей могут одновременно использовать выделенную полосу частот. Для разделения пользователей, работающих одновременно в одной и той же полосе частот, применяется расширение спектра цифрового модулирующего сигнала (а значит, и высокочастотного сигнала) с помощью специальной кодовой последовательности. Каждому пользователю назначается персональная кодовая последовательность для расширения спектра, которая и позволяет абонентам выделять из совокупности принимаемых реализаций ШШКС только предназначенный им сигнал. Поскольку общее количество кодов может быть очень велико, то и количество пользователей в выделенной полосе частот может быть значительно больше, чем при разбиении выделенной полосы частот на отдельные подканалы [59,200].

В настоящее время при построении современных ИТС широко применяются ШШКС сформированные посредством модуляции по фазе гармонического несущего колебания по закону изменения псевдослучайной кодирующей последовательности (ФМ ПСП) [42-44,55,109,119,177,200,215,233, 238], которые хотя и реализуют в определенной степени все указанные преимущества сложных сигналов, однако при их использовании, особенно при передаче информации в системах мобильной или спутниковой связи возникает необходимость устранения неопределенности по частоте, что приводит к дополнительному увеличению времени поиска и синхронизации, а также к значительному усложнению аппаратуры их обработки.

Таким образом, возникает необходимость разработки эффективных методов и алгоритмов формирования и обработки канальных сигналов для передачи сжатых речевых данных с минимизацией частотно-временных затрат ИТС.

Из сказанного становится очевидным, что необходимость учета различных аспектов хранения и передачи речевых данных, включая принципы построения технических средств передачи информации по каналам связи различной природы и множественность критериев оценки качества звучания речевых сообщений, придает проблеме минимизации затрат частотно-временных ресурсов ИТС, системный характер, а ее решение отвечает требованию оптимизации этого важного класса технических систем.

Целью работы является повышение эффективности использования ИТС при хранении и передаче речевых данных на основе разработки минимизирующих затраты их частотно-временных ресурсов вариационных методов субполосной обработки речевых и канальных сигналов.

Для достижения поставленной цели были сформулированы и решены следующие основные задачи.

1.1. Разработка и исследование математических основ оптимального субполосного анализа речевых сигналов.

1.3. Разработка и исследование методов уменьшения объемов битовых представлений данных об отрезках речевых сигналов, порождаемых звуками русской речи на основе квантования по уровню коэффициентов разложения по собственным векторам субполосных матриц из т-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей.

Методы и средства исследований. При решении указанных задач использовались методы теории преобразования Фурье, оптимизации, линейной алгебры и теории матриц, теории информации, теории вероятностей и математической статистики, теории сигналов, включая цифровые методы их формирования и обработки, вычислительный эксперимент.

• метод восстановления канальных сигналов для систем цифровой передачи с частотным уплотнением на основе оптимальной линейной субполосной частотной фильтрации, позволяющий в отличие от используемой для этих целей КИХ-фильтрации исключить влияние смежных каналов передачи;

• методы формирования и обработки ТТТТТТКС для систем цифровой передачи с кодовым разделением адресов, обладающих по сравнению с существующими аналогичными классами канальных сигналов значительно большим объемом слабокоррелированных форм и свойством инвариантности к допплеровскому рассогласованию по частоте, что позволяет минимизировать затраты частотно-временных ресурсов ИТС при связи между подвижными объектами за счет эффективного использования выделенной частотной полосы и обеспечения одновременного информационного обмена для большего количества абонентов.

Реализация результатов исследования осуществлена: в Белгородском филиале ОАО «РосТелеком», в ОАО «Концерн Созвездие», в НИИ «СпецРадио», в учебном процессе факультета компьютерных наук и телекоммуникаций НИУ «БелГУ» при подготовке специалистов по направлению инфокоммуникационные технологии и системы связи. Внедрения подтверждаются соответствующими документами.

Связь с научными и инновационными программами.

Результаты диссертационных исследований были использованы при выполнении ряда проектов в рамках следующих программ фундаментальных, поисковых и инновационных исследований:

• федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009 - 2013 шды», Государственный контракт № П964 от 27 мая 2010 г.;

• гранта РФФИ, проект №Ю-07-00326-а, 2009 - 2010 гг.;

• гранта РФФИ, проект № 12-07-00514-а, 2012 - 2014 гг.

Положения, выносимые на защиту.

1 .Теоретические положения, совокупность которых является вкладом в развитие перспективного направления - создание методов обработки речевых и канальных сигналов, повышающих эффективность использования частотно-временных ресурсов ИТС при хранении и передаче речевых данных.

• вычислений точных значений долей энергий сигналов в заданных частотных интервалах;

• наилучшей аппроксимации отрезков трансформант Фурье сигналов в заданных частотных интервалах;

• построения решающей функции максимальной чувствительности при обнаружении и кодировании пауз в речи;

• формирования IIШЖС с минимизацией времени на их обнаружение и синхронизацию на приемной стороне и выделяемой частотной полосы для каждого абонента при реализации связи между подвижными объектами.

1.2. Методы сжатия речевых данных на основе оптимального обнаружения и кодирования пауз и квантования по уровню коэффициентов разложения отрезков сигналов, принадлежащих собственно звукам речи, по собственным векторам субполосных матриц из ^-информационных частотных интервалов с применением кодовых книг квазиоптимальных квантователей.

Специальность, которой соответствует диссертация. Содержание диссертации соответствует паспорту специальности 05.13.01 -системный анализ, управление и обработка информации (технические науки) по следующим областям исследования. п.1. Теоретические основы и методы системного анализа, оптимизации, управления, принятия решения и обработки информации. п.4. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решения и обработки информации. п.12. Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации.

Апробация результатов диссертационных исследований. Результаты диссертационных исследований обсуждались на 18 научно-технических конференциях: 6-й Международной научно-технической конференции «Проблемы техники и технологии телекоммуникаций (г. Уфа, 2005 г.); 5-й и 6-й Международных научно-технических конференциях «Проблемы информатики и моделирования» (г. Харьков, Украина, 2005, 2006 гг.); 8-й, 10-й и 13-й Международных конференциях и выставках «Цифровая обработка сигналов и ее применение» (г. Москва, 2006, 2008, 2011 гг.); на международном научно-техническом семинаре «Системы синхронизации, формирования и обработки сигналов для связи и вещания» (г. Белгород, 2006 г.; г. Воронеж, 2009 г.; г. Нижний Новгород, 2010 г.; г. Одесса, Украина, 2011 г.); 13-й Международной научно-технической конференции «Радиолокация, навигация, связь» (г. Воронеж, 2007 г.); Международной научно-практической конференции «Информационные технологии и компьютерная инженерия» (г. Винница, Украина, 2010 г.); 10-й и 11-й Международных научно-практических конференциях «Исследование, разработка и применение высоких технологий в промышленности» (г. Санкт-Петербург, 2010, 2011 гг.); 2-й Международной научно-практической конференции «Информационные технологии и компьютерная инженерия» (г.Харьков, Украина, 2011г.); XII Международной научно-практической конференции «Кибернетика и высокие технологии XXI века» (г. Воронеж, 2011 г.); 2-й Международной научно-технической конференции «Компьютерные науки и технологии» (г. Белгород, 2011 г.).

Заключение диссертация на тему "Методы и алгоритмы повышения эффективности информационно-телекоммуникационных систем при хранении и передаче речевых данных"

ЗАКЛЮЧЕНИЕ

1.1.Созданы теоретические положения оптимального частотного анализа речевых и синтеза канальных сигналов на основе математического аппарата собственных функций субполосных ядер, позволившие адекватно сформулировать вариационные условия и получить решения следующих оптимизационных задач:

•вычисления точных значений частей энергий отрезков сигналов в заданных частотных интервалах;

•наилучшей аппроксимации отрезков трансформант Фурье сигналов в заданных частотных интервалах;

•построения решающей функции максимальной чувствительности при обнаружении и кодировании пауз в речи;

•формирования и обработки канальных сигналов с максимальной концентрацией энергии в заданной частотной полосе при точном восстановлении передаваемых данных;

•формирования ШШКС с минимизацией времени на их обнаружение и синхронизацию на приемной стороне и выделяемой частотной полосы для каждого абонента при реализации связи между подвижными объектами.

1.2. Разработаны методы и алгоритмы эффективного сжатия речевых данных на основе оптимального обнаружения и кодирования пауз в речевых сообщениях и оптимального квантования по уровню коэффициентов разложения отрезков речевых сигналов по собственным векторам субполосных матриц из совокупности т-информационных частотных интервалов, которые определяют наилучшую, в смысле минимума евклидовой нормы погрешности, аппроксимацию соответствующих отрезков трансформант Фурье.

1.3. Созданы методы и алгоритмы формирования оптимальных канальных сигналов для передачи речевых данных по каналам связи, обладающих максимальной концентрацией энергии в ограниченной частотной полосе при точном восстановлении исходных данных в условиях отсутствия помех.

1.4. Разработаны методы формирования ТТТТТТКС для передачи речевых данных с кодовым разделением ресурсов ИТС, позволяющие минимизировать время на их обнаружение и синхронизацию на приемной стороне и выделяемую частотную полосу для каждого абонента при реализации связи между подвижными объектами.

3. Получены оценки частотных концентраций энергий отрезков речевых сигналов для всех звуков русской речи как отношений минимальных суммарных размеров совокупности частотных интервалов, где сосредоточена заданная доля энергии т. к ширине всей частотной полосы и введено понятие ^-информационных частотных интервалов.

5. Установлены основные свойства вероятностей ошибок первого и второго родов при обнаружении пауз в речевых сигналах с помощью разработанной решающей функции максимальной чувствительности, что позволило создать алгоритм обучения по реальным данным с целью установления границ критической области.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00