автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.19, диссертация на тему:Компьютерные технологии обеспечения безопасности оперативных аудиоданных в условиях информационно-технического противодействия
Автореферат диссертации по теме "Компьютерные технологии обеспечения безопасности оперативных аудиоданных в условиях информационно-технического противодействия"
ЦЕНТРАЛЬНЫЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИСТУТ РАДИОЭЛЕКТРОННЫХ СИСТЕМ АО "ЦНИИРЭС"
На правах рукописи
Для служебного пользования
О
Экз. № о
ДВОРЯНКИН СЕРГЕЙ ВЛАДИМИРОВИЧ
КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ ОПЕРАТИВНЫХ АУДИОДАННЫХ В УСЛОВИЯХ ИНФОРМАЦИОННО-ТЕХНИЧЕСКОГО ПРОТИВОДЕЙСТВИЯ
Специальность 05.13.19 - методы и системы защиты информации, информационная безопасность
АВТОРЕФЕРАТ диссертации па соискание ученой степенн доктора технических наук
Москва - 2000
Диссертация выполнена в Центральном Научно-исследовательском Институте Радиоэлектронных Систем (АО "Щ1ИИРЭС")
Научный консультант:
доктор технических наук,
профессор Минаев Владимир Александрович.
Официальные опаонснты:
доктор технических наук,
профессор Чудновский Леонид Семенович
доктор технических наук,
с.н.с. Карпычев Вдадимир Юрьевич
доктор технических наук, доцент Скрыль Сергей Васильевич
Ведущая организация - Московский инженерно - физический институт (Технический Университет).
Защита диссертации состоится "26" декабря 2000 г., в 11 часов на заседании диссертационного совета ССД 115.21.01 в Центральном Научно-исследовательском Институте Радиоэлектронных Систем (АО "ЦНИИРЭС") по адресу: 129110, г. Москва, Проспект Мира, д.69.
С диссертацией можно ознакомиться в специальной библиотеке
ЦНИИРЭС
Автореферат разослан " 24 " декабря 2000 г.
Ученый секретарь
диссертационного совета ССД 115.21.01 кандидат технических наук, с.н.с.
Е.Г. Геннадиева
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Современные социально-экономические условия в России характеризуются общим ростом и ухудшением качественных характеристик преступности, возникновением и развитием новых форм преступных проявлений, оснащением криминальных структур современными техническими средствами, как разведывательного характера, так и предназначенных для проведения информационных атак и психологических воздействий в каналах информационного обмена.
Сегодня можно констатировать, что проблема контроля и управления потоками информации применительно к правоохранительным структурам переходит на качественно новый уровень. Такое понятие как "информационная война", применявшееся ранее в военном деле, в настоящее время наполняется новым смыслом и становится привычным явлением, как в столкновении противоборствующих политических сил, так и в противостоянии правоохранительных органов и преступного мира, которое теперь можно определить как информационное противодействие в правоохранительной сфере.
Основные понятия и направления информационного противоборства на государственном уровне были заложены в работах Лазарева И.А., Рассторгуе-ва С.П., Черешкина Д.С. и других.
В то же время рассмотрению ведомственных аспектов информационного противоборства, и, прежде всего, в сфере борьбы с организованной преступностью как наиболее подготовленным ядром преступного мира, внимание исследователей практически не уделялось.
Как отмечается в работах Каретникова М.К., Овчинского A.C., Овчинского B.C., Овчинского С.С., Фомина A.B. и других, сегодня информационное противоборство в правоохранительной сфере характеризуется небывалым размахом и особой непримиримостью. Для достижения своих корыстных целей извлечения максимальной прибыли из противозаконной деятельности, организованные преступные сообщества применяют любые способы и уловки, в том числе используют информационные технологии для проведения разведывательных мероприятий, нанесения информационных атак, проведения информационно-психологических воздействий и защиты своей информационной инфраструктуры от действий правоохранительных органов.
Поэтому следует говорить о создании системы комплексного информационного противодействия организованной преступности, насыщению ее новыми формами и способами ведения информационной войны на основе современных мультимедийных технологий через добывание, анализ, обработку, использование и защиту оперативной информации и ее наиболее значимой - акустической составляющей.
В этой связи, краеугольным камнем создания и функционирования подобной системы могут стать основополагающие результаты в области информационной безопасности и защиты информации таких известных ученых как Абалмазов А. Э., Герасименко В.А, Кузьмин A.C., Минаев В.А., Петраков A.B., Саблин В.Н., Скрыль C.B., Хорев A.A., Ярочкин В.И. и других.
Сегодня с уверенностью можно утверждать, что в оперативно-розыскной деятельности (ОРД) правоохранительных органов и специальных служб информация, получаемая с помощью новых информационных технологий, играет все более решающую роль, а способ передачи и фиксации оперативных информационных сообщений в виде устной речи, и ее цифрового представления -оперативных аудиоданных является одним из самых распространенных.
В настоящее время на рынке специальной техники присутствует широ-I(ийpOngKj^j^rmiooSpсизных устройств несанкционированного съема аудиоин-
ГОСУДАРСТВЕННАЯ БИБЛИОТЕКА
формации и блокировки каналов ее утечки, отличающихся как своим исполнением (автономные устройства или программно-аппаратные средства), так и используемыми методами обработки аудиосигналов, принимаемых или передаваемых в каналы связи. Понятно, что все эти устройства тем или иным путем могут оказаться в руках у преступных элементов.
Применяемая в настоящее время в правоохранительных органах аппаратура добывания (разведывания), защиты, анализа и обработки акустических (речевых) сигналов в силу своей ограниченности по областям применения, типам каналов связи, эффективности использования, уровню стойкости, стыковке с другим оборудованием, стоимости и т.п. обладает весьма ограниченными возможностями для решения все возрастающего объема задач в области обеспечения безопасности аудиоинформации, и, в связи с этим, находит пока в оперативно-служебной деятельности правоохранительных органов весьма незначительное применение.
В настоящее время автоматизированные речевые информационные технологии еще не развиты настолько хорошо, чтобы их можно было широко внедрять во все виды практической деятельности правоохранительных органов и специальных служб. Исключением являются криминалистическая фоноскопия, компьютерная телефония (открытая и закрытая) и, отчасти, оперативно-технические мероприятия, в ходе которых производится звукозапись и регистрация на стационарных, хорошо оборудованных пунктах аудиоконтроля.
Следует заметить, что оперативные аудиоданные, как правило, не используются в качестве вещественных доказательств, а служат промежуточным рабочим материалом в ходе оперативно-розыскных мероприятий для предотвращения готовящихся преступлений, разобщения и ликвидации преступных сообществ, получения новых данных о преступной деятельности, которые в дальнейшем могут использоваться как доказательная база. Для протоколирования оперативной информации в ходе переговоров, встреч, совещаний, а также во время розыскных, контролирующих и других действий применяются различные общедоступные и скрытые средства звукозаписи. В ряде случаев низкое качество полученной звукозаписи (фонограммы) создает определенные трудности при понимании и осмыслении полученной информации. Причины этого заключаются как в неудачном или неумелом выборе и использовании технических средств, так и в объективной трудности, выражающейся в невозможности получения высококачественной, «чистой» записи звука в некоторых конкретных обстоятельствах в условиях информационно-технического противодействия. В добавление к этому необходимо обеспечивать безопасность, а зачастую и бескомпроматность, речевой связи в общедоступных каналах телекоммуникаций с оперативными работниками находящимися в местах чрезвычайных ситуаций и с агентурой в криминальной среде.
В этом состоит существенное отличие оперативных аудиоданных от криминалистических фонограмм, к качеству записи и обработке которых предъявляются очень жесткие требования. Вот почему научный потенциал проведения фоноскопических экспертиз, существенный вклад в который внесли Атал Б., Женило В.Р., Зеленый А.И., Поспелов Б.В., Потапова Р.К., Рабинер Л., Рами-швили Г.С., Сердюков В.Д., Сорокин.В.Н., Фант Г., Чудновский Л.С. и другие лишь отчасти может быть применим для защиты и обработки оперативных аудиоданных, получаемых в условиях информационно-техническом противодействия в правоохранительной сфере.
Оценивая реальные возможности автоматической обработки устной речи в большинстве правоохранительных структур, можно утверждать, что в настоящее время реально разрешим лишь очень небольшой круг задач, состав-
ляющих проблему обеспечения безопасности оперативных аудиоданных в условиях информационного противодействия, несмотря на всю актуальность данной проблемы.
В условиях ограниченных финансовых и кадровых ресурсов, которыми располагают сегодня правоохранительные органы, становится крайне необходимой разработка технологически гибкого инструментария, позволяющего на основе известных, стандартных технических средств компьютерной телефонии, мультимедийных технологий и новых методов цифровой обработки акустических сигналов и речи обеспечивать, с одной стороны, высокую защищенность акустической составляющей оперативной информации, используемой в процессе оперативно-розыскной деятельности (ОРД) правоохранительных органов, а с другой-анализировать, обрабатывать, распознавать, восстанавливать и в конечном итоге использовать оперативные аудиоданные, полученные в условиях информационно-технического противодействия со стороны организованных преступных групп (ОПГ), для предотвращения, раскрытая и расследования преступлений.
Таким образом, цепью диссертационной работы является увеличение объема и повышение качества извлекаемой полезной информации из оперативных аудиоданных, создание условий для их надежной защиты в процессе передачи, приема и хранения на базе теоретического обоснования, математической и программно-алгоритмической реализации комплекса технологий обеспечения безопасности оперативных аудиоматериалов, получаемых и используемых в ходе оперативно-розыскной деятельности в условиях информационно-технического противодействия.
Научная проблема, решенная в диссертации, состоит в разработке теоретических основ и практической реализации средств и методов обеспечения безопасности оперативных аудиоданных на основе новых компьютерных технологий анализа-синтеза и обработки нетрадиционных параметрических описаний акустического (речевого) сигнала.
Решение проблемы позволило увеличить объем и повысить качество извлекаемой полезной информации из преднамеренно и непреднамеренно искаженных аудиосигналов и речи, оценивать реальную эффективность технических средств защиты речевых сообщений, создавать стойкие и надежные технологии технического закрытия и маскирования акустических и речевых сигналов, расширить области применения компьютерных технологий безопасности, ставить и решать новые задачи, постановка и решение которых ранее не были возможными.
В настоящее время реализовать такую гибкость в специализированных компьютерных системах можно только с помощью: во-первых, новых методов цифровой обработки и анализа-синтеза звуковых и речевых сигналов (РС) на основе образного анализа изображений их динамических спектрограмм и новых нетрадиционных моделей процессов речеобразования и слухового восприятия; во-вторых, мультимедийных технических средств в составе персонального компьютера, звуковой карты, модема или устройства стыка компьютера с телефонной линией или каналом связи; и, в-третьих, с помощью применения сертифицированных программных средств криптографической защиты потоков данных, представляющих речь или ее параметры.
Несмотря на то, что разработка и совершенствование методологии защиты информации является чрезвычайно актуальной проблемой, специальные исследования по созданию и применению компьютерных технологий безопасности оперативных аудиоданных (БОА) носят достаточно ограниченный характер, а сколь либо целостная теория пока отсутствует.
Изложенное дает основание утверждать, что данная научная проблема является чрезвычайно актуальной, а связанные с этим направлением вопросы создания и функционирования компьютерных технологий безопасности оперативных аудиоданных нуждаются в проработке как в методическом, так и в прикладном аспектах.
Для достижения цели исследования и решения научной проблемы были поставлены и решены следующие научные задачи:
1. Проведение анализа состояния проблемы обеспечения безопасности оперативных аудиоданных с учетом оперативно-технических особенностей применения специализированных компьютерных систем аудио обработки в деятельности правоохранительных органов и специальных служб.
2. Теоретическое обоснование созданию и применению компьютерных технологий образного анализа оперативных аудиоданных.
3. Создание системы моделей аналитического описания акустического (речевого) сигнала при его образном компьютерном представлении.
4. Выбор алгоритмической основы процессов функционирования специализированных компьютерных систем аудиообработки.
5. Построение комплекса базовых элементов специализированных компьютерных систем образного анализа, защиты и обработки оперативных аудиоданных.
6. Теоретическое обоснование использование методов цифровой обработки изображений графических образов аудиосигналов и речи, с последующим переходом от графического, образного к волновому представлению аудиосигналов на временной оси.
7. Разработка критериев оценки качества синтеза аудиосигналов по изображениям их графических образов, заключающихся в сравнении волновых форм и субъективной оценки звучания восстановленного аудиосигнала по отношению к исходному, после различных видов его обработки.
8. Компьютерная реализация, экспериментальные исследования и оценка разработанных методов анализа-синтеза, защиты и обработки оперативных аудиоданных на основе их параметрического описания в виде суммы узкополосных сигналов.
9. Создание технологии проектирования специализированных компьютерных систем обеспечения безопасности оперативных аудиоданных и оценка перспективных направлений их применения.
Объект исследования - технология обеспечения безопасности оперативных аудиоданных в процессе передачи, фиксации, обработки и анализа аудиосигналов и речи, а также их параметрическое представление.
Предмет исследования - модели, методы и средства анализа-синтеза и обработки оперативных аудиоданных в целях обеспечения их защиты в условиях информационно-технического противодействия.
Методология и методы исследования. Методология исследования основана на теории функционального анализа, теории статистической радиотехники, теории образного анализа экспериментальных данных, акустической теории речеобразования, теории восстановления сигналов и изображений, теории связи и информации и теории вероятностей.
Для решения поставленных задач использовались методы защиты информации и информационной безопасности, методы системного анализа, методы функционального анализа и линейной алгебры, матричный анализ, методы оптимизации, математические методы цифровой обработки и анализа сигналов и изображений, элементы нелинейного и системного программирования, численные методы оптимизации и эксперименты.
Обоснованность и достоверность результатов:
- обеспечиваются корректным применением апробированного математического аппарата при решении поставленных задач,
- подтверждаются совпадением полученных результатов с известными (в некоторых предельных случаях), экспериментальной проверкой эффективности разработанных методов анализа-синтеза, защиты и обработки акустических сигналов и речи с использованием цифрового моделирования данных процессов на ПЭВМ, реальных акустического и телефонного каналов связи, а также аудиокассет с предварительно записанными на них аудио образцами.
Основные положения, выносимые на защиту:
1. Теоретические положения образного анализа аудиоданных и цифровой обработки изображений их графических образов применительно к решению задач обеспечения безопасности речевой связи на основе компьютерных технологий.
2. Система моделей параметрического описания акустического (речевого) сигнала, представляемого на коротких временных интервалах анализа-синтеза в виде суммы конечного числа узкополосных звуков - следов фонообъектов;
3. Комплекс базовых элементов и алгоритмическая реализация процессов функционирования специализированных компьютерных систем обеспечения безопасности оперативных аудиоданных на основе дискретного динамического спектрального анализа с возможностью смены ортогональных базисов, а также с сохранением или искажением фазовых спектральных характеристик, позволяющая моделировать и анализировать широкий класс аудио и речепреобра-зующих устройств (РПУ).
4. Методы выявления, изменения, восстановления и реконструкции следов фонообъектов - параметрических описаний акустического (речевого) сигнала, представленного в виде суперпозиции узкополосных процессов на частотно-временных матрицах динамических спектральных состояний (МДСС) звукового сигнала, в том числе и на изображениях динамических амплитудных и фазовых спектрограмм. На основе данных методов была разработана методическая основа решения проблемы и практических задач безопасности оперативных аудиоданных правоохранительных органов в процессе информационно-технического противодействия.
5. Обобщенный критерий оценки качества звучания акустических сигналов (АС) и речи, синтезированных по изображениям их графических образов, заключающийся в нахождении и оценке расхождений параметров узкополосных сигналов, составляющих исходный и восстановленный после обработки аудиосигналы.
6. Способ построения специальных программно-аппаратных средств зву-ко- и речепреобразования на основе стандартной вычислительной техники, известных средств мультимедиа и компьютерной телефонии, сочетающий идею перевода звукового сигнала в вид графических образов (изображений соно-грамм и фазограмм) и обратно из изображения в аудиосигнал или речь без потери информативности и/или разборчивости с возможностями известных и перспективных методов цифровой обработки изображений;
7. Методика проектирования специализированных систем обеспечения безопасности оперативных аудиоданных, компьютерная реализация их базовых элементов и результаты экспериментальных исследований.
8. Компьютерные технологии обеспечения безопасности речевой связи (ОБРС) на основе разработанных быстрых алгоритмов вычислений динамических дискретных частотно-временных преобразований аудиосигналов, выявления и реконструкции, входящих в их состав следов фонообъектов
9. Рекомендации по практической реализации синтезированных алгоритмов в виде примеров решения наиболее часто встречающихся в практике правоохранительных структур задач обеспечения безопасности оперативных аудиоданных.
10. Рекомендации по оценке эффективности и выбору надежных и стойких технических средств защиты речевой информации, имеющихся на открытом рынке спецтехники для использования в оперативно-розыскной деятельности правоохранительных органов.
Научная новизна работы заключается в следующем:
1. Предложен принципиально новый подход к обработке акустического (речевого) сообщения путем преобразования его из первичной сигнальной формы в форму графических образов и обратно с возможностью использования для обработки звуков разработанных и перспективных методов цифровой обработки изображений.
2. Впервые предложена система моделей параметрического описания акустического (речевого) сигнала как суперпозиции узкополосных сигналов (элементарных фонообъектов) его составляющих, приемлемая для решения задач обеспечения безопасности речевой связи на основе использования компьютерных технологий.
3. Разработан обобщенный критерий оценки качества звучания акустического (речевого) сигнала, восстановленного после различных видов обработки, по отношению к звучанию исходного (открытого) РС, заключающийся в нахождении и оценке расхождений параметров узкополосных сигналов (следов фонообъектов), составляющих исходный и восстановленный аудио сигналы.
4. Экспериментально подтверждена связь частотно-временных преобразований над следами фонообъектов с процедурами цифрового динамического спектрального анализа, а также показаны особенности решения задач, связанных с выделением, изменением и реконструкцией следов фонообъектов на изображениях динамических амплитудных и фазовых спектрограмм.
5. Разработаны методы синтеза аудиосигналов с заданными частотно-временными свойствами по параметрам (следам) их составляющих фонообъектов на изображениях динамических спектрограмм, не вызывающие интерференционных помех в каналах связи.
6. Разработаны методы выявления, изменения и реконструкции следов фонообъектов на частотно-временных матрицах динамических спектральных состояний (МДСС) звукового сигнала, в том числе и на изображениях динамических амплитудных и фазовых спектрограмм, с последующим синтезом и переходом во временную область.
7. Экспериментально подтверждена взаимосвязь между амплитудными и фазовыми спектральными характеристиками аудиосигналов, позволяющая на основе предложенных моделей параметрического описания акустического (речевого) сигналов синтезировать звуки с заданными частотно-временными характеристиками.
Практическая значимость исследования. Полученные в ходе исследований теоретические и экспериментальные результаты позволяют существенно расширить возможности цифровой обработки звука и речи через обработку их графических образов и при использованием описания аудиосигнала в виде суммы элементарных узкополосных процессов, по сравнению с традиционными методами цифрового спектрального анализа, что подтверждается приведенными в диссертации примерами решения задач из области обработки аудиосигналов и изображений их динамических спекторограмм, управления спектральными характеристиками следов фонообъектов и др.
Разработанные методы и алгоритмы позволяют решить широкий круг практических вопросов проектирования и создания компьютерных технологий безопасности речевой связи на основе стандартной вычислительной техники. Это дает возможность правоохранительным органам совершенствовать имеющиеся и разрабатывать собственные новые технологии безопасности речевой связи, проведения информационных атак и тактических информационно-психологических воздействий, независимо от открытых производителей аналогичной техники и, тем самым, получать и использовать преимущества в практических и информационных возможностях данных технологий.
В настоящее время разрабатываемые компьютерные технологии обеспечения безопасности оперативных аудиоданных на основе выявления и реконструкции следов фонообъектов находят свое применение в обработке звуковых и речевых сигналов, зафиксированных на магнитной ленте или в виде цифровых данных в компьютере в ходе проведения оперативно-следственных мероприятий при решении следующих наиболее значимых задач:
- оценки эффективности технических средств защиты речевых сообщений, используемых как правоохранительными органами, так и организованными преступными группами;
- установления текста высказываний и повышения разборчивости речи, искаженных шумами и помехами, а также в постановке высокоэффективных аку-стозаграждающих помех для защиты выделенных помещений; технического закрытия служебных телефонных переговоров субъектов правоохранительных органов на базе общедоступной вычислительной техники без синхронизации процессов закрытия-восстановления с использованием сертифицированных криптографических алгоритмов;
- в исследования признаков подлинности (монтажа) фонограмм при решении оперативных задач или в ходе следственных действий;
- сжатия - восстановления речевых сообщений с адаптацией к пропускной способности канала связи, предназначенных для использования в аппаратуре технического закрытия речевой связи и акустических закладках нового поколения с увеличенным объемом записи.
Это нашло свое отражение в полученных актах внедрения результатов диссертационной работы в практику правоохранительных органов.
Некоторые технологии аудиообработки, реализованные в виде специального программного обеспечения в составе мультимедийных компьютерных комплексов, используются при проведении лекционных, практических и лабораторных занятий со слушателями и студентами ВУЗов в ходе освоения ими таких учебных дисциплин как "Основы защиты информации", "Информационная безопасность" и т.п.
Реализация и внедрение результатов исследования. Основные теоретические исследования выполнялись в научной лаборатории Центрального научно-исследовательского института радиоэлектронных систем (ЦНИИРЭС). Ряд теоретических и практических результатов был получен в ходе выполнения плана НИР на кафедре информационной безопасности Московского Института МВД РФ в 1999-2000 гг. в соответствии с "Концепцией развития системы информационного обеспечения ОВД в борьбе с преступностью", утвержденной Приказом Министра внутренних дел от 12 мая 1993 г.
Кроме того, некоторые результаты настоящего диссертационного исследования использовались в ходе научно-исследовательских и опытно-конструкторских работ, выполнявшихся в течение 1983-2000 гг. в управлениях, институтах и частях МО и МВД РФ. Так отдельные теоретические результаты нашли свое практическое воплощение при разработке и применении специали-
зированных компьютерных систем нелинейного аудиовидеомонтажа в интересах ГУБОП МВД РФ.
Внедрение результатов диссертационной работы в практическую деятельность и учебный процесс подтверждается соответствующими актами из Главного управления по борьбе с организованной преступностью и коррупцией (ГУБОП) МВД РФ, Управления по борьбе с преступностью в сфере высоких технологий (УБПСВТ) МВД России, Технического управления (ТУ) МВД РФ, АО "ЦНИИРЭС", Московского технического университета связи и информатики (МТУСИ), Воронежского и Московского институтов МВД России и других организаций.
Результаты работы в виде моделей, алгоритмов, специальных программных и программно-аппаратных средств также могут найти свое применение при производстве изделий спецтехники в ГУ НПО "СпецТехника и Связь", в практической деятельности ГУБОП, ГУОТМ, УБПСВТ, ОПУ и УБНОН МВД России, а также в оперативно-технических подразделениях других российских правоохранительных структур.
Апробация работы. Основные результаты работы докладывались, обсуждались и получили одобрение на:
Военно-научных и научно-практических конференциях ЦНИИ 18 МО РФ в/ч 45807-Р (Москва, 1987, 1991-1995, 2000 гг.);
Международной конференции "Информатизация правоохранительных систем" (Москва, Академия управления МВД России, 1996-1997 гг.);
Меадународной конференции и дискуссионном научном клубе IP+NN',97 "Нейросетевые технологии обработки информации" (Украина, Крым, Гурзуф, 1997);
25 юбилейной международной конференции и дискуссионном научном клубе IT+CE',98 - «Новые информационные технологии в науке, образовании, телекоммуникациях и бизнесе» (Украина, Крым, Гурзуф, 1998 г.);
Международной конференции "IEEE ComSoc Digital Signal Processing And Its Applications - Цифровая обработка сигналов и ее применения" (Москва, IEEE ComSoc, 1998 гг.);
Международной конференции "Обработка информации в компьютерных системах" (Москва, МТУСИ. 1997,1998, 1999, 2000 гг);
Всероссийской научно-методической конференции "Актуальные вопросы подготовки специалистов в области защиты информации" (Москва, МИФИ, 1998г.);
Научно-практическом совещании-семинаре сотрудников оперативно-технических подразделений ГУБОП МВД России (Москва, ГУБОП МВД РФ, 2000г.);
Международной конференции "Информационная безопасность компьютеризированных систем" (Москва, Гротек, 2000 г.);
Международной научно-практической конференции "Россия, XXI век - антитеррор" (Москва, МВД РФ, 2000 г.).
Публикации. Общее количество авторских публикаций в области информационной безопасности - 68. Основные положения диссертации опубликованы в 56 научных работах. В их числе - авторское свидетельство на изобретение, монография, учебник, учебное пособие, 16 статей и докладов в специализированных печатных изданиях и тезисы докладов на конференциях.
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и списка литературы, изложенных на 387 страницах машинописного текста. Работа содержит 64 рисунка и 13 таблиц. В библиографию включено 196 наименований источников.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность работы, указываются проблема, цель, задачи, объект и предмет диссертационного исследования, показываются научная новизна, практическая значимость работы, апробация результатов исследований, приводятся основные положения, выносимые на защиту.
В первом разделе -" Современное состояние проблемы безопасности акустической составляющей оперативной информации "- содержится обзор современного состояния проблемы, выбор и обоснование цели и задач работы.
Показано, что информационное обеспечение оперативно-розыскной деятельности (ОРД) в рамках борьбы с организованной преступностью, коррупцией и международным терроризмом видится сегодня состоящим из трех взаимосвязанных компонентов: разведывательной, воздействующей и обеспечивающей (защищающей и обрабатывающей), - составляющих единый оперативный технологический контур добывания, защиты, обработки и использования оперативно-розыскной информации (ОРИ) с целью раскрытия, расследования и предотвращения преступлений. Если в первом компоненте у правоохранительных органов наблюдается определенный паритет с противоборствующей стороной, то во второй и третьей составляющей наблюдается существенное отставание.
Приводится определение оперативно-розыскной информации (ОРИ). Показано что ценность ОРИ, определяется степенью ее правового статуса, т.е. соответствующего правового оформления и документирования получаемых и используемых в раскрытии и расследовании преступлений данных, и что к такому определению ОРИ в большинстве случаев вполне применим понятийный аппарат, который используется для понятия конфиденциальная информация.
Рассматриваются варианты классификации информации по ее видам, отражающие различие подходов к проблеме обеспечения ее безопасности Особое внимание уделено тем их них, которые базируются на физической форме. Указывается, что физическая форма информации (звук, речь, свет, цвет и др.) в значительной степени определяет характер информационных угроз, технологии и сценарии их развития, возможности и способы информационно-технического противодействия.
Предложено такое разделение информации применить и к ОРИ с некоторой детализацией на документальные данные (текст, таблицы), аудиоданные (речь, звуки), видеоматериалы (видеоматериалы, фотоизображения, графика и анимация). Совокупность так представленных различных видов информации, реализуемую совместно хотя бы в двух отдельных перечисленных видах в компьютерных системах, предложено называть мультимедийной информацией или просто мультимедиа, не имея в этом контексте в виду технические средства и способы реализации и обработки различных видов информации
Отмечается, что в современных условиях криминогенной ситуации в России акустическая (речевая) составляющая оперативно-розыскной информации является наиболее важной с точки зрения информационного противоборства в правоохранительной сфере. Анализ показал, что на долю оперативных аудиоданных, согласно ряду открытых источников, приходится свыше 60% от всего объема ОРИ. Однако лишь менее 20% процентов имеющихся оперативных ау-диоматериалов могут быть использованы на дальнейших этапах раскрытия, расследования и предотвращения преступлений. Прежде всего, это связано с информационно-техническим противодействием организованных преступных групп (ОПГ) и в меньшей степени обусловлено условиями проведения опера-
тивной аудиозаписи, которая в последнее время все более часто совершается в цифровой форме.
Также отмечается, что более половины всех устройств специальной техники предназначены именно для целей скрытного получения аудио информации или, для ее защиты от получения и использования преступными элементами или конкурентами. Работники оперативно-технических подразделений зачастую не имеют должной подготовки для работы со всем многообразием сложных специальных технических средств. В большинстве случаев используемая ими специальная аппаратура или морально устарела или сильно изношена. Эта тенденция по прогнозам специалистов будет сохраняться и в будущем.
Аудиозаписи (аудиоданные) при проведении оперативно-технических мероприятий в условиях информационно-технического противодействия рассматриваются в диссертационном исследовании в двух аспектах, как с точки зрения добывания, обработки и последующего использования информации, так и с точки зрения ее защиты в процессе передачи, приема и хранения в каналах связи оперативно-тактического звена управления.
Приведена классификация источников конфиденциальной информации и технических каналов ее утечки или снятия (ТКУИ или ТКУСИ). Отмечается, что практически все известные источники и группы ТКУИ (ТКУСИ) разведывательной, конфиденциальной информации, в той или иной мере имеют отношение к акустической составляющей ОРИ.
Рассмотрены современные способы оценки акустической информации. Среди них:
- объем и качество получаемой аудиоинформации, выражаемое в фор-мантной (слоговой, словесной) разборчивости и натуральности (естественности) звучания согласно ГОСТ 50840/95;
- скорость передачи аудиоданных или их параметров;
- пропускная способность каналов речевой связи.
Исследованы причины, обуславливающей интерес к конфиденциальной аудиоинформации. Это:
- полиинформативность акустической (речевой) информации;
-достоверность и оперативность добываемой информации;
-доступность реализации скрытой и гласной аудиозаписи;
- быстрота реагирования на нештатные ситуации;
-документальность полученных сведений.
Отмечается, что в условиях ограниченного финансирования правоохранительные органы испытывают острую необходимость в методах и средствах надежной защиты речевой информации, циркулирующей в каналах информационного обмена оперативно-тактического звена, а также оценки эффективности уже применяющихся или закупаемых технических средств обеспечения безопасности речевой информации.
Показаны преимущества применения компьютерных технологий в целях обеспечения безопасности оперативных аудиоматериалов Перенастройка специализированных компьютерных систем на решение конкретной задачи (ОБРС) будет сведена лишь к замене существующего программного обеспечения на новое или к модернизации аппаратно-программного интерфейса с внешними датчиками-приемниками информационных сигналов. Таким способом может быть достигнута значительная экономия временных и материальных ресурсов, затрачиваемых сегодня на разработку средств специальной техники, увеличен срок их оперативного использования за счет обновления как, прежде всего, как программных, так и аппаратных компонентов.
Отмечается, что в настоящее время необходима разработка концепции по проектированию методов речевой обработки (речепреобразования), которые в совокупности с развитыми известными техническими средствами мультимедиа, компьютерной телефонии и др., обеспечивающими стык компьютера с каналами речевой связи, позволят создавать новые виды специальной техники, нацеленные на решение конкретной задачи в области безопасности речевой связи в открытых каналах телекоммуникаций. Причем в некоторых случаях применения такого рода компьютерные технологии могут быть использованы как наступательные (атакующие), а в других как оборонительные (защитные) составляющие создаваемых специализированных систем безопасности оперативных аудиоданных.
В исследовании рассматривается, прежде всего, оборонительный аспект создаваемых с помощью компьютерных технологий средств безопасности оперативной речевой связи в открытых, общедоступных каналах и ТКУИ (ТКУСИ) который в большинстве случаев предполагает двойственный подход к проблеме защиты оперативных аудиоданных с учетом как имеющегося ограниченного числа наиболее опасных угроз, так и всех возможных, исходя из предположения, что нарушитель обладает всем необходимым арсеналом знаний и технического оборудования для осуществления несанкционированного доступа к речевой информации в открытых общедоступных каналах связи (ОКС).
Под ОКС для обмена акустическими (речевыми) сообщениями понимаются как глобальные компьютерные сети типа Internet, сотовые и обычные телефонные линии, по которым ведутся или будут вестись переговоры, воздушная и иные среды распространения акустических колебаний или их производных, так и системы компьютерной голосовой (речевой) почты, цифровые или аналоговые автоответчики, диктофоны, магнитофоны, сохраняющие речевые сообщения (PC), а также средства хранения записанных речевых сигналов на аудиокассетах, дискетах и иных носителях, применяющих цифровое или аналоговое представление звуковых сигналов Отмечается, что по речевому каналу связи могут передаваться и аудиосигналы иной природы, например сигналы управления каким-либо устройством (набор номера телефона, код считывания сообщений с автоответчика). В разных ситуациях ОКС может находиться в трех различных состояниях: передача, прием, хранение.
Делается вывод, о том, что при решении задач, составляющих проблему безопасности оперативных аудиоданных, необходимо ввести определение и использовать критерий информационной полноты, когда исходный и обработанный аудиосигналы должны иметь близкие, насколько это возможно, волно вые формы (осциллограммы) во временной области В ряде других приложений будет необходимо, чтобы восстановленный после обработки сигнал звучал (воспринимался на слух) почти точно также как исходный Такой критерий был назван критерием полноты звучания. Поставлена задача разработки количественных мер оценки обоих критериев.
Отмечается, что основными понятиями, с которыми придется сталкиваться при обсуждении большинства вопросов обеспечения безопасности речевой связи посредством компьютерных технологий, являются понятия следов фонообъектов, параметрических описаний элементарных звуков, составляющих исследуемый или обрабатываемый аудиосигнал. Поэтому разработка и совершенствование компьютерных технологий обеспечения безопасности оперативных аудиоданных будет, прежде всего, зависеть от принятых количественных мер оценки следов различных фонообъектов. содержащихся в аудиосигналах и речи, передаваемых, принимаемых и хранимых в ОКС
В компьютерной фоноскопии в качестве фонообъекта предлагается понимать реальный объект, генерирующий и излучающий в звуковом диапазоне частот аудиосигналы, которые, будучи преобразованы в цифровую форму, хранятся в памяти компьютера в виде отдельных файлов. Под категорию фонообъекта попадают не только речь человека, но и звуки иной природы, в том числе и те, которые мешают правильному и качественному слуховому восприятию речевого сигнала, ухудшают или искажают его понимание. Под следами же фонообъекта нами предлагается понимать такое его параметрическое описание, которое позволяет либо полностью воссоздать его звучание, либо создать новый или реконструировать исходный аудиосигнал по заданным в этом параметрическом описании свойствам.
Показано, что данные, необходимые для расчета параметрических описаний следов фонообъектов, могут содержаться в динамических спектральных развертках речевого сигнала - амплитудно-фазовых частотно-временных описаниях мгновенных спектров речи, рассчитанных с заданным шагом наблюдения (анализа) по времени и по частоте, - и, прежде всего, в изображениях узкополосных амплитудных сонограмм. Исходя из этого, высказано предположение, что основным стержнем разрабатываемых компьютерных технологий безопасности приема, передачи и хранения речевых сообщений будет являться цифровая обработка аудиосигналов, основанная на динамических преобразованиях графических образов их спектрограмм (ига сонограмм), на которых в полной мере находят свое представление следы фонообъектов различной природы.
Показано, что основным способом несанкционированного доступа (НСД) к акустической информации является ее прослушивание. Поэтому подробно рассмотрены акустические технические каналы утечки. При анализе различных других групп существующих технических каналов утечки информации, сделан вывод о том, что основным видом информации, добываемой посредством использования электрических и электромагнитных каналов утечки или технических каналов утечки информации, обрабатываемой ТСПИ, являются речевые сообщения или аудиоинформация. Утверждается, что одним из основных источников и каналов утечки аудиоинформации являются общедоступные проводные и беспроводные каналы электросвязи, прежде всего, стандартные телефонные каналы и радиоэфир.
С позиций зарубежных экспертов приведены оценки вероятности утечки конфиденциальных сведений в ходе промышленного шпионажа и недобросовестной конкуренции путем прослушивания телефонных переговоров в каналах связи составляет около от 5% до 17%, прослушивания переговоров в помещениях и на открытом воздухе свыше 5%, и посредством видео наблюдения с одновременной фиксацией аудио и видеоинформации свыше 15% . Рассмотрены классификация и основные характеристики акустических закладок, в том числе и радио закладок.
Далее говорится, что в отечественных условиях наиболее распространенными, действенными, эффективными и опасными, в силу ряда причин, приемами такого способа НСД к аудиоинформации как прослушивание являются аудиоконтроль выделенных помещений, подключение к проводным каналам связи, перехват речевых сообщений из радиоэфира.
Отмечается, что в недалеком будущем к вышеперечисленным приемам НСД к аудиоинформации добавится добывание аудиоинформации из компьютерных сетей (1Р- телефония и другие средства открытой и закрытой компьютерной телефонии). Делается вывод о том, что при наличии у правоохранительных органов достаточно серьезного арсенала разведывательных средств
добывания аудиоинформации из выделенных помещений конфиденциальных переговоров и телефонных линий, следует констатировать их слабую подготовленность к аудио разведке в каналах телекоммуникаций, прежде всего в сотовой и компьютерной телефонии.
На имеющихся из открытых источников примерах показано, что методы и средства проведения акустических информационных и информационно-психологических атак хорошо известны преступным элементам. На вооружении органов внутренних дел такие методы и средства при всей их актуальности крайне редки, технологий защиты от такого рода воздействий пока не разработано. В тоже время отмечается, что технические решения, используемые для построения специализированных компьютерных систем нелинейного аудиови-деомонтажа могут служить хорошей технической основой для создания специализированных компьютерных систем обеспечения безопасности оперативных аудиоданных. При этом необходимо опираться на достижения открытой и ведомственной науки, известные технические разработки в области мультимедийных технологий.
Существующие отличия между оперативными аудиоданными и фонограммами, используемыми в качестве вещественных доказательств, позволяют лишь отчасти использовать научный потенциал и требования компьютерной фоноскопии к качеству магнитных фонограмм и построению фонотек при разработке и создании компьютерных технологий обеспечения безопасности оперативных аудиоданных.
Анализ основных тенденций развития средств инженерно-технического противодействия негласному получению аудиоинформации от различных видов угроз, а также анализ эффективности защиты информации в подразделениях правоохранительных органов, в связи с их, как правило, слабой технической оснащенностью привели к выводу о том, что одной из наиболее опасных угроз повседневной деятельности подразделений правоохранительных органов является подслушивание злоумышленниками служебных переговоров сотрудников по каналам телефонной и радиосвязи.
Отмечается, что совокупность инструментальных средств, используемых для решения задач моделирования и анализа методов и средств обеспечения безопасности оперативных аудиоданных, не соответствует современным требованиям функциональности, оперативности и надежности, для достижения которых наиболее предпочтительны цифровые методы анализа-синтеза, обработки речевых сигналов, а также измерения их параметров до и после обработки в РПУ на базе компьютерной технологии, совместимой с имеющейся и развивающейся технологией компьютерной фоноскопии.
Анализ состояния и перспектив развития технологий закрытия речевых сигналов позволил сделать выводы о том, что обработка речевых сигналов в таких системах должна осуществляться в бессинхронизационном режиме, в реальном масштабе времени, с высоким качеством звучания восстановленной (обработанной) речи при ее задержке относительно исходно РС не более 100 мс Количество возможных ключевых комбинаций закрытых РС с помощью преобразований в таких системах анализа-синтеза речи должно превышать 1 Кроме того, необходимо разработать методы оценки относительного изменения качества звучания речевого сигнала, обработанного в процессе моделирования и анализа РПУ систем закрытой телефонии, и определить параметры разрабатываемых систем анализа-синтеза, при которых качество звучания обработанной речи будет оставаться в том же классе, что и исходный РС
Так сформулированные общие принципы построения систем закрытой компьютерной телефонии были взяты за основу создания гибких программно-
аппаратных средств, ориентированных на решение широкого класса практических задач правоохранительных органов в области безопасности речевой связи с минимальными временными и финансовыми затратами на проектирование, разработку и реализацию.
Второй раздел - "Технологии образного анализа оперативных аудиоданных" посвяицен вопросам теоретического обоснования созданию и применению технологий образного анализа экспериментальных данных в отношении оперативных аудиоданных.
Рассмотрены возможности использования известных и малоизученных свойств речеобразования и слухового восприятия в образном анализе.
Из анализа современных технологий обработки речи, механизмов ее образования и слухового восприятия был сделан вывод о том, что для решения задач БОА должны обследоваться все группы акустических параметров, в которых могут отражаться базисные факторы работы и параметров обработки речевого сигнала в РПУ систем обеспечения безопасности оперативных аудиоданных:
- гармоническая и формантная структура речи в пределах главного окна образного анализа;
- форма огибающей спектра на вокализованных и шумовых участках в пределах выбранного главного окна анализа;
- периодичность голосовых импульсов и их частотная модуляция в пределах исследуемого частотно-временного элемента (ЧВЭ);
- импульсные и гармонические искажения на границах соседних ЧВЭ в аналоговых и цифровых системах закрытия речи, смонтированных фонограммах;
Отмечается, что среди этих параметров наиболее предпочтительны траектории линий гармоник основного тона (ЛГОТ) голоса в пределах одного вокализованного ЧВЭ анализа, поскольку они инвариантны к большому числу практически встречающихся видов аппаратурной обработки и искажений речевого сигнала, шумам и условиям акустической среды распространения.
Достаточно подробно исследовались существующие характеристики речи и способы оценивания речевой информации. Среди них: уровень громкости речи, ее натуральность (узнаваемость). Отмечается, что способов надежной объективной оценки последнего показателя пока не существует, однако в ряде источников высказываются предположения, что его характеристики, как и еще одного, отвечающего за узнаваемость речи могут содержаться в фазовых составляющих речевого сигнала (РС).
Основным показателем качества РС, считается его разборчивость Согласно ряду публикаций считается, что качество речевой информации хорошее, если обеспечивается свыше 40% слоговой разборчивости для речи средней громкости. В противном случае используется понятие «срыва связи» (понять речь практически невозможно). Разборчивость речи оценивается либо экспериментально (с использованием специальных текстовых таблиц, диктора и обученных артикуляционных бригад до 10 -15 человек), либо теоретически, посредством расчетов (или математического моделирования).
В первом случае, согласно ГОСТ 50840/95 оценка разборчивости наиболее часто производится по методу усредненных мнений аудиторов, после прослушивания ими имеющихся в этом документе фраз, слов и слогов. После чего по определенным методикам производится расчет усредненной оценки класса качества исследуемого канала речевой связи. Эти методики использовались в дальнейшем при испытаниях базовых элементов создаваемых специализированных компьютерных систем ОБРС.
Далее говорится, что задача оценки каналов речевой связи и утечки речевой информации сводится именно к измерению или вычислению разборчивости речи и сравнению полученного значения с предельно возможным. Поэтому было введено понятие - прогнозируемая расчетная разборчивость. В настоящее время считается, что если для минимальных помех уровень расчетной разборчивости близок к 25% слоговой разборчивости, то данный канал не требует проведения защитных мероприятий.
Подчеркивается, что предельное значение разборчивости формант, при которой возможно понимание смысла речевого сообщения, равно 15 %, что соответствует 25 %-ой разборчивости слогов. При таком уровне разборчивости, а вернее неразборчивости, достигнутом посредством использования методов и алгоритмов технического и криптографического закрытия речи в канале связи, его можно считать защищенным (конечно с учетом уровня стойкости примененного алгоритма закрытия). А в других приложениях, после введения шумов и помех, такой уровень разборчивости можно считать достаточным для блокировки работы речевого канала связи.
Отмечается, что методов оценки прогнозируемой разборчивости, а вернее неразборчивости технических систем защиты речевой информации сегодня существует большое количество. К сожалению, большинство из них, не учитывают малоизученных особенностей слухового восприятия человека. В результате, чего многие якобы сильно защищенные по показателю разборчивости (неразборчивости) системы защиты речевой информации, после некоторой обработки защищенного сигнала, могут быть легко "взломаны". Поэтому для создания действительно защищенных речевых систем и проверки эффективности уже работающих в правоохранительных органах надо более внимательно подойти к понятию разборчивость и ввести некоторый новый показатель качества звучания РС, приспособленный именно для технических средств защиты речевой информации и отражающий влияние свойств человеческого слуха.
Подчеркивается, что особое внимание при анализе особенностей слухового восприятия следует уделить изучению роли фазовых отношений несущих частот преобразования. Исходя из современных воззрений фазовые характеристики речевого сигнала слабо влияют на его слуховое восприятие. В настоящее время известен целый ряд психологических исследований , показавших, что слух не воспринимает фазовые отношения спектральных компонент сигнала. Однако эти данные получены для простых стимулов, состоящих из одной-двух тональных посылок или чистых тонов большой длительности с различными фазами и мало похожих на изучаемые сигналы.
Сделан вывод, что для разработки эффективных технологий обеспечения безопасности оперативных аудиоданных необходимо опираться на особенности механизмов человеческого речеобразования и слухового восприятия. При решении многих задач ОБРС становится крайне необходимым извлекать и применять фазовую информацию из спектральных описаний РС, ранее практически не используемую. Для этого необходимо использовать новые модели восприятия и образования речевых сигналов
Для эффективной обработки сложных и слабой изученных объектов в процессе исследования которых приходиться регистрировать заведомо многократно избыточное количество данных, так как заранее неизвестно, что в них информативно, предложено использовать образный анализ - новый, еще мало распространенный научный подход к решению задач поиска информативных признаков и построения описаний сложных высокоразмерных структур экспериментальных данных, представляемых в виде изображений. В его основе - нетрадиционное разделение функций между человеком и ЭВМ, при котором ма-
шина используется в основном для формирования различных звуковых, контурных и цветояркостных полутоновых представлений исходных, анализируемых данных, а человек визуально или на слух выявляет и описывает информативные признаки и целостные образы классов, подбирая в диалоге с ЭВМ представление, обеспечивающее решение задачи. Принципиальное отличие такого подхода от более распространенных автоматических методов - в применении ЭВМ не для замены человека, а для эффективного использования его уникальных возможностей распознавания и описания образов. Таким образом, образный анализ это обучение человека и использование его возможностей по распознаванию и описанию структур данных по их образным представлениям с помощью ЭВМ.
Как было показано в ряде источников, исходя из практики проведения экспериментальных и теоретических исследований, образные методы существенно расширяют круг реально разрешимых задач анализа экспериментальных данных и заметно снижают стоимость их решения. Сделан вывод, что такой подход может быть применим и для работы с оперативными аудиоданными переведенными в матрицы изображений их графических образов.
Были исследованы общие правила организации образного анализа применительно к оперативным аудиоданным. Сделан вывод о том, что при создании компьютерных технологий БОА наибольший интерес представляет сравнительное изучение звукового, визуального и звуко-визуального представления акустических сигналов оператору, при котором он одновременно слушает сигнал и смотрит его спектральный рельеф с помощью программно реализованного цифрового динамического спектрального анализатора. Несмотря на то, что при этом звуковая и визуальная компоненты сигнала несут одну и ту же информацию, тем не менее, из результатов применения образного анализа, приведенных в разных источниках, можно ожидать увеличения скорости опознания мономодальных стимулов оператором с увеличением числа их переменных параметров, и следовательно ожидать улучшения распознавания в нашем случае при работе с оперативными аудиоданными.
Исходя из этого, выбор был остановлен на следующей схематической модели слухового анализатора, относящейся не столько к структуре, сколько к алгоритмам работы слуха. Аппарат, состоящий из мембранной системы М, во-лосковых клеток Р (рецепторов) и периферических нейронных систем Н, осуществляет частотный анализ раздражителя (см рис. 1).
Рис. 1. Схематическая модель анализа звуков
Каждый из каналов можно эквивалентно представить в виде резонансного контура с собственной частотой сор и добротностью <3Р и следующего за ним «линейного» детектора и интегратора с временем интегрирования Др. Все эти параметры меняются в зависимости от решаемой системой задачи. В результате нервная активность на выходе р-го канала пропорциональна средней интенсивности спектра в полосе частот от (сор - (а>/Ор)до(а)р + сор/Ор) за время йр.
Поступающие с выходов всех каналов сигналы развертываются на плоскости нейронного слоя, давая таким образом рельеф нервной активности, близкий к рельефу изменения амплитудного текущего спектра раздражителя за время Т:
где f(т) - анализируемая функция звука; t - время; еыи> - весовая функция, отражающая влияние затухания в контурах. Исходя из представления об универсальности алгоритмов работы человеческих слуховых и зрительных анализаторов, вносится предположение о том, что слуховое распознавание полученных таким образом динамических спектрограмм осуществляется, по-видимому, так же, как и двумерных картин нервной активности, поступающих с сетчатки через зрительный нерв.
Согласно теории образного анализа, предлагаемая модель устанавливает прямую зависимость между различимостью звуков на слух и визуальной различимостью их динамических спектрограмм. Несмотря на то, что в настоящее время неясны многие нейрофизиологические механизмы слухового восприятия, и это не позволяет конкретизировать предлагаемую модель, особенно в части механизмов периферического и центрального регулирования системы частотного (спектрального) анализа в человеческом ухе. Но даже на таком уровне понимания предлагаемая модель хорошо согласуется с известными экспериментальными данными и дает новый, весьма плодотворный подход к конструированию информационных систем обеспечения безопасности оперативных аудиоданных.
Из многочисленных психофизических экспериментальных данных по слуховому восприятию следует вывод, что в зависимости от решаемой задачи и от собственной частоты канала параметры Г; Q и А таких систем должны меняться в пределах:
30-50 мс < Т < 300-500 мс,
2-4 мс < Q < 50-100 мс, (2)
3-10 мс < Д < 50-150 мс.
Именно исходя из этих соображений была выбрана впоследствии, технически подтверждена и программно реализована длительность главного окна анализа, длительность единичной выборки отсчетов PC, оптимальный шаг анализа и добротность канальных фильтров гребенки при построении динамических спектрограмм (сонограмм), используемых для решения задач ОБРС.
Описанная алгоритмическая, модель слухового восприятия была принята за основу при выборе способов взаимного преобразования визуальной и звуковой информации. В соответствии с ней из любого звука или PC f(t), заданного на некотором временном интервале, выбирается несколько отдельных элементарных звуков (участков речи) длительностью 50-200 мс, каждый из которых опознается симультанно. Сам процесс одномоментного опознания отрезка звука заключается в построении его |S(«, t)| - рельефа амплитудного кратковременного спектра и последующем опознании этой картины по алгоритмам визуального восприятия. Как длительность, так и расположение этих участков изменяются в широких пределах в зависимости от задачи, решаемой слухом и характером самого звука.
Так в соответствии с образным анализом, если стоит задача преобразования некоторого набора изображений {В,(х,у)} в набор звуковых образов фонемной длительности, которые затем должен одномоментно опознавать оператор, и если в результате нужно получить хотя бы то же качество распознавания, какое возможно при прямом визуальном одномоментном опознании исходных
(1)
картин, то выбранное преобразование должно каждому визуальному образу в,fx, у) ставить в соответствие звук f(t) с амплитудным рельефом мгновенного спектра |S(ty, t)|, близким к В,(х, у).
Как показано в некоторых публикациях простейшим техническим способом реализации этого требования является, по-видимому, сканирование изображения столбцом из п - фотоэлементов с последующей модуляцией напряжениями <pi,(at) с их выходов соответствующих несущих частот. В результате суммирования всех этих модулированных сигналов будем иметь
п
/(*) = 2 ф*<в*) sin к ffioi.
ь=1 (3)
где а = (l/T)t; I - размеры изображения по горизонтали; Т - длительность формируемого сигнала, а расстояние между гармониками а>0 должно выбираться исходя из заданных погрешностей анализа.
Далее отмечается, что учет свойств речеобразования и слухового восприятия и их особенностей, и, прежде всего, фазовых характеристик речи, делают необходимым создание и спользование новой модели акустического (речевого) сигнала, представляемого суммой узкополосных по Гильберту сигналов. В общем виде представление узкополосного сигнала по Гильберту выглядит как:
s(r)=G(i) cosyKO, (4)
где и соответственно, мгновенная амплитуда и мгновенная полная
фаза сигнала - которые описывают этот аудио сигнал или речь в виде некоего узкополосного процесса в ограниченной полосе частот и связаны между собой посредством преобразований Гильберта.
М СО
л(0 = -1/яг \ sc(x)/(t-x)dx, sc(t) = -l/n: J s(x)/(t-x)dx, (5)
где G(t) = Js2(t) + s2G(t), a V(t) =arctg(s{t)ls0(t)). (6)
В тоже время полную фазу можно представить в виде:
^(0=(y„r + (9(i) + i»oi (7)
где <уа; в(1); <р0- соответственно центральная частота, нелинейная составляющая полной фазы и начальная фаза звукового сигнала, значения которых определяются через мгновенную частоту: co(t) = d\fr(t)ldt.
Исходя из свойств преобразования Гильберта, аудио сигнал, сопряженный по Гильберту по отношению к исходному можно представить как:
■sG.(/) = G(i)siny40. (8)
Вместе обе, косинусная s(t) и синусная sa(l), составляющие аудио сигнала представляют собой так называемый аналитический сигнал.. Подобным образом, в виде простого фонообъекта, в ряде приложений можно рассматривать и сам речевой сигнал в полосе частот телефонного канала связи 0,3+3,4 КГц.
Так на рис. 2., в верхней и нижней панелях, представлены волновые формы вокализованного фрагмента исходного звукового сигнала и сопряженного ему по Гильберту, а на рис. 3. показаны значения Гильбертовских огибающей и косинуса фазы того же участка речи.
•I
ТЯГ.
Рис. 2. Квадратурные, косинусная (вверху) и синусная (внизу), составляющие фрагмента речевого сигнала.
Рис. 3 Функции огибающей (вверху) и косинуса фазы (внизу) по Гильберту исследуемого фрагмента речи
Отметим, что на обеих, косинусной и синусной, составляющих аналитического сигнала (рис. 2.) в полной мере нашло отражение то свойство, что когда значение одной из составляющих обращается в ноль, значение сопряженной составляющей достигает своего экстремума. Кроме того, в результате перемножения значений Гильбертовской огибающей и косинуса фазы (рис. 3), с точностью до постоянного множителя всегда можно получить исходный фрагмент речевого сигнала, волновая форма которого будет практически полностью повторять форму волны, представленную в верхней панели рис. 2. Нормализованный коэффициент взаимной корреляции (НКВК) временной реализации РС, восстановленного после перемножения, и исходной волновой формы аудиосигнала при правильно выбранных параметрах системы обработки (см след. раздел) может достигать абсолютных значений не менее 95%, что можно считать достаточно высоким показателем, относя оставшиеся 5% к ошибкам округления в процедурах анализа синтеза.
Отмечено, что, несмотря на абсолютно разные волновые формы исходного и сопряженного по Гильберту аудиосигналов звучать они будут абсолютно идентично, поскольку спектральные характеристики их полностью совпадают. Это подтверждает основное положение диссертационной работы о том, что звуковые сигналы, имеющие идентичные изображения корректно рассчитанных динамических спектрограмм, будут восприниматься на слух (звучать) одинаковым образом.
Для описания сложного фонообъекта суперпозицию элементарных, в дискретном, использовать следующее выражение.
ЦпТ) = (?ГЛ ■
п редста вл я ю ще го цифровом виде
собой можно
(д)
фазы к-го
где «,(0 и </;") значения Гильбертовской огибающей и фонообъекта входящего в состав исследуемого звукового сигнала.
В случае представления огибающей и фазы в формуле (9) через коэффициенты разложения рядом Фурье с базой N. при вычислении кратко-
временного спектра взвешенной в окне выборки, это выражение будет описывать исходный акустический сигнал весьма точно. Тогда число узкополосных составляющих - К .принимается равным половине базы дискретного преобразования Фурье (ДПФ) - N.
В приложениях ОБРС часто бывает весьма удобным использовать следующие, являющиеся частным случаем (9), дискретные представления аудио сигнала на коротких временных интервалах его анализа-синтеза:
А'
л (п Т) ■= £ 4 со&(ео01п Т+ <р0к ) + ¿я (л 7), (10)
к=]
¡■(пТ)-^ Аке-°'"тсоТ + 6к ■ (иТ)~ 12 + <рм) + (лГ), (11)
$(пТ) = X со%(о>№пТ+<р№) + л„(пТ) (12)
к=\
к 3
ф 7) = ]Г сои(со0,пТ+ ёк-(пТ)212 + <рвк) + ¿„(пТ), (13)
где А'Юк'Фък - амплитуда, частота и начальная фаза узкополосных сигналов, сумма которых и представляет собой речевой сигнал в окне динамического анализа лЯ независимо от характера наблюдаемого участка речи (вокализованный, шумовой, пауза и др.), а ■'¡„(пТ) - функция, характеризующая шум или ошибку представления.
Отмечается, что число элементарных фонообъектов - Кп? в (9)^(13) при движении окна наблюдения по временной оси может сильно отличаться даже на соседних интервалах анализа, т.е. К,Я*К(11.1)Я, где Я - шаг наблюдения. Заметим также, что конкретное значение числа значимых опорных узкополосных составляющих (К в (10)+(13)) исходного фонообъекта как на каждом сегменте обработки, так и для всего аудио сигнала выбирается в зависимости от условий каждой конкретной решаемой задачи ОБРС и заданной точности вычислений.
В частности, в тех приложениях, когда сразу бывает необходимым даже сложный фонообъект изначально представлять как узкополосный процесс, можно принимать К=1, и тогда его представление по формулам (9)^(13) существенно упрощает решение и вычисления. На вокализованных участках речи в полосе телефонного канала, как правило, можно задавать К в диапазоне (8*64). Кроме того, показано, что большинство других распространенных видов описаний речевых сигналов можно привести к предложенному параметрическому описанию по формуле (9) и ее частным случаям (10)Ц13), поскольку большинство из них первоначально можно отобразить через преобразование Фурье.
Подчеркивается, что в решении некоторых задач речепреобразования, возможно применение и других вытекающих из (9) самостоятельных описаний. В частности, возможно использование произвольных комбинаций уже известных по (10)^(13) представлений, а также других их подвидов. Возможны и другие частные модели, главное чтобы они удовлетворяли свойствам узкополосных по Гильберту сигналов. То есть их спектр частот должен быть сосредоточен вокруг одной центральной, относительно медленно меняющейся со временем частоты. Тогда во временной области они могут быть представлены в виде произведения неотрицательной медленно меняющейся со временем амплитудной огибающей на косинус зависящей от времени фазы.
Из выражений (10)Ц13) следует, что произведение положительной, в ряде случаев промодулированной взвешивающей функцией, амплитуды на гармоническую косинусную функцию в самом общем случае будет приводить к сдвигу Фурье образа взвешивающей функции в области отрицательных и положительных частот на величину частоты помноженной гармоники. И если взвешивающая функция изначально была симметрична и имела сосредоточенный (узкий) спектр, то после перемножения ее временной реализации на косинус гармоники этот спектр сосредоточится уже вокруг частоты модулирующей гармоники. То есть свойства узкополостности будут в целом выполняться.
Далее отмечается, что в приведенных в формуле (9), и ее частных случаях (10)-^13), описаниях сложного звукового сигнала (фонообъекта) именно значения параметров Гильбертовских огибающих и фаз его узкополосных составляющих, как раз и являются теми следами фонообъектов, с которыми в дальнейшем придется иметь дело при решении различных задач БОА.
Формулы (10)Ц13) наиболее хорошо подходят для описания сложного фонообъекта в различных задачах цифровой обработки звука, когда слагаемыми его звучания могут выступать одновременно и узкополосные сигналы относящиеся к речи, например гармоники вокализованных участков, и узкополосные сигналы, относящиеся к помехам и/или шумам.
Делается вывод о том, что методической основой решения проблемы безопасности оперативных аудиоданных правоохранительных органов в процессе информационно-технического противодействия будут являться методы выявления, восстановления, расслоения, изменения и реконструкция следов фонообъектов - параметрических описаний узкополосных сигналов в координатах амплитуда, частота, фаза и время, составляющих исходный аудио сигнал.
Отмечается, что решение ряда задач обеспечения безопасности оперативных аудиоданных связано с синтезом сигналов с заданными частотно-временными свойствами, не вызывающих интерференций и помех в каналах связи и на выходе линейных систем обработки. Показано, что этим свойствам полностью удовлетворяют узкополосные сигналы, и, прежде всего, определенные на базе Вейвлет функций, которые могут использоваться во многих задачах ОБРС для синтеза или восстановления акустических сигналов по следам фонообъектов их составляющих
Далее отмечается, что множество акустических параметров открытого, закрытого и восстановленного речевого сигнала, в том числе и следы фонообъектов, по которым можно судить об особенностях и принципах работы РПУ специальных систем аудиообработки, предпочтительнее выявлять и измерять с помощью узкополосных спектров (сонограмм), в которых отражается фор-мантная и гармоническая структура спектров гласных и звонких согласных звуков в границах частотно-временного (ЧВ) анализа. Отмечено, что требования к построению таких спектрограмм пока не определены
Показано, что алгоритмы дискретного ("скачущего") динамического спектрального анализа (ДСА) могут быть использованы в качестве основы построения систем анализа-синтеза для моделирования и анализа работы РПУ систем закрытой телефонии, при условии использования в них предложенных моделей аналитического описания речевого сигнала.
Отмечается, что создание реально защищенных речевых систем и проверка эффективности уже работающих в правоохранительных органах должны быть связаны с учетом параметров разборчивости речи и введением новых показателей качества её звучания, приспособленных именно для технических средств защиты речевой информации и отражающих влияние свойств слухово-
го аппарата человека, рассматриваемого в виде сложного спектранализатора, параметры которого динамически изменяются во времени.
Сделан вывод о том, что в качестве алгоритмической основы построения специализированных речепреобразующих систем при условии использования в них предложенных моделей аналитического описания речевого сигнала должны быть использованы процедуры дискретного динамического спектрального анализа, и, прежде всего, Фурье преобразования.
В заключении раздела отмечается, что при решении широкого круга прикладных задач обеспечения безопасности речевой связи (моделирование и создание процессов речевого скремблирования и алгоритмов сжатия в воко-дерных устройствах, цифровая фильтрация и модуляция спектра речи и аудио сигналов, синтез акустических сигналов по их амплитудному спектру, выявление признаков монтажа и др.) следует применять общие принципы образного анализа экспериментальных данных и современные технические средства мультимедиа совместно с выбранным представлением речевого сигнала в виде суперпозиции узкополосных процессов.
В третьем разделе - "Базовые элементы специализированных компьютерных систем образного анализа оперативных аудиоданных" - разрабатываются быстрые методы речепреобразования и аудиообработки, основанные на усовершенствовании известного прототипа системы цифровой обработки речи на базе кратковременного полноразмерного Фурье анализа (КФА).
Кратковременное преобразование Фурье, выбранное за алгоритмическую основу построения специализированных компьютерных систем ОБРС, можно интерпретировать либо посредством линейной фильтрации - как выход полосового фильтра с близкой к нулю полосой пропускания либо как обычное преобразование Фурье от взвешенного в окне сегмента РС, со всеми вытекающими свойствами такого представления.
Определением зависящего от времени кратковременного преобразования Фурье принято считать:
^ - т)х(т)е""""
(14)
В (14) - ш(п-т) представляет собой действительную последовательность временного окна. Этой последовательностью выделяется и взвешивается часть входного сигнала х(т) в момент времени п. При этом кратковременный спектр Фурье рассматривается и как преобразование сигнала в гребенке фильтров и как спектр выборки, взвешенной в окне, в соответствии с частотно-временным описанием сигналов и линейных систем. Такой подход позволяет эффективно использовать как теоретические, так и практические (вычислительные) аспекты кратковременного анализа-синтеза и его реализаций для получения параметрического представления речевого сигнала в виде суперпозиции узкополосных составляющих,
Отмечается, что процедуры синтеза аудиосигнала по следам фонообъ-ектов должны опираться на две интерпретации кратковременного анализа. Первый метод связан с суммированием выходов гребенки фильтров (СГФ), выходной сигнал с которой, представляет собой сумму выходных сигналов канальных фильтров. В методе СГФ восстановленный сигнал формируется как
».О А-11 (15)
Второй метод, называемый методом суммирования с накоплением (СН), приводит к процедуре синтеза, в которой взвешенные окном звуковые сегменты, полученные в результате применения процедуры ОБПФ к очередному час-
тотно-временному срезу (ЧВС) МДСС и разнесения его результатов по времени на заданное число отсчетов (равное надлежащим образом выбранному интервалу анализа), суммируются, образуя восстановленный сигнал. Метод суммирования с наложением (СН) основан на соотношении:
.1 •'(")= £
] v-'
"fS Гг«-)*
'v к, о
(16)
Правило синтеза метода СН (16) приводит к точному восстановлению х(п) с точностью до множителя при суммировании перекрывающихся во времени сегментов сигнала.
Исследованы особенности применения каждого из двух методов синтеза. Сделан вывод о дуальности методов синтеза и отмечено, что применение каждого из обоих методов в синтезирующей части специализированных систем обеспечения БОА определяется конкретной задачей.
Поскольку в качестве эффективной основы построения систем анализа-синтеза для моделирования и анализа работы РПУ систем обработки оперативных аудиоданных, при условии использования в них предложенных моделей аналитического описания аудио сигнала, следует использовать алгоритмы дискретного динамического спектрального анализа, то наиболее предпочтительными для их практической реализации являются вычислительные методы кратковременного Фурье анализа (КФА), основанные на быстрых алгоритмах вычисления дискретного преобразования Фурье (алгоритмы БПФ) с базой преобразования - N. В качестве окон анализа рекомендуется использовать в первую очередь окно Гаусса (в специализированных компьютерных системах), во вторую окно Хемминга (в автономных устройствах), Фурье образы которых не имеют или почти не имеют артефактов в частотной области:
Приведены выражения для окна Хемминга и нормированного окна Гаусса длиной (вычислительной шириной) в В - отсчетов, как окон наиболее часто встречающегося в задачах цифровой обработки речи, в том числе и в ОБРС: Г0.54-0.46со5(2от/(В-1)), 0 < п < В-1;
О, в противном случае,
g(n);
при - В/2<П < BI2 pgj
■12л er,
О, в противном случае
Причем для окна Гаусса и его Фурье образа, справедливо: 2я er, er f =1.
Показано, что с технической точки зрения оптимальными параметрами КФА с такими окнами при Fs-8Krц будут: размер ячейки на частотно-временной сетке (ЧВС) А, < 8 Гц и Д,< 8 мс; ширина образа окна Гаусса -а, =30^20 (25); размер анализируемой выборки PC и ширина окна Хемминга во временной области -В=128+256 (192). Отмечается, что эти значения совпадают с психофизическими оценками, данными в предыдущем разделе.
Разработан комплекс элементов специализированных компьютерных систем образного анализа, защиты и обработки оперативных аудиоданных. Рассмотрены следующие речепреобразующие (РП) системы, организованные на принципах кратковременного анализа-синтеза и входящие в состав данного комплекса: с низким или высоким разрешением по частоте в частотной области; с синхронизацией процедур обработки или без нее; с симметрией или асимметрией вычислительных процедур анализа-синтеза; с процедурами анализа на основе БПФ или гребенки КИХ (БИХ) фильтров; с процедурами синтеза на основе СГФ или СН; с полным учетом всех значений МДСС или с учетом
значений только узкополосных составляющих АС (РС); с возможностью смены ортогональных базисов основного ядра обработки или без нее (вместо КФА -Хартли, Вейвлет или др. преобразования); с организацией ДСАС в "скользящем" или "скачущем" режимах; с учетом или без него значений фазы узкополосных составляющих АС (РС) и т.п.
Отмечено, что наибольший практический интерес представляют входящие в этот комплекс речепреобразующие (РП) системы, работающие без синхронизации процессов обработки, с симметрией процедур анализа-синтеза, реализованных на основе БПФ. Симметричность подобных РП систем позволяет организовать параллельное выполнение процедур анализа и синтеза, что ускоряет процесс обработки сигналов, приводит к экономии вычислительных ресурсов, даёт возможность выполнять разрабатываемые алгоритмы речепре-образования на стандартных технических средствах компьютерной телефонии в масштабе времени, близком к реальному, упрощает программно-аппаратную реализацию устройств цифровой обработки РС на ее основе.
Рассмотрены и исследованы следующие базовые РП системы: симметричная с высоким разрешением по частоте (В<Ы) с синхронизацией процедур анализа-синтеза акустического сигнала и симметричная с низким разрешением по частоте (В>Ы) не требующая синхронизации процедур обработки. Взвешивание исходного РС в процессе дискретного динамического спектрального анализа (ДСА) в таких РП системах показано на рис. 4.
Рис. 4. Взвешивание отсчетов речевого сигнала s(m) в окне w(n) в процессе дискретного ДСА
Компоненты вектора - srR , {srR(k), к = 0, 1, ... , N-1} представляют собой значения речевого сигнала, взвешенные в окне w(r> - т), вычисленные в момент времени n=rR с шагом наблюдения 1<R<N, при т - rR - NI+1, rR-NI+2, ..., rR .
В первую очередь исследовалась традиционная симметричная РП система анализа-синтеза речи с высоким разрешением по частоте (при N=1024) при наличии полных спектральных описаний МДСС. Система работала в режиме сквозного прохода речевого сигнала через два звена анализа-синтеза. Два звена необходимы для полной имитации канала связи, где процедуры обработки (анализа-синтеза) происходят дважды, сначала в передающей а затем в приемной частях Синтез осуществлялся на основе метода СН со взвешивающим нормализованным окном Гаусса.
В результате вычислительных экспериментов при оптимальном выборе размера ячейки ЧВС было получено, что форма и звучание восстановленного аудио сигнала после прохождения двух звеньев анализа-синтеза, практически не отличались от исходного. Абсолютное значение НКВК исходного и восстановленного сигналов не опускалось ниже 99,5 % на вокализованных участках
s(rfi.R-N.i)
sirn!
голосов различных дикторов. То есть, критерий информационной полноты здесь соблюдается в полной мере.
Отмечено, что анализирующую часть подобной системы можно использовать для получения точных параметрических описаний узкополосных звуков (следов фонообъектов), составляющих звучание исследуемого исходного АС (РС), а также что необходимость в синхронизации процессов обработки в подобной РП системе отпадет, если использовать в МДСС только те значения, которые относятся к узкополосным составляющим исходного сигнала (фоно-объекта) без учета их фазы.
Далее предложена и исследована усовершенствованная симметричная система анализа-синтеза речи с низким разрешением по частоте (длина окна анализа значительно превышает базу БПФ), работающая без синхронизации на основе гребенки квазиидеальных фильтров и дискретного ДСА. Она предназначена для использования в компьютерных системах БОА для получения интегральных оценок акустического (речевого) сигнала.
В качестве описания речевого сигнала, проходящего цифровую обработку в данной системе анализа - синтеза, принята формула (9). Процесс обработки РС в предложенной симметричной системе в блоках О и Р, представленных на рис. 5 приводится соответственно в формулах (19) и (20).
= = [/Цс!))^Ф(о)]1/1 ?;„(Л = ('¡'(Псози/'а)
НМ1Н
Л и а н а з
0
1
С и н т с з
Г
Рис. 5. Симметричная система речепреобразования на основе гребенки квазиидеальных фильтров
Ы^икЪ^Л+М+чМ-М-фЫд) = ?гЯ((.У-1~с1))„\ (19)
/=-1
БгК(к) = йРТ{1гМ)\Л. ; 9 = 0^4 к - О^Т 1 < Я< Л'; (20)
где А (л) - окно Гаусса или Хемминга, умноженное на зю(п)/п, 1 - число баз БПФ N, укладывающихся в интервале окна наблюдения (В=1Ы), а 5^(0), Згя(1),...,5,н(Ы/2-1) являются значениями Л/- точечного дискретного преобразования Фурье (оператор Р на рис. 5.) от /V- мерного вектора ?,я, в случае ведения обработки речи в частотной области, [1]кв- модулирующая по заданному алгоритму обработки (например скремблирование) спектр РС матрица.
В случаях обработки РС во временной области вводится оператор Г, посредством которого принятая модель РС (9) подвергается необходимой трансформации с целью получения новых видов скремблирования, сдвигу спектра РС по частоте и др.
Алгоритм обработки РС, на примере его скремблирования в симметричной системе анализа - синтеза, показан соотношением (21).
Анализ О Р
¿,„(0 = <3(г)со5((/(г) ->■ = (Т(г)созр(О -> 5у,„ = Д«э)с<кФ(й)) Обработка во временной I или частотной 4 (21)
области <5(/)соз^(0 = /'{с(г) ссв^"(/)} [5]а./. = [А/].ур*[5]л, Синтез О X РI
$;л(г) = (?(0сс8|/'(0 <- ^я(') = <5(/)созу/(0 ^ = СОЭФ(СУ) Показано, что данная симметричная система анализа-синтеза речи с низким разрешением по частоте на основе гребенки квазиидеальных фильтров может быть использована для моделирования алгоритмов цифровой обработки при решении широкого круга прикладных задач обеспечения безопасности речевой связи в системах компьютерной телефонии, таких, как: моделирование процессов речевого скремблирования, алгоритмов сжатия в вокодерных устройствах, цифровая фильтрация и модуляция спектра речи и сигналов и др.
Отмечено, что возможная рассинхронизация в процессах анализа и синтеза приводит к возникновению линейного фазового сдвига в восстановленных (синтезированных) речевых сигналах, что не влияет на процесс слухового восприятия обработанной речи и согласуется с особенностями процессов слухового восприятия.
Для решения задач цифровой обработки речи на основе исследованной системы анализа-синтеза РС с низким разрешением по частоте в целях получения максимального качества звучания восстановленной речи предложено исходить из следующих соотношений между шириной окна - В, базой БПФ - Л/, количеством повторений базы в пределах окна наблюдения - 2/., шагом окна наблюдения на временной оси в отчетах - Я, при частоте дискретизации оцифрованной речи fд = 8 КГц;
1024 >В-21Ы >128; 4<Ы<123; 21->4\ \<R<N.
Необходимое условие кодирования амплитуд выходов гребенки фильтров для качественного звучания синтезированной речи - > 4 бит/канал.
Показано, что НКВК временной реализации РС, восстановленного после прохождения двух звеньев анализа-синтеза подобной системы в режиме сквозного прохода, и исходной волновой формы аудиосигнала при таких параметрах данной системы обработки может достигать абсолютных значений превышающих 95% на вокализованных участках речи.
Показано, что если значения предложенного коэффициента изменения качества звучания сигнала (КИЗ), обработанного в симметричной системе анализа - синтеза речи при 1.=4, Ы=Я=64, не превышают 5 Дб, то звучание восстановленного после скремблирования или иного вида обработки РС остается в том же классе качества по ГОСТ "Р" 50840/97 , что и исходного РС.
Максимальная задержка обработанного речевого сигнала по отношению к исходному в симметричной системе речепреобразования составляет (21Ы-И) -отчетов, что при указанных оптимальных параметрах работы системы составляет временной диапазон 16 + 128 мс.
Степень стойкости систем аналогово-цифрового скремблирования, создаваемых на базе разработанной системы анализа-синтеза, может приближаться к стратегическому уровню и будет составлять не менее Ю30 разрешенных ключевых комбинаций.
В заключении раздела приведены ожидаемые результаты исследований предложенных симметричных РП систем низкого и высокого разрешения по частоте исходя из аналогии их работы с известными системами в случаях ис-
пользования либо только амплитудных, либо только фазовых значений рассчитываемых МДСС.
Еще раз подчеркивается, что наиболее подходящими для приложений БОА являются симметричные системы, работающие без синхронизации процедур анализа-синтеза. С учетом полных описаний МДСС такой режим работы можно организовать в симметричных РП системах с низким разрешением по частоте. В РП системах с высоким разрешением такой режим возможен только при представлении исходного сигнала суммой узкополосных сигналов его составляющих без учета их исходных фазовых параметров.
Четвертый раздел - "Цифровая обработка изображений динамических сонограмм "- посвящен разработке технологии преобразования АС (РС) в новую форму представления - изображений узкополосных сонограмм, их последующей модификации с обратным синтезом по ним нового АС (РС)
На основе общего решения фазовой задачи в одномерном случае показана возможность восстановления (синтеза) речевого сигнала по модулям его спектра (узкополосным сонограммам), вычисляемым в процессе дискретного динамического спектрального анализа, как показано на рис.4, с точностью до линейной начальной фазы в формулах (9+13). Однако в таких приложениях база БПФ - N будет больше или равна размеру - В окна наблюдения \м(п), в качестве которого опять выбирается окна Гаусса или Хемминга.
В качестве примера, исследована обобщенная модель (22) участков РС в окнах динамического анализа, на её пригодность для описания процессов обработки речи в частотной области в асимметричной системе анализа-синтеза речи на коротких интервалах анализа:
^(0 = X 4С)СО5(С0,,1 + в,(!) + ср01)
(22)
где Лд(0;й)Л. <9(0 - амплитуда, частота, начальная фаза и нелинейная функция фазы - Кгя узкополосных сигналов, сумма которых представляет собой акустический (речевой) сигнал в окне динамического анализа независимо от характера наблюдаемого участка речи (вокализованный, шумовой, пауза и др.). Еще раз подчеркнуто, что число элементарных фонообъектов - Сможет сильно отличаться даже на соседних окнах, т.е. КгЯ * где Я - шаг наблюдения. В
более общем виде величины Лк\а>к\ в (22) можно рассматривать как функции времениАк(г);®к(г);. Тем не менее, судя по результатам исследований, на коротких интервалах времени до 40 мс в ряде приложений их можно считать постоянными величинами, а нелинейную функцию фазы приравненной к нулю.
При таких ограничениях после проведения программного моделирования с реальными речевыми образцами исследуемая модель РС (22), представленного в виде суммы конечного числа узкополосных сигналов на коротких интервалах временного анализа, подтвердила свое право на существование. Далее были исследованы различные модели синтеза согласно (9-13) РС по следам фонообъектов, определяемых по изображениям узкополосных сонограмм
На основе предложенной системы моделей РС (9,10+13, 22) и процедур дискретного ДСАС в симметричной РП системе с синхронизацией процессов обработки и высоким разрешением по частоте была разработана асимметричная система анализа-синтеза речи, показанная на рис. 6. Алгоритм обработки РС на примере его скремблирования в асимметричной системе анализа - синтеза речи представлен в (23).
Показано, что положения и амплитуды локальных максимумов (ЛМ) на частотно-временных срезах (модулей кратковременных спектров выборки, взвешенной в окне анализ) и глобальных экстремумов на изображениях амплитудных спектров речи (узкополосных сонограммах) полностью описывают исходный речевой сигнал и могут служить универсальными описаниями речевого сигнала с точностью до его начальной фазы, пригодными для решения задач БОА.
,(0
I
И ии ь
М о д с л ь синтеза 1,2.3 или 4
А н а л и з С и и т ез
1
Рис. 6. Асимметричная РП система на основе кратковременного анализа Фурье РС с возможностью синтеза по сонограммам
Анализ (блоки V/ и |Р|, рис.6)
4/Д') =
«/2-1 . 2*
, где 0<к< N12-1 Обработка (закрытие) (центральный блок, рис.6)
Д-л,
АгК(к), приАгК(к)>АгК(к-1)иАгК(к)>АгЯ(к+\)
О,
в другихслучаях
(23)
[ АШХ] КР = [ Щ да • [ АиА № ,
Синтез (блок моделей синтеза 1-8-4, рис.6) модель 1 модель 2
Кн
= £ сж(а}к1 + <ри)
А-1 ;
модель 3
Км
С) = 2 Дл,ш «°>Г-1 (^>'1' + Я)А )
модель 4
к,л
Ы /¡>1
Параметры амплитудных спектров, при которых может быть осуществлен качественный синтез речевого сигнала при сохранении динамического диапазона в частотной области, следующие: частота дискретизации - fд = 8000+12000 Гц; база БПФ - N>256', количество локальных максимумов на ЧВС -Кгк<64; временной интервал между соседними ЧВС - И< 40 мс; максимальная задержка, обработанного речевого сигнала по отношению к исходному, равная /?, составляет - 40 мс; кодирование амплитуд локальных максимумов для качественного звучания речи - > 4 бит/пиксель.
Отмечается, что протяжка фазы во всех выбранных моделях осуществлялась методами кусочно-линейной аппроксимации. Для синтеза аудиосигналов с заданными частотно-временными свойствами наиболее удобна модель 4, представляющая собой действительную часть вейвлета Морле.
По аналогии с задачами восстановления и реконструкции изображений была выведена формула (24) расчета обобщенного коэффициента изменения качества звучания речевого сигнала Ог для количественной оценки эффектив-
ности использования данной системы асимметричного речепреобразования и других систем обработки РС в задачах БОА, соответствующая мере расхождения локальных максимумов на частотно-временной сетке изображений амплитудных спектров исходной и обработанной речи. Значение йг получено для каскадного двухзвенного соединения асимметричных систем речепреобразования на рис 6., работающих в режимах скремблирования и дескрембпирования. В первом звене производится закрытие исходного РС по закону МХР*[1]м,, а во
втором - восстановление РС по обратному закону М 'КР^[1])Ч,Р. Таким образом
Д = 10
Р-1 V / 2 — I 2
/=0 к*0
(24)
где Ат(],к) -матрица значений локальных максимумов узкополосного спектра непаузных фрагментов исходной открытой речи в границах частотно-временной сетки А1-Р, полученная в первом звене; А'К1,^(у,к)- матрица значений локальных
максимумов спектра РС, восстановленного после скремблирования во втором звене; А'х,Р0(],к)- матрица значений локальных максимумов спектра РС, подвергшегося анализу и синтезу в асимметричной системе в режиме сквозного прохода (МК1,= М"'№= [1]^ в обоих звеньях.
Показано, что коэффициент изменения качества звучания (КИЗ), предложенный в разделе 3, является частным случаем формулы (24) и при значениях Ог <5 Дб используемая система обработки речи также не приводит к изменению класса качества обработанного РС относительно исходного по методу парных сравнений согласно ГОСТ "Р" 50840/95.
Показано, что на основе предложенной технологии перевода речевого сигнала в изображение динамического амплитудного спектра и обратно можно решать различные прикладные задачи БОА, в том числе имитировать работу большинства известных систем аналогового и цифрового закрытия речи, создавать нетрадиционные системы аналогового речевого скремблирования высокой степени стойкости, а также, совместно с РП системами низкого разрешения по частоте реализовывать, системы цифрового закрытия речи, основанные на новых принципах выделения и кодирования её параметров. Перестраиваемое низкоскоростное кодирование речи можно осуществлять в пределах 1200*9600 бод.
Показано, что исходное звучание РС, восстановленного после процедур обработки, можно воссоздать по положениям и амплитудам локальных максимумов на оптимально рассчитанных частотно-временных срезах (ЧВС) и по значениям глобальных экстремумов на изображениях динамических амплитудных кратковременных спектров речи (группе ЧВС). При этом при синтезе без учета фазовых параметров следов фонообъектов критерий полноты звучания соблюдается при условии, что Ог <5 Дб, т.е. исходная и восстановленная по следам фонообъектов речь будут оставаться в пределах одного и того же класса качества согласно ГОСТ 50840/95. Также показано, что для успешного решения большинства задач ОБРС необходимо, чтобы абсолютное значение НКВК исходных аудиосигналов и восстановленных по следам фонообъектов с учетом их фазы было не менее 30% на вокализованных участках, в этом случае соблюдается критерий информационной полноты.
Таким образом, показано, что система моделей акустического (речевого) сигнала, представленного в виде суммы узкополосных сигналов на коротких ин-
тервалах временного анализа, может быть эффективно использована при решении задач обеспечения безопасности речевой связи.
В заключении раздела подчеркивается, что на основе предложенной технологии перевода речевого сигнала в изображения динамического амплитудного спектра и обратно с использованием наработанного задела в области цифровой обработки изображений (прежде всего бинарных изображений) можно осуществить решение большого количества прикладных задач безопасности оперативных аудиоданных.
В пятом разделе - "Компьютерная реализация, экспериментальные исследования и оценка специальных методов аудиообработки" - описан программно-аппаратный комплекс на базе компьютера IBM PC, звуковой карты и стыка с ТЛФ линией для исследования разработанных методов речепреобра-зования на реальных линиях связи с полосой телефонного канала (СТК).
Произведен анализ погрешности дискретизации и ошибок, возникающих в процессе цифровой обработки аудиосигналов на общедоступных технических средствах (ОТС). На основе результатов анализа разработан макет системы программно - аппаратных технических средств для реализации известных и нетрадиционных методов специальной обработки речи, который позволяет сократить сроки разработки и внедрения современных цифровых методов обработки речевых сигналов в специальных компьютеризированных системах БОА.
Эксперименты по исследованию методов закрытия речи в ОКС (городская телефонная сеть и аудиокассеты) с использованием СТС и методов первичного анализа речевых сообщений исследуемых систем защиты речевых сигналов, а именно: скремблирование речевого сигнала, не требующее синхронизации, с высокой степенью стойкости на основе симметричных и асимметричных методов речепреобразования; сжатие речевого сигнала на основе алгоритмов низкоскоростного кодирования с перестраиваемой скоростью передачи в диапазоне 1200-9600 бод и разными методами синтеза восстановленной речи; первичный анализ "неизвестной" системы аналогового закрытия речи с целью определения размеров ЧВЭ, вырабатываемых РПУ системы закрытия; первичный анализ "известной" системы аналогового закрытия с целью обнаружения заложенных признаков аутентификации в передаваемом речевом сообщении, подтвердили теоретические возможности использования разработанных методов речепреобразования для использования в специальных компьютеризированных системах БОА.
Отмечено и экспериментально подтверждено, что при восстановлении искаженных PC предложенными методами достигается увеличение формант-ной разборчивости не менее чем на 5% (соответственно словесной на 15%).
Показано, что объем вычислительных затрат на реализацию предложенных методов речепреобразования не требует обязательного применения цифровых сигнальных процессоров. Оборудование, необходимое для реализации методов речепреобразования в масштабе времени, близком к реальному, должно основываться на компьютерах класса IBM - ¡PI и выше. Разработанное программное обеспечение может служить ядром для создания компьютерных систем ОБРС в ОКС (включая закрытую Internet телефонию), в том числе и в деятельности правоохранительных органов на оперативно-тактическом уровне, а также для создания систем первичного анализа и бесключевого восстановления закрытых речевых сообщений конкретных устройств засекреченной речевой связи, принадлежащих преступным группировкам и элементам.
Выработаны требования к составу комплексов ОТС, на которых возможна реализация предложенных методов речепреобразования при создании вышеназванных систем таковы:
- ПЭВМ класса IBM PC PI и выше, 03У>32Мб, жесткий диск>1,ЗГб;
- голосовой модем типа ZyXel 1496Е plus или ему подобный;
- звуковая карта типа Sound Blaster PRO с 16 разрядным АЦП/ЦАП, и частотой дискретизации 8 -И 6 КГц или ей подобная;
- плата стыка с телефонной линией, с возможностью обеспечения режима речевой почты типа MIRO DC1 или "Индекс", или им подобные.
В шестом разделе - "Технологии проектирования специализированных компьютерных систем обеспечения безопасности оперативных аудиоданных и перспективные направления их применения" предложена концептуальная модель создания и исследования РПУ специальных систем аудиообработки.
Концептуальная модель создания и исследования специальных РП систем (см. рис. 7) позволяет организовывать функционально-законченные компьютерные технологии обеспечения безопасности оперативных аудиозаписей, приемлемые для решения практических задач правоохранительных органов в сфере информационного противоборства с преступностью. При этом предусмотренное наращивание и использование готовых библиотечных модулей СПО конкретных приложений (сжатие речи, маскирование и скремблирование PC, темпокоррекция, шумоочистка, нелинейный аудиомонтаж и др.) позволяет существенно расширить диапазон практического применения. В качестве основных блоков предложенной модели используются разработанные безсинхро-низационные системы речепреобразования и аудиообработки.
Рис. 7. Концептуальная модель создания и исследования специализиро-
ванных систем безопасности аудиоданных
Согласно предложенной модели, любую новую задачу БОА необходимо начинать решать с получения точных описаний исследуемых оперативных аудиоданных в РП системах высокого разрешения по частоте. После проведения достаточного количества операций по анализу и обработке исследуемых оперативных аудиоданных начинает формироваться и накапливаться библиотека программных модулей для специальной обработки аудио сигналов для конкретного типа решаемой задачи БОА. После чего формируемая последова-
тельность процедур обработки и, соответственно, виды используемых для этих целей систем речепреобразования - после некоторого времени перейдут уже в разряд известных. Теперь уже, в случаях, когда необходимо произвести обработку оперативных аудиоданных, полученных из известного канала ИО, или подготовку оперативных аудиоданных для вброса в каналы информационного обмена, этап первичного анализа и получения первичных описаний можно начать с более быстрой обработки исходного речевого сообщения в симметричной системе речепреобразования с низким разрешением по частоте.
Далее отмечается, что в основу перспективных технологий проектирования специализированных компьютерных систем безопасности оперативных аудиоданных должен быть положен функционально-структурный подход. Технологии проектирования СПО специализированных компьютерных систем аудио-обработки должны включать как решение инженерно-технических, так и методических задач.
При построении изображений динамических сонограмм для решения большинства задач безопасности речевой связи посредством компьютерных технологий должны выполняться основные требования, в целом совпадающие с основными принципами образного анализа, рассмотренными нами в 3 разделе.
В соответствии с принципами образного анализа математический аппарат расчета каждого среза (вертикального столбца) матрицы динамических спектральных состояний (МДСС) в режиме установки «по умолчанию» основных параметров ее отображения должен быть реализован таким образом, чтобы в границах главного окна анализа: а) помещалось максимально большой фрагмент фильма - сонограммы, пригодный для решения данной конкретной задачи защиты речевых сообщений; б) имелась бы возможность настройки изображения сонограмм таким образом, чтобы по требованию исследователя-эксперта или автомата-компьютера отдельные следы фонообъектов отражались более контрастно, а другие или полностью или частично удалялись или соответствующим образом изменялись; в) отражение следов фонообъектов в окне анализа было бы предельно полным по критерию полноты отражения информации о следах фонообъектов и/или по критерию сохранения максимальной разборчивости восстановленной по сонограмме речи; г) должна быть предусмотрена возможность выбора частотно-временного разрешения сетки изображения сонограмм, в соответствии с заданным критерием; и т.д. Кроме того, должны быть предусмотрены возможности выбора способов отображения следов фонообъектов в различных ортогональных базисах и синтеза нового речевого сигнала по следам, сохраненным в сонограмме исходного (исследуемого) сигнала или по следам реконструированным на их основе с учетом или без учета значений динамических фазовых спектров исходного звукового сигнала.
На основе анализа и обработки именно таким образом представленных статических фильмов-сонограмм или динамических кадров-окон и осуществляется основной подход к анализу и обработке звуковых сигналов и речи, через анализ и обработку их графических образов - изображений, который применим к решению наиболее распространенных задач безопасности речевой связи.
Отмечается, что под обработкой же изображений в общем виде понимается выполнение различных операций над данными, которые носят принципиально двумерный характер и не всегда принимают неотрицательные значения.
Согласно данному подходу по построенным в соответствии с предложенными требованиями сонограммам осуществляется, в статическом или динамическом режимах, процесс выдачи целеуказаний оператора или компьютера по
выбору и запуску конкретного, оптимального для данной задачи безопасности речевой связи, вычислительного алгоритма цифровой обработки изображений рассчитанных сонограмм. После чего реализуется обратный переход от измененного графического представления речевого сигнала на частотно-временной плоскости к его волновому представлению во временной области. Т.е. осуществляется процесс синтеза речи по динамическим разверткам модифицированного амплитудного спектра с учетом или без учета значений спектральных фазовых компонент исходного речевого сигнала. На рис.8 показана схема предложенного подхода к анализу, обработке и синтезу речи и других звуковых сигналов, пригодная для реализации в компьютерных технологиях безопасности речевой связи.
Рис. 8. Основной подход к анализу и обработке речи, реализуемый в компьютерных технологиях безопасности речевой связи
Одним из главных преимуществ предложенного подхода к анализу и обработке речи и аудиосигналов по сравнению с другими является возможность организации многопроходной обработки, когда восстановленный звуковой сигнал вновь подается на вход системы анализа-синтеза и воспринимается ею как "новый" исходный. На рис. 8 возможность такой закольцованной обработки показана круговыми стрелками. Это позволяет организовать алгоритмы обработки аудиосигналов на основе обработки изображений их спектрограмм сколь угодно высокой сложности, разбив их на несколько промежуточных, простых с точки зрения программной реализации вычислений этапов.
Причем каждый новый аудиосигнал, получаемый в ходе очередного этапа такой обработки, может быть синтезирован по своим следам фонообъектов в графических образах, рассчитанных на предыдущем этапе, как с учетом, так и без учета значений фазовых спектров предыдущего исходного. Это открывает широкие перспективы по применению предложенного подхода к созданию новых компьютерных технологий безопасности речевой связи в сочетании с наработанными в вокодерной телефонии, компьютерной фоноскопии, прикладной лингвистике и других областях знаний научными заделами по обработке и идентификации звука и человеческой речи.
На основе предложенного подхода к анализу и обработке аудиосигналов было разработано специальное программное обеспечение, позволяющее если не решать, многие задачи БОА, то, по крайней мере апробировать пути решения многих из них, а также исследовать новые направления и пути решения как действующих, так и будущих задач. Разработанное СПО предназначено для:
• обработки результатов аудиоконтроля помещении и каналов связи с целью последующего документирования речевых сообщении в формате текстового редактора Microsoft Word;
• восстановления разборчивости речи, принятой в условиях шумов и помех;
• постановки стеганофонических маркеров в речевом сигнале;
• оценки эффективности средств противодействия утечке: аудиоинформации и средств ее добывания;
• катапогилизации часто встречаемых видов помех и искажении речевого сигнала и методик его обработки;
• реализации технологии речевой подписи для зашиты документов на бумажных носителях от подделок.
Несмотря на высокую математическую сложность реализованных в СПО алгоритмов цифровой обработки сигналов и изображении, данный программный продукт ориентирован прежде всего на пользователей, имеющих минимальные технические навыки по работе с компьютером и звукозаписывающей аппаратурой.
Это обусловлено тем, что в данном программном продукте, в отличие от других, имеющихся на отечественном и западном рынках речевых технологий, интерфейс задания пользователем необходимого алгоритма речевой обработки сводится к выдаче целеуказаний по обработке изображений динамических амплитудных спектров как искаженной, так и не искаженной помехами речи. В этом случае пользователь превращается в некоего «художника», который с помощью «электронного ластика и карандаша» (в виде компьютерной мыши), а также других, предоставленных в его распоряжение, программных средств выделяет из изображений сонограмм фонообьекта следы речевого сигнала и затирает следы шумов и помех, проставляет стеганографические маркеры, выполняет другие виды обработки речевого сигнала. Например, осуществляет изменение темпа речи в заданном частотном диапазоне для повышения ее разборчивости, изменяет функцию мелодии основного тона голоса говорящего с целью его неузнаваемости, выделяет и систематизирует признаки работы различных речепреобразуюших устройств, предназначенных как для предотвращения несанкционированного съема аудиоинформации, так и для ее негласного добывания, и т.д. На основании таких данных, полученных в процессе анализа и обработки речевых сигналов посредством разработанного СПО, можно сделать вывод о реальной эффективности работы этих средств и разработать методики по ее совершенствованию.
СПО работает под управлением операционной системы Microsoft Windows 98 СПО на стандартном персональном компьютере с процессором Pentium-230 и выше, не требуя применения дорогостоящих плат с процессорами цифровой обработки сигналов (DSP). Ввод/вывод аудиосигналов осуществляется через звуковые карты, совместимые с «Sound Blaster-16» фирмы «Creative Labs». Формат обрабатываемых сигналов - 16-разрядная ИКМ с частотой дискретизации в диапазоне 6-16 кГц. Время обработки выделенного участка аудиосигнала по любому заданному пользователем алгоритму практически не превышает длительности этого участка. В этом смысле вычислительный процесс осуществляется в масштабе времени, близком к реальному.
В СПО реализована возможность экспорта графических файлов bmp-формата из данного СПО в программные продукты цифровой обработки изображении типа Adobe Photoshop. После расслоения графических образов речевых сигналов в подобных редакторах на изображения собственно помех и речи, улучшенные и/или модифицированные изображения, относящиеся к речевой
информации, могут быть обратно импортированы в разработанное СПО для последующего синтеза и озвучивания таким образом восстановленного речевого сигнала.
В данном СПО в соответствии с принципами образного анализа, после преобразования введенного в компьютер звукового сигнала в цифровую последовательность, осуществляется пошаговое разложение аудиосигнала на отдельные частотные компоненты амплитудного и фазового спектров и его представление виде фильма - протяженной сонограммы. Каждый вертикальный срез (столбец матрицы неотрицательных чисел) изображения построенной спектрограммы фактически является кратковременным спектром взвешенной выборки исходного аудиосигнала, рассчитанным с заданным шагом на частотно-временной сетке в соответствии с установленными параметрами отображения сонограммы. Горизонтальный срез такого изображения сонограммы отражает изменение мощности аудиосигнала на данном частотном канале с течением времени.
На используемых в работе черно-белых сонограммах уровень серого цвета соответствует мощности звукового сигнала в данном узле частотно-временной сетки. Из-за свойств человеческого зрения для отображения фильма - сонограммы можно использовать не более 64 уровней серого, т.е. 6 бит на пиксель изображения. В большинстве приложений черный цвет изображения построенной сонограммы соответствует максимальной, а белый - минимальной мощности звукового сигнала на данном частотном канале в данный момент времени. В то же время возможно и инверсное представление уровня амплитуды или мощности аудиосигналов на частотно-временной сетке.
В разработанном СПО при построении матрицы изображения спектрограммы по оси ординат выводилось 512 частотных каналов (строк), а по оси абсцисс максимальное количество реализаций мгновенных амплитудных спектров (столбцов). Такое количество столбцов и строк определялось заданным разрешением видеоадаптера монитора (800x600 или большим). Точка с нулевым отсчетом на частотной и временной осях находится в левом нижнем углу главного окна. Полоса частот исследуемого речевого сигнала, разбитая на 512 каналов при базе ортогонального преобразования N=1024, равнялась (0Ча/2), где fd =8000 Гц - частота дискретизации, с которой была произведена запись речевого сигнала в компьютер через широко распространенную звуковую карту SB16 фирмы Creative Labs, Шаг по времени - временной интервал между соседними столбцами матрицы изображения, при построении данной сонограммы в режиме "по умолчанию" составил 50 отсчетов или 6,25 мс. Параметры построения сонограммы были заданы таким образом, чтобы выполнялись принципы информационной полноты и полноты звучания. Все далее приведенные сонограммы (спектрограммы были построены точно таким же образом при помощи этого же СПО.
Далее приведены примеры решения некоторых прикладных задач.
Информационный анализ следов фонообъектов и выявление признаков монтажа
Очень часто дополнительную информацию, а иногда и главные сведения об исследуемом фонообъекте, можно получить, проводя по соответствующим образом рассчитанным изображениям спектрограмм информационный анализ его следов, или следов фонообъектов, входящих в состав данного аудио сигнала.
Так в верхней панели рис. 9 на узкополосной спектрограмме принятого из канала телефонной связи аудио сигнала представлен фрагмент разговора двух абонентов, одним из которых является мужчина, а другим - женщина. Следы фонообъектов трех типов: обертонов речи мужского и женского голосов
на вокализованных не паузных участках сонограммы и вкраплений шумов в паузах - отчетливо видны на представленном изображении верхней панели рис. 9. Траектории (контура) максимальной контрастности или цепочки (треки) локальных максимумов уровней серого и являются теми самыми следами узкополосных составляющих фонообъектов, которые нами исследуются Они особенно хорошо заметны на выделенном центральном участке изображения со-нограммы рис. 9 в виде светлых линий, проходящих по центру серых и черных полосок одного цвета.
111г.-.'ШЗ
«йаЙВьФгЗ^ С
шк. \\sSk . Ш шй. м
Рис. 9. Следы фонообъектов различной природы, проявляемые на соно-
граммах
Вверху - следы разговора мужчины и женщины плюс след сигнала отбоя
телефонной линии;
В центре - следы акустозаграждающей аппаратуры и защищаемой речи;
Внизу - пример компьютерного монтажа речи заданным голосом диктора.
Сжатие речевых сообщений
Задачи сжатия РС также могут быть решены посредством обработки изображений сонограмм. Схема обработки такова: сначала РС в ходе ДСАС преобразуется в свой графический образ - сонограмму в границах выбранного окна анализа; затем это изображение сонограммы подвергается сжатию по одному из методов сжатия изображений, а коэффициенты сжатия передаются в канал связи; по полученным коэффициентам сжатия на приемном конце канала связи реконструируется изображение исходной сонограммы, по которой затем и производится синтез нового РС. Примеры показаны на рис. 10.
У ^ I иД ^^ЯИИИШЯИИЯИИНИМЯНШИ^КИНР^^М^ДГШ^^Ш ОТМ1И'Л|'№В')И' Ту! * I
Рис. 10. Примеры сжатия речи
Вверху - сонограмма исходного, исследуемого фрагмента речи;
В центре - сонограмма речевого сигнала, восстановленного после сжатия со скоростью 1000 бит/с, по одному из алгоритмов сжатия изображений исходной сонограммы;
Внизу - сонограмма речевого сигнала, восстановленного после сжатия до 800 бит/с с исключением информации об основном тоне.
Результаты ряда последних исследований показали, что, применяя фрактальные или специальные, основанные на Wavelet преобразованиях, методы сжатия к изображениям сонограмм можно добиться минимальной скорости кодирования 800 бит/с при сохранении 80% словесной разборчивости.
Улучшение комфортности восприятия речевых сигналов В некоторых приложениях бывает очень важным осуществлять ускоренное или замедленное прослушивание записанного PC, не изменяя при этом тембра речи. Этого можно достичь, осуществляя необходимое временное масштабирование сонограммы исходной речи, либо растягивая ее по времени либо сжимая, но не выходя при этом за рамки частотной полосы исходного PC Произведя по полученным измененным сонограммам синтез, в результате получаем речь того же диктора, но воспроизводимую либо в ускоренном, либо в замедленном темпе с сохранением всех признаков, присущих данному говорящему лицу (см рис. 11).__
L
1 4 t
4 rl
Рис. 11. Изменение темпа и тембра речи
Вверху - сонограмма речи, синтезированной с ускорением темпа на 30%
по отношению к сигналу на верхней панели рис. 10;
В центре - сонограмма речи, синтезированной с замедлением темпа на
30% по отношению к сигналу на верхней панели рис. 10;
Внизу - изменение тембра речи посредством уменьшения частотного
масштаба исходной сонограммы на верхней панели рис. 10 на 30%.
Отмечается, что изменение темпа речи до 30% не искажает ее слуховое восприятие.
Очистка речевых сигналов от шумов и помех
Очистка РС от шумов и помех это наиболее распространенная группа задач в области безопасности РС При использовании компьютерных технологий на основе предложенного подхода к обработке речи через обработку изображений ее сонограмм в режиме ДСАС можно добиться наиболее эффективных по затраченным временным и финансовым ресурсам результатов очистки речи в наиболее сложных случаях проявления помех.
Результаты очистки при реализации такого подхода можно контролировать не только на слух, но и визуально через анализ и модификацию изображе-
ний сонограмм исходного и восстановленного речевого сигнала на каждом очередном этапе обработки
Наиболее эффективно применение методов цифровой обработки изображений сонограмм в случае необходимости избавления от присутствующих в речевом сигнале стационарных или медленно меняющихся квазигармонических помех. Именно такой пример удаления следов сильной помехи из РС показан на рис. 12.
виигапваияеа^вы;
у - ;
Шй£
у
* I т ^
Рис 12. Удаление следов сильной помехи из речевого сигнала вверху - сонограмма речи с помехой, значительно превышающей уровень речи;
в центре - сонограмма очищенного участка речи после обработки с использованием квадратичной зависимости нелинейной составляющей полной фазы в модели аудио сигнала (11);
внизу - сонограмма очищенного участка речи после обработки по уточненной модели речи как совокупности узкополосных сигналов по Гильберту
Компьютерная стеганофония
На рис. 13. приведены примеры использования предложенного подхода в задачах компьютерной стеганофонии. На верхней панели рис. 13 представлена сонограмма исходной речи. На нижней панели этого рисунка представлена спектрограмма нового звукового сигнала с реализацией нескольких способов компьютерной стеганофонии для передачи-хранения КИ в цифровом виде в РС на основе предложенного подхода через обработку графических образов звука
толп г»гаэ
V -
!
МШ-У
& '«х.
XI $■.
, ,-а.«« с А «
--- &
: £
Л" »«
^/Ми]» |'5 / 6 ^ ^
й^ееь
Рис. 13. Способы синтеза речевых сигналов по изображению их динамических сонограмм
вверху - осциллограмма и спектрограмма исследуемого РС; внизу - спектрограмма нового звукового сигнала, просинтезированного с различными значениями фазы узкополосных составляющих отдельных фраз и постановкой стеганофонических маркеров в виде надписей на паузных участках.
На рис. 14. приведены примеры использования предложенного подхода в задачах компьютерной стеганофонии, являющихся неотъемлемой частью нового бурно развивающего направления защиты информации - компьютерной стеганографии. Так, в верхней панели рис. 14 показана возможность перевода изображений любого содержания в звуковой файл, динамическая спектрограмма которого будет достаточно хорошо визуально совпадать с изображением -прародителем данного звука. В качестве примера показана спектрограмма звука, синтезированного по отсканированному изображению фотоснимка.
Рис. 14. Примеры компьютерной стеганофонии
вверху - осциллограмма и спектрограмма звукового сигнала, синтезированного по фотоснимку;
внизу - спектрограмма стеганофонических маркеров в виде надписей печатного и рукописного текста, переведенных в звуковую форму.
Проведенные оценки допустимых значений скорости скрытной передачи конфиденциальной информации в аудио сигналах показали, что на сегодняшний день эти значения не превышают 100 бит/с.
Не исключено появление новых способов маскированной передачи конфиденциальной информации в акустических сигналах - «контейнерах» на основе предложенных методов обработки графических образов звука, в результате чего информационная эффективность компьютерных систем скрытной передачи данных реализованных на СТС может существенно возрасти. Понятно, что совместное применение в предложенных методах компьютерной стеганофонии и/ или технического закрытия речи сертифицированных ФАПСИ алгоритмов криптографического закрытия позволит надежно повысить стойкость подобных систем к попыткам нарушителя заполучить защищаемую конфиденциальную речевую информацию.
Техническое закрытие речи в каналах связи и постановка активных
акустических помех в выделенных помещениях
Один из способов технического закрытия речи, когда РС просто маскируется мощной помехой, уже был рассмотрен нами в рамках обсуждения вопроса очистки искаженного РС от квазигармонических помех. Сонограмма такой звуковой смеси была показана на верхней панели рис. 12.
На верхней панели рис. 15 показана сонограмма нового звукового сигнала, полученного на основе синтеза по исходному изображению сонограммы в верхней панели рис. 10, модифицированному путем различных поворотов выделенных частотно-временных элементов. Впервые реализована возможность получить новый звуковой сигнал, спектр некотрых ЧВЭ которого повернут по отношению к исходному на 90°, а не только на 180° как в случаях его частотной и-или временной инверсии.
md^mmmm:
| g ih \
fS-ASTJEI^rtr'SriSVXWOT
Рис. 15. Примеры технического закрытия речи вверху - спектрограмма сигнала, синтезированного по сонограмме в верхней панели рис. 10 с поворотами трех выделенных на ней частотно-временных элементов на 180° (частотно-временная инверсия), 90° (по часовой стрелке) и 180° (временная инверсия);
внизу - спектрограмма варианта технического закрытия речи в виде закручивания в спираль изображения сонограммы в верхней панели рис.12 с последующим синтезом.
На основе предложенного подхода возможны и другие варианты решения задач технического закрытия речи.
Приведенные примеры решения некоторых прикладных задач при помощи разработанного СПО показали эффективность выбранного подхода к обработке аудиосигналов и речи через обработку изображений их графических образов для решения проблемы обеспечения безопасности оперативных аудиоданных и позволили выделить ряд направлений перспективных исследований:
- идентификация голоса говорящего и распознавание речи
- количественная оценка эффективности систем защиты PC;
- изменение голоса говорящего.
В заключении приведены основные результаты работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
Основные результаты, полученные в диссертационной работе, состоят в следующем:
1.На основе системного анализа методов и средств защиты и обработки аудиосигналов сделан вывод о необходимости использования преимуществ применения компьютерных технологий в целях обеспечения безопасности оперативных аудиоматериалов.
2.Сформулированы принципы построения и развития специализированных компьютерных систем обеспечения безопасности оперативных аудиоданных в ОКС на базе известных технических средств и технических решений мультимедиа. Перенастройка специализированных компьютерных систем на решение конкретной задачи ОБРС сводится лишь к замене существующего программного обеспечения на новое или к модернизации аппаратно-программного интерфейса с внешними датчиками-приемниками информационных сигналов. Таким способом достигается значительная экономия временных и материальных ресурсов, затрачиваемых сегодня на разработку средств специальной техники, увеличивается срок их оперативного использования за счет обновления в первую очередь программных, а во вторую аппаратных периферийных компонентов.
3. Предложено при построении специализированных компьютерных РП систем опираться в полной мере на технологии закрытой компьютерной телефонии, отражающий их современное состояние и тенденции развития. Научный потенциал компьютерной фоноскопии из-за существенных отличий оперативных аудиоданных от фонограмм, используемых при проведении фонографических экспертиз с последующем представлением в качестве вещественных доказательств может быть использован лишь отчасти.
4.Разработаны требования к создаваемым специализированным компьютерным системам речепреобразования, согласно которым:
- анализ-синтез и обработка аудиосигналов и речи на стандартных технических средствах компьютерной телефонии должны выполняться в масштабе времени, близком к реальному,
- процедуры обработки не зависеть от необходимости синхронизации процессов анализа-синтеза, а также других условий и особенностей каналов открытой и закрытой речевой связи;
- задержка восстановленной после скремблирования или другого вида обработки речи не должна превышать 100 мс;
- качество восстановленного после различных видов обработки РС, если специально не оговорено, должно быть не хуже исходного (оставаться в том же классе качества согласно ГОСТ 50840/95);
- количество ключевых комбинаций в моделируемых системах аналогового скремблирования должно приближаться к стратегическому уровню стойкости и быть не менее 1020 ключевых подстановок,
- степень сжатия РС, адаптивного к пропускной способности каналов связи, в создаваемых устройствах и системах цифрового закрытия речи должна достигать 1 Кбод (при 3-м классе качества звучания по ГОСТ 50840/95)и не зависеть от индивидуальных признаков говорящего;
- повышение формантной разборчивости оперативных аудиоданных, принятых в условиях шумов и помех должно быть не менее 5% в самых тяжелых случаях искажения речи в условиях преднамеренного противодействия.
5. На основе исследований в области мелодики речевых вокализмов и результатов проведения фоноскопических экспертиз сделан вывод о том, что наиболее предпочтительной группой параметров, инвариантных к большинству искажений и преобразований, претерпеваемых речевым сигналом в реальных условиях и в технических системах его передачи и обработки прежде, чем он оказывается зафиксированным на дискете или магнитной ленте в открытом (закрытом) виде, являются параметры, отражающие на частотно -временной сетке узкополосных сонограмм месторасположение и значения амплитуд локальных и глобальных экстремумов РС. По ним находятся другие, напрямую от них зависящие, группы параметров, которые в значительной степени характеризуют либо работу технических устройств аудиозащиты и нападения, либо индивидуальные признаки говорящего лица и смысловое содержание РС. Так для идентификации голоса говорящего, это будут спектральные значения частот, амплитуд, фаз и их производных для локальных максимумов на частотно-временной сетке (ЧВС), а для РПУ систем закрытой телефонии это будут параметры, отражающие размеры и расположение на ЧВС границ частотно-временных элементов (ЧВЭ) закрытой речи, определяемые по моментам разладок линий гармоник основного тона, импульсным и гармоническим помехам на краях ЧВЭ.
6. В соответствии с теоретическими положениями образного анализа экспериментальных данных предложено использовать функциональные моде-
ли образного восприятия информации при построении и реализации компьютерных технологий обеспечения безопасности речевой связи при их использовании даже технически слабо подготовленными пользователями.
7. На основе учета особенностей механизмов человеческого речеобра-зования и слухового восприятия и функциональных моделей образного восприятия информации создана система аналитических моделей акустического (речевого) сигнала, представляемого суммой узкополосных по Гильберту процессов, которая оказалась в лучшей степени пригодна для использования в специализированных компьютерных РП системах и моделирования процессов их функционирования.
8. В соответствии с теорией частотно-временных преобразований сигналов были определены требования к синтезу аудиосигналов с заданными частотно-временными свойствами, не создающими переходных процессов на выходе линейных систем. Этим свойствам полностью удовлетворяют узкополосные сигналы, и, прежде всего, определенные на базе Вейвлет функций, которые могут использоваться во многих задачах ОБРС для синтеза или восстановления акустических сигналов по следам фонообъектов их составляющих
9. Установлено, что подавляющее большинство систем обеспечения безопасности оперативных аудиоданных может быть смоделировано (на уровне РПУ) на основе моделей анализа-синтеза речи с использованием ортогональных преобразований. В качестве общей алгоритмической основы таких моделей выбран дискретный динамический спектральный анализ на базе БПФ, а в качестве первичного описания - узкополосные сонограммы речевого сигнала.
10. Определен комплекс базовых элементов разрабатываемых систем компьютерного моделирования и первичного анализа РПУ, используемых в технических средствах защиты и обработки РС с учетом особенностей используемых каналов связи и практической деятельности правоохранительных органов, предложена методика выбора оптимального размера частотно-временной сетки при реализации кратковременного Фурье анализа в компьютерных системах обеспечения безопасности оперативных аудиоданных. Разработан математический аппарат дискретного динамического спектрального анализа-синтеза речи, в т.ч. включающий в себя две базовые системы аудиообработки, работающие без синхронизации в РМВ; симметричную по отношению к операциям динамического анализа и синтеза с низким разрешением по частоте и сохранением фазовых значений спектральных составляющих, и асимметричную -с высоким разрешением по частоте и без сохранения фазовых составляющих кратковременных спектров.
11. На основе теоретических положений образного анализа экспериментальных данных и теории восстановления сигналов и цифровой обработки изображений предложена технология синтеза акустического (речевого) сигнала с заданными частотно-временными свойствами по графическим образам его динамических амплитудных спектров - узкополосных сонограмм. На базе этой технологии определены требования к получению графических образов речевого сигнала в полосе СТК. Рекомендовано применять общие принципы образного анализа экспериментальных данных и современные технические средства мультимедиа совместно с выбранным представлением речевого сигнала в виде суперпозиции узкополосных процессов в компьютерных технологиях обеспечения безопасности речевой связи.
12. В соответствии с теорией цифровой обработки изображений (прежде всего бинарных) разработаны методы выявления, восстановления, расслоения, изменения и реконструкция следов фонообъектов - параметрических описаний узкополосных аудиосигналов в координатах амплитуда, частота, фаза и время,
составляющих исходный аудио сигнал, которые стали методической основой решения проблемы и практических задач безопасности оперативных аудиоданных правоохранительных органов в процессе информационно-технического противодействия.
13. Предложен способ построения специальных программно-аппаратных средств звуко- и речепреобразования на основе стандартной вычислительной техники, средств мультимедиа и компьютерной телефонии, сочетающий идею перевода звукового сигнала в вид графических образов (изображений соно-грамм и фазограмм) и обратно из изображения в аудиосигнал или речь без потери информативности и/или разборчивости с возможностями известных и перспективных методов цифровой обработки изображений. На основе разработанного способа графического представления аудиосигнала в виде разверток изображений его узкополосных амплитудных спектров разработан обобщенный критерий и мера оценки относительного изменения качества звучания восстановленной после скремблирования или другого вида обработки речи, по сравнению с исходным PC. Показано, что при значениях коэффициента изменения качества PC, не превышающих 5 Дб, звучание PC на выходе моделируемой или исследуемой системы безопасности оперативных аудиоданных, в частности РПУ закрытой телефонии, будет оставаться в том же классе качества, что и исходная (открытая) речь. А при синтезе АС по следам фонообъектов с учетом их фазы необходимым условием их дальнейшего использования в решении задач БОА является превышение 30% порога абсолютным значением НКВК исходного и таким образом восстановленного звуковыми сигналами.
14. Разработана базовая система специального программного обеспечения (СПО) обработки акустических сигналов и речи в анализируемых и разрабатываемых компьютерных РП системах обеспечения безопасности оперативных аудиоданных. СПО включает в себя: подсистему параметрического описания закрытых и открытых речевых сообщений и аудиосигналов с помощью цифровых методов измерения их параметров; подсистему статистического анализа и графического отображения образов речи в виде узкополосных соно-грамм и выделения из них параметрических описаний (трендов локальных максимумов) акустических (речевых) сигналов; подсистему обработки следов фонообъектов на основе принципов образного анализа и методов цифровой обработки изображений; подсистему синтеза аудиосигналов по их параметрическим описаниям - следам фонообъектов. Открытость СПО позволяет дополнять имеющиеся модули новыми программными модулями обработки или анализа, получаемыми в ходе дальнейшего развития и практической апробации системы в решении задач правоохранительных органов. Показано, что разработанное СПО может быть реализовано в масштабе времени, близком к реальному, на типовых персональных компьютерах стандартной конфигурации с процессором PI и выше, совместно со звуковой картой типа Sound Blaster 16, голосовым модемом типа ZyXel 1496Е+ и интерфейсом с телефонной линией. В результате экспериментальных исследований данного СПО на реальных канала связи и с реальными оперативными аудиоданными установлено его полное соответствие предъявленным в п. 4 требованиям. С помощью разработанной системы ПО выявлены особенности работы РПУ некоторых систем виброакустического зашумления и систем закрытой телефонии, присутствующих на отечественном рынке, оценена их реальная эффективность по защите речевых сообщений. Выработаны рекомендации по оценке эффективности и выбору надежных и стойких технических средств защиты речевой информации, имеющихся на открытом рынке спецтехники для использования в оперативно-розыскной деятельности правоохранительных органов.
15. Произведена экспериментальная проверка на реальных каналах связи предложенных методов речепреобразования по созданию новых и анализу известных методов закрытия речи (как аналоговых, так и цифровых) на основе разработанной системы компьютерного моделирования, разработанных методов анализа-синтеза речи и описаний речевого сигнала. Проверка показала пригодность этих методов речепреобразования для построения и развития систем оперативной закрытой речевой связи в ОКС и бесключевого восстановления закрытых PC преступных элементов на базе стандартных технических средств в оперативно-служебной деятельности правоохранительных органов.
16. Разработана концептуальная модель создания и исследования специальных РП систем, которая позволяет организовывать функционально-законченные компьютерные технологии обеспечения безопасности оперативных аудиозаписей, приемлемые для решения практических задач правоохранительных органов в условиях информационно-технического противодействия. При этом наращивание и использование готовых библиотечных модулей СПО конкретных приложений (сжатие речи, маскирование и скремблирование PC, темпокоррекция, шумоочистка, нелинейный аудиомонтаж и др.) позволяет существенно расширить диапазон практического применения.
17. Выработаны рекомендации по практической реализации синтезированных алгоритмов в виде примеров решения наиболее часто встречающихся в практике правоохранительных структур задач обеспечения безопасности оперативных аудиоданных. Определены направления дальнейших исследований. Наиболее значимыми из них являются:
- повышение точности и надежности обнаружения скрытых периодич-ностей в акустическом (речевом) сигнале на основе использования способов, отличных от выявления следов фонообъектов на изображениях динамических сонограмм, например, посредством решения системы линейных дифференциальных уравнений;
- восстановление пропущенных и искаженных участков речевых сигналов в оперативных аудиозаписях методами аналитического продолжения спектра, протяжки линий гармоник основного тона;
- разработка и исследование быстрых алгоритмов двухканальной сте-реошумоочистки искаженных речевых сигналов с использованием параметров следов фонообъектов опорного сигнала;
- исследование и разработка методов адаптивного сжатия графических образов аудиосигналов для создания акустических закладок с повышенной емкостью записей переговоров нескольких лиц;
- повышение надежности идентификации личности говорящего на основе использования дополнительных индивидуальных признаков голоса, содержащихся в векторе приведенных начальных фаз обертонов речи на вокализованных участках.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Антонец В.Р., Галузинский С.И., Дворянкин C.B. Программно - аппаратный комплекс моделирования методов цифровой обработки речевых сигналов в телефонных каналах связи. // Тезисы докладов 12 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1994. - с.25-26.
2. Антонец В.Р., Галузинский С.И., Дворянкин C.B. Исследование методов разработки средств кодирования речевых сигналов.//Тезисы докладов 12 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1994. - с. 24-25.
3. Барсуков B.C., Дворянкин C.B., Чикалев И.А. Анализ состояния и тенденций развития рынка технических средств обеспечения безопасности связи.// Тезисы докладов 12 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1994. - с. 9-10.
4. Барсуков B.C., Бугаенко О.В., Дворянкин C.B. Исследование возможностей цифровой обработки изображений частотно-временных описаний сигналов в задачах анализа-синтеза речи.//Тезисы докладов 11 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1991. - с. 15-16.
5. Барсуков B.C., Дворянкин C.B. Автоматизированные системы контроля доступа. М.: «Монитор - Аспект», №4. 1993. - с. 45-52.
6. Барсуков B.C., Дворянкин C.B., Шеремет И.А. Безопасность связи в каналах телекоммуникаций. М.: Серия ТЭК, НИФ "Электронные знания". 1992; 1993. - 122 с. (Коллективная монография. Часть 2).
7. Бугаенко О.В., Дворянкин C.B., Исследование возможностей цифровой обработки динамических фазовых спектров сигналов в задачах сжатия речи.//Тезисы докладов 11 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1991. - с. 14-15.
8. Галузинский С.И., Дворянкин C.B. Частотно-временной речевой скремблер, не требующий синхронизации. // Тезисы докладов 12 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1994. - с. 22-23.
9. Григорьев В.Р., Дворянкин C.B. Исследование возможностей создания низкоскоростных кодеков речевого сигнала на основе методов сжатия изображения амплитудного спектра речи. Доклады 1-й Международной конференции "Цифровая обработка сигналов и ее применения". - М.: Международный центр научной и технической информации (МЦНТИ), том 1. 1998. - с. 284292.
10.Дворянкин C.B. Актуальные вопросы подготовки специалистов в области защиты аудио видео информации. Доклады на 1-ой Всероссийской учебно-методической конференции "Вопросы преподавания предмета "Защита информации" в системе Высшей школы" на базе факультета информационной безопасности МИФИ, январь 1998. - М.: Безопасность информационных технологий. №. 2. 1998. - с. 12-14.
11. Дворянкин C.B. Асинхронная двухканальная шумоочистка цифровых аудиозаписей. // Тезисы докладов научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУСИ. -М.: МТУСИ. 2000. - с. 184-185.
12.Дворянкин C.B. Вейвлет-синтез в задачах безопасности речевой связи. // Тезисы докладов научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУСИ. -М.: МТУСИ. 2000. - с. 213.
13.Дворянкин C.B. Взаимосвязь цифры и графики, звука и изображения. М.: Открытые системы. №3. 2000. - с. 34-42.
14.Дворянкин C.B. Возможности компьютерных технологий обеспечения безопасности речевой связи. // Тезисы докладов международной конференции «Нейросетевые технологии обработки информации». Украина, Крым. 1998. -с. 72-74.
15.Дворянкин C.B. Восстановление разборчивости искаженных речевых сообщений программными средствами, асинхронная двухканальная шумоочистка фонограмм. // Доклад на конференции "Информационная безопасность компьютеризированных систем". М.: Гротек, 2000. - с. 53-56.
16.Дворянкин C.B. Дискретная динамическая цифровая обработка речевых сигналов в каналах связи правоохранительных органов. М.: Сборник научных трудов Академии управления МВД РФ. 1997. - с. 96-112.
17.Дворянкин C.B. Информационное противоборство в правоохранительной сфере. // Доклад на международной научно-практической конференции "Россия, XXI век-антитеррор". М.: МВД РФ, 2000. - с.17-27.
18.Дворянкин C.B. Использование вектора приведенных начальных фаз гармоник речевого сигнала как дополнительного признака верификации говорящего. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия МВД РФ. 1996. - с. 174-177.
19.Дворянкин C.B. Исследование возможностей применения параметров речевых вокализмов в системах контроля и управления доступом. // Тезисы докладов XXXIII научно-методической конференции профессорско-преподавательского состава МТУСИ. - М.: МТУСИ. 1999. - с.147-148.
20.Дворянкин C.B. Исследование возможностей создания малогабаритного цифрового бескинематического диктофона. // Тезисы докладов международного конгресса "Коммуникационные технологии и сети" (CTN-98) в рамках международного форума информатизации (МФИ 98). - М.: МТУСИ. 1998. - с. 268-270.
21.Дворянкин C.B. Компьютерные технологии безопасности речевой связи в органах внутренних дел. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2. 1998. - с. 158-161.
22.Дворянкин C.B. Компьютерные технологии защиты речевых сообщений в общедоступных каналах связи. М.: Безопасность информационных технологий. №. 4. 1998.-с. 87-100.
23.Дворянкин C.B. Компьютерные технологии защиты речевых сообщений в каналах электросвязи. М.: МТУСИ. 1999. - 52 с.
24.Дворянкин C.B. Метод повышения разборчивости речи в условиях воздействия помех. // Тезисы докладов 13 военно-научной конференции, в/ч 45807 - Р/1, V-секция. 1995. - с.29-31.
25.Дворянкин C.B. Новый подход к анализу и обработке аудиосигналов в компьютерных технологиях безопасности речевой связи. // Тезисы докладов международного конгресса "Коммуникационные технологии и сети" (CTN-98) в рамках международного форума информатизации (МФИ 98). - М.: МТУСИ. 1998.-с. 247-248.
26.Дворянкин C.B. Нормировка слов в системах распознавания речи. Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия МВД РФ. 1996. - с.189-191.
27. Дворянкин C.B. О техническом закрытии - маскировании и модификации речевого сигнала в каналах связи. // Тезисы докладов научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУСИ. - М.: МТУСИ. 2000. - с. 43-46.
28.Дворянкин C.B. О технологии речевой подписи в системах охраны и безопасности. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2. 1997. -с.75-78.
29.Дворянкин C.B. Обеспечение безопасности речевой связи в условиях инициализации информационных угроз. // Тезисы докладов научно-технической конференции. В/ч 45807 P/I, 2000. - с. 34.
30.Дворянкин C.B. Очистка речевого сигнала от шумов и помех посредством цифровой обработки изображений его сонограмм. // Тезисы докладов меж-
дународной конференции "Обработка информации в компьютерных системах". - М.: МТУСИ. 1997. - с. 179 -180.
31.Дворянкин C.B. Повышение уровня защищенности от несанкционированного доступа конфиденциальных речевых сообщений в стандартных системах речевой почты. //Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия МВД РФ. 1996. - с. 317-320.
32.Дворянкин C.B. Симметричная система анализа - синтеза речевых сигналов, работающая без синхронизации. М.: Сборник научных трудов Академии МВД РФ. 1996. - с. 23-45.
33.Дворянкин C.B. Скрытная передача конфиденциальной информации в аудио сигналах и речи. С-Пб.: Безопасность, достоверность информации, «БДИ». №2 (30). 2000. -с. 12-16.
34.Дворянкин C.B. Требования к построению сонограмм при реализации компьютерных технологий безопасности речевой связи. Тезисы докладов научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУСИ. - М.: МТУСИ. 1999. - с. 74-76.
Зб.Дворянкин C.B. Цифровая обработка изображений динамических спектрограмм аудиосигналов в задачах обеспечения безопасности речевой связи. М.: Специальная техника. №3. 2000. - с. 37-44.
36.Дворянкин C.B., Девочкин Д.В. Методы закрытия речевых сигналов в телефонных каналах. С-Пб.: Защита информации, «Конфидент» №5. 1995. - с. 45-59.
37.Дворянкин C.B., Еманов B.C. Камуфлирование крупногабаритных систем охраны и безопасности объектов. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2.1997. - с. 79-80.
38.Дворянкин C.B., Женило В.Р. Система протоколирования искаженных помехами и шумами речевых фонограмм. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2. 1998. - с. 85-89.
ЗЭ.Дворянкин C.B., Женило В.Р., Кравченко Ю.А. Информационные технологии управления в органах внутренних дел. (Учебник, глава 4. Компьютерная обработка фото, видео и звуковой информации). М.: Академия управления МВД России, 1998 г. - 432 с. (Глава 4. с. 201-217).
40.Дворянкин C.B., Калужин Р.В. Методы фрактального преобразования в задачах сжатия речи. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2. 1998. - с.106-109.
41.Дворянкин C.B., Кханг Во Ван. Возможность использования фазовых характеристик сигнала в системах управления доступом. // Тезисы докладов конференции 'Телекоммуникационные и вычислительные системы" в рамках международного конгресса "Коммуникационные технологии и сети" (CTN-99) международного форума информатизации (МФИ 99). - М.: МТУСИ. 1999. -с.241-242.
42.Дворянкин C.B., Лагутин B.C., Петраков A.B. Утечка и защита информации в телефонных каналах. М.: Энергоатомиздат, 1996; 1997; 1998. - 320 с. (Глава 9, с. 267 - 286).
43.Дворянкин C.B., Минаев В.А. Возможности скрытой передачи информации по общедоступным каналам речевой связи. // Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2. 1997. - с. 78-79.
44.Дворянкин C.B., Минаев В.А. Основные принципы построения систем закрытой компьютерной телефонии в деятельности правоохранительных органов. Тезисы докладов международной конференции "Информатизация правоохранительных систем". - М.: Академия управления МВД РФ, часть 2. 1997.-с.72-75.
45.Дворянкин C.B., Минаев В.А. Представление речевых сигналов в виде графических образов. Тезисы докладов международной конференции «Нейро-сетевые технологии обработки информации». Украина, Крым. 1997. - с. 1213.
46.Дворянкин C.B., Минаев В.А. Технология речевой подписи. М.: Открытые системы. №5(25). 1997.-е. 68-71.
47.Дворянкин C.B., Минаев В.А., Потанин В.Е. и др. Основы информационной безопасности. Воронеж: Воронежский институт МВД России, 2000. - 460 с. (Часть 4. с. 362-454).
48.Дворянкин C.B., Морозов И.С., Рогачев A.A. Использование модулей распознавания ключевых слов в биометрических системах контроля доступа. // Материалы VIII международной конференции "Системы безопасности - 99". - М: Московский институт пожарной безопасности МВД РФ. 1999. - с. 121123.
49.Дворянкин C.B., Морозов И.С., Рогачев A.A. Исследование возможностей создания систем распознавания ключевых слов на базе PIC - процессоров. // Тезисы докладов конференции "Телекоммуникационные и вычислительные системы" в рамках международного конгресса "Коммуникационные технологии и сети" (CTN-99) международного форума информатизации (МФИ 99). -М.: МТУСИ. 1999. - с.243-244.
50.Дворянкин C.B., Морозов И.С., Рогачев A.A. Обеспечение безопасности речевой связи в Internet -телефонии. // Тезисы докладов IV межрегионального научно-технического семинара "Применение пластиковых карт и защита информации". - М.: МНТОРЭС им. A.C. Попова. 1999. - с. 49-51.
51.Дворянкин C.B., Осипов O.A., Хайдуков Е.П. Двухмерная обработка спектрального описания речевого сигнала. // Тезисы докладов X военно-научной конференции, в/ч 25714. 1987. - с.32-34.
52.Дворянкин C.B., Осипов O.A., Хайдуков Е.П. Комплекс технических средств для первичного анализа и цифровой обработки аналоговых сигналов. // Тезисы докладов XX юбилейной научно-технической конференции, в/ч 45807 -Р/1. 1987.-с 55-57.
БЗ.Дворянкин C.B., Петраков A.B. К понятию и разновидностям электрорадио-стеганологии. // Тезисы докладов XXXIII научно-методической конференции профессорско - преподавательского состава МТУСИ. - М.: МТУСИ. 1999. -с. 129-130.
54.Дворянкин C.B., Петраков A.B. О радиотехнической стеганологии. II Тезисы докладов научно-технической конференции профессорско-преподавательского, научного и инженерно-технического состава МТУСИ. -М.: МТУСИ. 1999.-с. 76-77.
55.Дворянкин C.B., Петраков A.B. Основы практической защиты информации. М.: Радио и связь, 1999. - 368 с. (Раздел 7.10, с. 275 - 292).
56.Дворянкин C.B., Романцов А.П. Статистический метод стеганофонического анализа аудиофайлов. // Тезисы докладов IV межрегионального науч.-техн. семинара "Применение пластиковых карт и защита информации". - М.: МНТОРЭС им. A.C. Попова. 1999. - с. 51-54.
-
Похожие работы
- Разработка и исследование усовершенствованного метода компрессии звуковых данных в мультимедийных системах
- Разработка и исследование метода объективной оценки качества кодеков с компрессией цифровых аудиоданных
- Разработка быстродействующих алгоритмов компрессии звуковых данных на основе дельта-преобразований второго порядка
- Моделирование информационных процессов в компьютерных системах органов внутренних дел в условиях противодействия угрозам информационной безопасности
- Технология и методы интеллектуального мониторинга автотранспортных потоков и состояния автомобильных дорог
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность