автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Методы и технология построения программируемых инфокоммуникационных систем
Автореферат диссертации по теме "Методы и технология построения программируемых инфокоммуникационных систем"
На правах рукописи
КУЛЕШОВ Сергей Викторович
МЕТОДЫ И ТЕХНОЛОГИЯ ПОСТРОЕНИЯ ЦИФРОВЫХ ПРОГРАММИРУЕМЫХ ИНФОКОММУНИКАЦИОННЫХ СИСТЕМ
Специальность 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора технических наук
4855369
-6 ОКТ 2011
Санкт-Петербург 2011
4855369
Работа выполнена в Учреждении Российской академии наук Санкт-Петербургском институте информатики и автоматизации РАН
Официальные оппоненты: доктор технических наук,
Ведущая организация:
Санкт-Петербургский государственный политехнический университет
Защита состоится « 27 »октября 2011 г. в 12.00 часов на заседании Диссертационного Совета Д.002.199.01 при Учреждении Российской академии наук Санкт-Петербургском институте информатики и автоматизации РАН по адресу: 199178, Санкт-Петербург, В.О., 14-я линия, 39.
С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Санкт-Петербургского института информатики и автоматизации
профессор
Баранов Сергей Николаевич
доктор технических наук, профессор
Игнатьев Михаил Борисович
доктор технических наук, профессор
Потапов Алексей Сергеевич
РАН
Автореферат разослан « 20 » сентября 2011 г.
Ученый секретарь
диссертационного совета Д.002Л 99.01 кандидат технических наук
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы диссертации.
На протяжении последних 50 лет микроэлектроника, развиваясь в соответствии с законом Мура, расширяет функциональные возможности систем инфокоммуникации, увеличивая скорость и битовой объем передаваемых данных, трансформируя традиционные аналоговые системы связи и телевидения в цифровые мультимедийные технологии. Это вызывает появление новых общецивилизационных понятий: информационные технологии; on-line доступность; адаптивное когнитивное программируемое радио (SDR); виртуализация ЗЭ-окружения; наноэлектроника. В то же время системы связи продолжают проектироваться исходя из традиционной методологии теории информации, общей теории связи К. Шеннона, В. А. Котельникова, А. А. Харкевича. Потенциальная помехоустойчивость таких систем определяется среднеквадратической ошибкой (СКО) - энергетическим критерием спектральной разности между сигналом, шумом и их вероятностными распределениями, гипотезой об эргодичности, а также критериями типа Неймана-Пирсона, Вальда и др. Транспортировка сигнала в таких системах (передача и прием) основана на принципе гетеродина, при котором контейнер (несущая частота) и контент (информационное содержание) представлены как единое целое. Появление цифровой микроэлектроники привело к разработке цифровых схем, реализующих передаточные функции (операторы Хевисайда), а также к появлению эффективных рекурсивных схем обработки и передачи данных: алгоритмам А. Д. Витерби, В. В. Александрова (быстрым преобразованиям Адамара), самоподобным функциям Вейерштрасса и ряду других.
Основной парадигмальный недостаток классической архитектуры систем связи - модуляция несущей информационной составляющей сигнала, влечет за собой жесткую зависимость полосы пропускания (и диапазона выделенных частот) от типа передаваемого контента (звука, видео, сигналов управления, навигации, локации и телеметрии), что является причиной низкой энергоэффективности таких систем. Очевидность этого факта приводит к демонтажу энергетически затратных передающих комплексов и внедрению систем передачи данных, основанных на пакетной передаче данных, сотовой архитектуре и интернет-технологиях.
Отставание России в наноэлектронике создает ситуацию научно-образовательной некомпетентности, в которой новейшие тенденции диктуются зарубежными организациями, в частности Wireless Innovation Forum (ранее SDR-forum), в которой Россия даже не имеет своего представительства.
Для массового внедрения появившихся технологических возможностей необходимо концептуальное и теоретическое исследование специфических свойств цифрового программируемого канала, в котором основой является не просто цифровая модуляция контентом (манипуляция) несущей частоты, а возможность адаптивного, когнитивного управления контентом и его
представление в виде битового потока, передаваемого в физическую среду (в том числе и беспроводную) с целью достижения качественно иных предельных показателей (надежности, энергоэффективности, защищенности, скрытности и ряда других).
Для решения сформулированных выше проблем в диссертационной работе ставится и решается научная задача: разработка теории и методологии построения цифровых программируемых инфокоммуникационных систем и на этой основе разработка методов, алгоритмов и программ для организации каналов передачи цифрового контента.
Суть рассматриваемой цифровой программируемой технологии инфокоммуникации (в дальнейшем «программируемой технологии») - это совмещение трех дополняющих друг друга информационных составляющих: имени, контейнера и контента. «Имя» - идентификационный адрес, в отличие от обезличенной широковещательной передачи сигнала; «контейнер» -совокупность форматов и протоколов, не зависящих от вида канала; «контент» (содержание) - семантико-информационное представление (звук, видео, текст и т.д.) Использование такого составного цифрового информационного объекта расширяет функциональные возможности задач мониторинга, организации когнитивных процессов представления семантики, а также решает проблему энергоинформационной оптимизации.
Данная диссертационная работа является междисциплинарным исследованием в области современной цифровой технологии импульсно-временной регистрации сигналов, контейнерной транспортировки, согласования межканальных протоколов и семантических методов представления, хранения и передачи информационного контента.
Целью работы является разработка научно обоснованной методологической базы и программно-технических решений для повышения эффективности систем инфокоммуникации за счет применения парадигмы программируемого канала передачи данных. Для достижения поставленной цели в работе решены следующие задачи:
1. Исследование основных направлений в области построения систем передачи цифровых данных.
2. Разработка теоретических основ, архитектуры цифрового программируемого коммуникационного канала.
3. Разработка методов и программ построения гибридных кодеков с заданными параметрами, определяемыми задачей.
4. Создание формализма терминальных программ для оценки предельной сложности цифрового информационного объекта.
5. Разработка методов и критериев оценки адекватности цифровых программируемых инфокоммуникационных систем. Семантический анализ текстовых, аудио- и видео- данных.
6. Обобщение и оценка результатов исследований по проблеме организации программируемых каналов передачи данных с оценкой эффективности полученных результатов.
Объект исследования. Информационные и энергетические аспекты представления разнотипных данных (текст, аудио, видео), а также свойства сложных структур данных, представляющих цифровой информационный объект.
Предмет исследования. Закономерности, принципы, способы, методы, модели, алгоритмы, методики технические решения нового класса задач организации передачи компрессированных цифровых данных.
Методы исследования. Для решения поставленных задач используются методы цифровой обработки разнотипных сложно структурированных данных, объектно-ориентированного проектирования и программирования, алгоритмическая теория А. Н. Колмогорова, теория графов, синтеза цифровых логических схем, особенности психовизуального восприятия.
Научная новизна. Разработаны методы и технология построения цифровых программируемых инфокоммуникационных систем, в том числе:
1. Предложена концепция и теоретические основы цифровой программируемой технологии построения инфокоммуникационных систем, введено понятие цифрового информационного объекта, позволяющее рассматривать канал, контейнер, контент как независимые компоненты инфокоммуникации.
2. Сформулирован контейнерный принцип формирования битового потока, инвариантного к свойствам физического канала, для систем передачи цифровых данных.
3. Предложен принцип сепарации цифрового контента на транспортный поток и порождающую программу, позволяющий осуществлять адаптацию контента под требования каналов при его передаче.
4. Введено понятие гибридного кодека как реконфигурируемого элемента в рамках технологии программируемых инфокоммуникационных систем, предложена методология построения гибридных кодеков с заданными параметрами для компрессии видеоданных.
5. Предложена архитектура и сформулированы базовые свойства цифрового программируемого коммуникационного канала с процессорными элементами, отличающегося наличием в своем составе конфигурируемых гибридных кодеков.
6. Предложен метод и техническое решение оптимизации энергетических и информационных характеристик для различного вида информационного контента.
7. Разработаны алгоритм и программа для компрессии видеоданных, отличающиеся использованием унифицированного пространственно-временного (30) представления последовательности кадров.
8. На основе цифровой программируемой технологии предложена архитектура коммуникационного канала, разработана и реализована универсальная коммуникационная платформа на базе программируемой
логической интегральной схемы (ПЛИС) с ориентацией на семантику передаваемых данных.
Обоснованность научных положений и выводов обеспечена за счет анализа состояния исследований в данной области, а также согласованностью теоретических выводов с результатами экспериментальной проверки моделей. Новизна технических предложений подтверждается их востребованностью при проведении научно-исследовательских работ, относящихся к цифровому телевидению и организации каналов связи с дистанционно контролируемыми автономными объектами.
Положения, выносимые на защиту. На основе проведенных теоретических работ и их экспериментальной апробации на защиту выносятся следующие положения:
1. Концепция и теоретические основы цифровой программируемой технологии построения инфокоммуникациоиных систем.
2. Архитектура цифрового программируемого коммуникационного канала.
3. Методологический подход построения гибридных кодеков с заданными параметрами для компрессии видеоданных.
4. Техническое решение для оптимизации энергетических и информационных характеристик цифровых инфокоммуникациоиных систем.
5. Совокупность алгоритмов и программ для компрессии видеоданных с использованием их представления в виде ЗВ-прострапства, которая унифицирует анализ и обработку пространственных и временных параметров видеопоследовательности.
6. Программно-аппаратные и технологические решения универсальной коммуникационной платформы на базе ПЛИС с ориентацией на семантику передаваемых данных.
Практическая ценность работы заключается в создании методологии разработки гибридных кодеков для сжатия видеоданных под заданные условия и ограничения. При этом становится возможным производить предварительную оценку потенциальных возможностей компрессии на основании требований технического задания.
Разработанная коммуникационная платформа может использоваться для организации каналов связи с компрессией для передачи видеоданных с различными характеристиками (стандартное телевизионное разрешение, телевизионное изображение высокой четкости, малокадровое и техническое телевидение). В платформе заложена возможность создания кодеков с управляемой скоростью передачи данных (variable bitrate), введением кодов коррекции ошибок, функций шифрования, управления интерфейсом радиоканала и другими распространенными коммуникационными функциями.
Реализация результатов работы. Разработанные методы, программное обеспечение, а также технические решения были использованы в ходе выполнения проектов ОИТВС РАН «Новые физические и структурные решения
в инфотелекоммуникациях», проектов СПбНЦ РАН, 2006-2010, ОНИТ РАН «Фундаментальные проблемы разработки новых структурных решений и элементной базы в телекоммуникационных системах», и внедрены в организациях ОАО "11ПП "Радар ММС", ОАО "Московский вертолетный завод им. М. Л. Миля", ФГУП «ГосНИИПП», СПб ГУП «Санкт-Петербургский информационно-аналитический центр», а также в рамках учебного курса на кафедре распределенных интеллектуальных систем Санкт-Петербургского государственного политехнического университета.
Апробация результатов работы. Результаты диссертационного исследования представлялись на Международных конференциях «Distributed Intelligent Systems and Technologies Workshop», St. Petersburg, 2008, 2009; The 6th International Conference on Education and Information Systems, Technologies and Applications: E1STA, Orlando, Florida, USA, 2008; 10th International Conference on «Pattern recognition and image analysis: New information technologies» (PR1A-2010); на конференции «Перспективные системы и задачи управления» - Домбай, 2009, 20J0; конференции «Экстремальная робототехника» (Москва, 2010); конференции «Информационные технологии и системы» (ИТиС'08); на Санкт-Петербургской международной конференции «Региональная информатика - 2008», международной научной конференции «Инфокоммуникационные и вычислительные технологии в науке, технике и образовании», Ташкент, 2004; международных конференциях и в Российской научной школе «Системные проблемы надежности, качества, информационных и электронных технологий» (ИННОВАТИКА-2004, ИННОВАТИКА-2005, ИННОВАТИКА-2007, ИШЮВАТИКА-2008); конференции «Современные проблемы социально-экономического развития информационных технологий», Баку, 2004; межрегиональной конференции «Информационная безопасность регионов России» (ИРБР-2003, Санкт-Петербург, 2003); конференции «Человеческий фактор в авиации и космонавтике» - Москва-Ярополец, 2007; 6-ой Научной конференции «Управление и информационные технологии» (УИТ-2010, Санкт-Петербург, 2010).
Публикации. По материалам диссертации опубликованы 51 печатная работа, включая 16 публикаций в ведущих научных журналах, рекомендованных ВАК, 1 монография и 1 учебно-методическое пособие.
Структура и объем диссертационной работы. Диссертация содержит введение, семь глав, заключение, список литературы (181 наименование), 4 приложения. Основной материал изложен на 240 стр., включая 4 таблицы, 102 рисунка.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована важность и актуальность темы диссертации, сформулированы цель работы и основные задачи, которые необходимо решить для ее достижения, характеризуется научная новизна и практическая ценность работы, кратко излагаются основные результаты работы. Отмечены факторы,
определяющие важность проблемы построения энергоэффективных цифровых программируемых систем инфокоммуникации.
В первой главе проведен анализ проблем, существующих при осуществлении инфокоммуникации, произведено сравнение подходов к построению систем связи, даны основные положения цифровой программируемой технологии построения систем инфокоммуникации.
Существующая мировая тенденция увеличения потребности в пропускной способности каналов связи при одновременном снижении стоимости передачи данных приводит к тому, что возможности традиционных телекоммуникационных средств приближаются к пределу их физических возможностей.
Вместе с этим появляются технологические возможности с одной стороны использовать для задач связи недоступный ранее широкий диапазон: от радиочастотной области до ультрафиолета, включая световую и микроволновую зоны, а с другой стороны появляются новые виды источников данных (сенсоров), способных фиксировать физические параметры объектов в сверхшироком спектре. Очевидным становится тот факт, что широкополосные сигналы с таких сенсоров уже невозможно передать с использованием традиционных средств связи.
Выходом из сложившейся ситуации стало развитие наноэлектроники, которое привело к появлению нового класса быстродействующих цифровых микросхем, качественно изменивших возможности коммуникации путем модификации передаваемых данных.
При таком качественно новом подходе становится возможным разделить сущности, находившиеся ранее в жесткой взаимосвязи: контент (содержание), контейнер и канал (транспорт).
При этом программируемая технология, отделяя контент (то, что должно передаваться потребителю для принятия решения) от носителя (собственно спектральной характеристики электромагнитного излучения) способна смещать контент в комфортную для потребителя зону восприятия, например из ультрафиолетовой области в видимую область, визуализируя его. При этом транспортировка контента возможна в любой физической среде и в любой области электромагнитного диапазона.
Контент размещается в контейнере, обеспечивающем требуемые параметры инфокоммуникации и формальную совместимость форматов при передаче по виртуальным каналам связи. В ряде известных систем контент перед передачей по каналу может быть последовательно размещен в 5-10 иерархически вложенных контейнерах, которые обеспечивают безопасность, надежность, скрытность передачи.
Программируемый канал передачи данных является реконфигурируемой средой, способной адаптироваться к реальным требованиям физической среды и обеспечивать унификацию интерфейсов взаимодействия с коммуникационной средой.
В рамках программируемой технологии основные характеристики инфокоммуникашш (информационная защита, помехоустойчиовсть и энергозатраты) оптимально распределяются на 3 независимых (некореллируемых) компонента - канал, контейнер, контент - и могут в рамках каждого компонента выборочно изменяться в соответствии с поставленной задачей, обеспечивая общий набор заданных параметров.
При этом особенности контента только накладывают ряд требований на канал связи, но не делают принципиально невозможным сам факт передачи, как это было в аналоговых системах. При традиционной аналоговой коммуникации в случае, когда передаваемый сигнал по полосе частот не мог быть передан по некоторому каналу связи, требовалось заменять канал связи.
Специалистам по передаче данных хорошо известна взаимосвязь между расстоянием, на которое производится передача данных, максимальной скоростью и надежностью (количества ошибок при передаче). Реальная система не может обладать максимальными значениями одновременно по всем параметрам, а точка, соответствующая ее параметрам должна лежать внутри отмеченной области (рисунок 1).
Рисунок 1. Связь параметров физической среды передачи данных.
Программируемая технология и контейнерный принцип дают возможность использовать существующий «неподходящий канал». Для этого требуется сформировать контейнер с такой пространственно-временной конфигурацией, которая обеспечит передачу данных с заданными свойствами (рисунок 2), и разместить в нем контент. При этом происходит обмен критического параметра (например, пропускной способности) на некритический (например, время).
о л 6 ъ е м
Пропускная способность
Канал
Время
Время
Контейнер
Пропускная способность Контейнер
КОНТЕНТ' КОНТЕНТ
КОНТЕНТ!!КОНТЕНТI I I
Время
Время
Рисунок 2. Иллюстрация принципа изменения конфигурации контейнера для передачи данных по «неподходящему каналу»: а) объем данных в единицу
времени превышает пропускную способность канала, б) применение контейнера требуемой конфигурации позволяет передать данные по каналу.
Следует отметить, что в диссертационной работе рассматриваются такие цифровые программируемые каналы, в которых уровень помех не влияет на передачу цифровых данных или используются дополнительные средства для коррекции ошибок.
Предлагаемая диссертационная работа является междисциплинарным исследованием в связи с тем, что для обеспечения полноты разрабатываемых теоретических положений и практических реализаций потребовалось объединить знания из ряда областей: методы обработки цифровых данных, психофизиологические особенности восприятия, свойства сенсоров и устройств для отображения контента, адаптационные возможности каналов передачи данных и ряд других.
Во второй главе приводится изложение теоретических основ цифровых программируемых каналов (ЦПК) передачи данных, оценка предельных характеристик и ограничений ЦПК, необходимых для описания механизмов энергоинформационной оптимизации передаваемого контента и контейнерного принципа функционирования. ЦПК - программируемый канал передачи данных - сущность, объединяющая программные и аппаратные компоненты, для осуществления передачи данных в рамках задачи инфокоммуникации. Программируемый каншт является реконфигурируемой средой, способной адаптироваться к реальным требованиям физической среды и обеспечивать
унификацию интерфейсов взаимодействия. Программируемый канал может включать процессорные элементы, буферную память, модули трансформации контента.
Введена следующая классификация цифровых программируемых каналов передачи данных:
1) Унарный ЦПК - канал, не требующий идентификации типа потока. Является самым простым видом канала «точка-точка», в котором потребитель непосредственно получает данные одного типа от передатчика.
2) Мультиплексированный ЦПК - канал, допускающий передачу нескольких типов контента в контейнере, разделяемых через маркер (ID пакета) или алгоритмически.
3) Универсальный ЦПК - канал, который в общем случае соединяет множество потребителей с множеством источников и допускает несколько типов контента. Требует введения специальных полей в потоке для адресации и идентификации типа данных. Типичным примером являются ТСР/1Р-сети.
Введем следующие обозначения:
X, Y - битовая последовательность источника (X) и приемника (Y);
Sv, Sr - скорость потока источника и приемника (бит/с);
Lx , Lr - длина битовой последовательности источника и приемника
(бит);
S(t) - величина динамической скорости потока в момент времени I (бит/с);
В случае однократной передачи сообщения будем считать 0 < SY < , т.е. скорость потока источника Sx ограничена сверху физическими возможностями источника (скоростью считывания
Под источником будем понимать устройство или программу, формирующие битовый поток данных (bit stream), имеющие заданные ограничения на возможность управления скоростью этого потока.
В случае необходимости передачи сообщения в реальном времени (периодической) существуют следующие ограничения Sma <SX < . При этом значение - ограничение, накладываемое особенностями
передаваемого контента. Так, например, при передаче видеоданных скорость потока является заданной стандартом видео Sr =Saia = Sm.
Из определения цифровой иифокоммуникации следует, что передаваемые данные должны быть приняты неизменными, то есть X = У => Lx = Lr, что позволяет записать следующее ограничение на параметры цифрового программируемого канала связи:
Ст> Ls,
где С - пропускная способность цифрового канала, г - время передачи.
Из этого соотношения можно оценить необходимую минимальную пропускную способность для сообщения X при заданном времени передачи г
или минимальное время передачи при заданной пропускной способности канала С.
Основное свойство цифрового канала передачи данных - возможность обмена времени передачи на скорость канала и наоборот:
£5(0 Ы<Стс
г
где А1 = — - дискретный временной отрезок, на котором значение 5 постоянно.
Из основного свойства ЦГ1К следует возможность передачи потока данных, скорость которого в некоторые моменты времени может превышать пропускную способность канала:
5(0 > С.
Учитывая постулат А. Н. Колмогорова о существовании программы р для представления битовой последовательности X, причем Цр)йЬх (в худшем случае последовательность X будет представлена в виде программы вывода самой себя, что даст увеличение ее объема на величину 5 ) получим соотношение:
с
Д< 1 *
В случае однократной передачи за время ы должно выполняться— < С.
Sx
Lx
Sy (=>
Ly
приемник
Рисунок 3. Иллюстрация ограничений пропускной способности каналов.
Приведенные соотношения на ограничения пропускной способности каналов можно представить графически (рисунок 3). В центральной части рисунка в графическом виде показана утилизация (степень использования) S(t)
канала —^—. С
Основными ключевыми особенностями ЦПК с буферной памятью и процессорными элементами являются:
1) Использование при преобразовании (кодировании, сжатии) точных параметров данных, находящихся в буферной памяти (репертуар используемых
значений, ранговые распределения и т.д.) в отличие от априорных знаний о статистических параметрах источника, используемых в классическом подходе. Это дает возможность настройки параметров программы кодирования для использования наиболее эффективного преобразования. Такой подход эмпирически использован в некоторых алгоритмах программ архивации со сжатием (программный продукт RAR), который при первом проходе формирует служебные таблицы, используя которые при втором проходе осуществляет собст венно компрессию данных.
2) Возможность создания программы-генератора заданной последовательности на основе формализма терминальных программ (раздел 3.3) или иного порождающего механизма согласно постулату А. 11. Колмогорова о существовании программы, порождающей заданные данные.
3) Возможность семантического анализа имеющихся в буфере данных. Это в случае передачи аудио-, видеоданных, текстов позволяет использовать ограничения на параметры восприятия, что дает возможность резко сократить объем данных за счет сокращения репертуара состояний семантического макроуровня (узкая полоса частот на некотором временном интервале для звука, черно-белая картинка на некотором временном интервале для изображения, особенности цветовой гаммы для изображения и др.)
4) Возможность реализации одновременно нескольких методов преобразования (кодирования, сжатия) данных и выбор лучшего по заданному критическому параметру (степень сжатия, скорость обработки и др.) Такой подход эмпирически используется в ряде форматов сжатия видеоданных (программный продукт Xvid).
Среди перечисленных качественных отличий, свойство в п. 1. предлагает экстенсивный путь развития существующих систем и алгоритмов, корректируя их параметры в режиме реального времени для достижения более высоких результатов, в то время как использование свойств, рассмотренных в пп. 2-3 вызывают смену ряда представлений о существующих методах передачи данных.
Далее рассмотрен гибридный кодек в качестве реализации обобщенного процессорного элемента с буферной памятью.
Гибридным кодеком (кодером/декодером) назван блок преобразования данных, оптимизирующий некоторую характеристику передаваемых по каналу данных, причем такой блок построен из последовательности унифицированных элементов, каждый из которых реализует определенный этап обработки (рисунок 4).
М, М2 М3 Мк
Рисунок 4. Структура гибридного кодека.
Пусть М,.М2,-,МК - функциональные классы модулей, где К - общее число этапов обработки.
В рамках гибридного кодека требуется выполнение следующих условий согласования интерфейсов для функциональных классов модулей:
/"(Л/™') = \ <1< к, гдеР\Х"') и Г (Xя") - формат входного и
выходного интерфейса элемента X соответственно,
/""(А/,'") = /-"(«тоо/-) - условие согласованности интерфейса первого
модуля и интерфейса сенсора, где Р(хетог) - формат данных,
определяемый спецификацией источника данных (сенсором),
Г(МI") = Г{с1гаппе1) - условие согласованности интерфейса
последнего модуля и интерфейса канала, где Р(сИаппе1) - формат
данных, определяемый спецификацией канала.
Пусть имеются реализации методов для каждого класса методов т11 е А/, . Специально вводится пустой метод о=°, не производящий никаких действий, кроме обеспечения согласования интерфейсов предыдущего и последующего модулей/7(М™') = /ХМ",).
Конфигурацией кодека назван упорядоченный набор С '.= (тх,т2,...,тк), где 'и, - конкретная реализация метода из класса М1. Сформулированы следующие постулаты:
1) Существует возможность построить кодек по гибридной структуре:
С*0.
2) Существует конфигурация модулей кодека, дающая уменьшение объема битового представления.
Рекомендуемой к практическому использованию для построения гибридных кодеков, является частичная унификация в рамках функционального класса модулей. Классы модулей определяются в соответствии с этапами преобразования данных в кодеке (рисунок 5). Такой подход обоснован тем, что обеспечивается универсальность без повышения накладных расходов.
V
емгм щття па
иэзхфшаши ютг«гга фшетгсквё кымл
Рисунок 5. Функциональные классы модулей в кодеке.
Разделение источника, конвертора, логического и физического уровней канала передачи данных, приведенные на рисунке 5, предполагает некоторую степень унификации менаду блоками для возможности построения
коммуникационного канала под определенный тип данных для конкретной задачи.
Приведенное на рисунке 6 схематичное изображение изменяемого множества соединений функциональных блоков с учетом их входных и выходных интерфейсов дает понимание реконфигурируемой среды.
L out_M
Рисунок 6. К понятию согласованности интерфейсов в реконфигурируемой
среде.
Условие согласования форматов и интерфейсов для работоспособной конфигурации
F<Jnk) = F(OutlA),
где F(X) - формат интерфейса X, а символ эквивалентности обозначает согласованность входного интерфейса с выходным интерфейсом предыдущего этапа обработки.
В третьей главе рассматриваются подходы к оценке сложности цифрового информационного объекта, представленного в виде битовой последовательности. В классической теории цифровой коммуникации объектом для оценки сложности является непосредственно передаваемая битовая последовательность, в предположении, что она является носителем контента. Такое предположение основано на том, что эта битовая последовательность полностью содержит контент внутри себя и обладает теми же свойствами. На основании этого предположения построен ряд методов оценки сложности: оценка по К. Шеннону, В. И. Арнольду и ряд других.
В рамках программируемой технологии вопрос от непосредственной оценки сложности переходит в область взаимного перераспределения исходного контента по двум компонентам (передаваемый битовый поток и программа восстановления контента из битового потока).
На практике существует множество примеров, показывающих актуальность такого подхода, например изображение, созданное и сохраненное в формате Adobe Flash, может занимать битовый объем в 10 раз меньший, чем требуется для сохранения этого изображения в растровом виде (пиксельном представлении). Существование такого различия между битовым объемом контента, представленного в разных форматах, определяется существованием в изображении закономерностей, отличающихся от вероятностной модели сигнала.
На основе отдельных положений алгоритмической теории А. Н. Колмогорова сформулировано понятие AIC (Algorithmic Information Content, Колмогоровская сложность) в соответствии с современными возможностями компьютерных технологий.
Объектная (персонально идентифицируемая) оценка информации определяется через условную энтропию Н(х\у) как минимальную длину записанной в виде последовательности нулей и единиц «программы» Р, которая позволяет построить объект х, имея в своем распоряжении объект у:
H (*!.v) = min/(P), А(Р,у) = х.
В качестве конструктивного метода оценки AIC в работе предлагается формализм терминальных программ. Терминальная программа формирует выходной результат - битовую последовательность. Таким образом, терминальная программа является вырожденной программой без входных данных.
Терминальная программа является самодостаточной, то есть ей не требуется ничего, кроме исполнителя (процессора), работающего в некотором формализме.
Для построения терминальных программ введено следующее формальное представление:
Оператор OUT х - вывод символа .г. Оператор С(а,й)- повтор следующих а операторов Ь раз. Каждый из операторов является единичным символом в алфавите Р. Данный формальный язык является лишь одним из возможных и показывает особенности программируемой технологии инфокоммуникаций.
Классическая теория об энтропийном кодировании, учитывающая статистические характеристики и на которой построены методы компрессии (алгоритмы Хаффмана, LZW и др.), утверждает, что ЦР) должна быть неубывающей функцией при увеличении m (т.е. она не может быть сложнее «сложной» или проще «простой»).
Приведем пример простой битовой последовательности, чтобы наглядно представить зависимость длины ее терминальной программы от количества элементов для оценки структурной сложности без строгих математических доказательств.
Рассмотрена последовательность S следующего вида: Sl0 = АВВВВАВВВВ
Терминальная программа ее представления (кодирования) Р выглядит следующим образом: С(3,2) OUT А С(1.4) OUTB mm/(P) = 4.
Для Si)=ABBBBABBB терминальная программа Р выглядит следующим образом:
OUT А С(1,4) OUT В OUT А С(!,3) OUT В min/{P) = 6.
На рисунке 7 приведена зависимость кратчайшей длины программы от длины входной последовательности S.
TP:
CîXii Our A
OUÏ A qi,4i
Î.H,4i 0U[ S
m i a oui a
filin !!?H c(l,3i
OUT S mmliPl-o
С ÏX уз - Л06Т0Р СЛедуЛКЦИ* X Й1( р^яй y p<u OUT x ~ BwiKi« анячения x в гютое
после азвагелилст!
Рисунок 7. К понятию сложности данных: терминальные программы
Приведенный пример, показывающий немонотонность Колмогоровской сложности, говорит о том, что количество информации по К. Шеннону не является критерием оценки сложности битовых последовательностей при кодировании и декодировании информационного содержания. В качестве более адекватной меры сложности в рамках программируемой технологии построения систем инфокоммуникации предлагается использовать Колмогоровскую сложность.
В работе обращается внимание на принципиальное различие между ансамблевой энтропией по Шеннону и определением сложности (длины программы) по Колмогорову. Эти два понятия формализуют информационное содержание контента в цифровом информационном объекте. Концептуальным различием между этими характеристиками является то, что энтропия по Шеннону является интегральной (ансамблевой) оценкой битовой последовательности, т.е. ее статистикой, усредняемой по множеству (теорема об эргодичности), а сложность по Колмогорову как идентификация конкретного информационного объекта. Как пример - датчик псевдослучайных чисел, реализованный в виде программы порождения псевдослучайной последовательности. Хорошие датчики обладают очень большой энтропией по
Шеннону (именно за это их и считают хорошими), однако весьма небольшой Колмогоровской сложностью.
В четвертой главе рассматриваются методы разработки гибридных кодеков (кодеров/декодеров), преобразующих битовый поток с целью обеспечения некоторого критического параметра (объема потока, заданной скорости потока). Гибридный кодек - кодер/декодер, построенный по модульной схеме из взаимозаменяемых блоков, причем конкретное сочетание блоков оптимизировано под конкретную целевую задачу.
Семантически ориентированным будем называть кодек, учитывающий физиологические и психологические особенности восприятия человека с целью обеспечения энергоинформационно-эффективной передачи контента.
Принципиальной особенностью цифровых каналов связи, использующих компрессию с потерями, является передача приблизительной копии исходного содержимого, что связано с уменьшением объема передаваемых данных.
Зрительная система человека является оконечным устройством, воспринимающим видеоданные. С целью рационального построения систем передачи видеоданных рассматриваются свойства человеческого зрения, особо отмечая его пространственные и временные характеристики.
Разрешающая способность зрительного аппарата зависит от яркости и цвета фона, контрастности деталей относительно фона, времени наблюдения. Известно, что для нормального зрения усредненное значение 6min может быть принято равным одной угловой минуте (8mi„ ~ Г). Острота зрения оценивается величиной, обратной разрешающей способности, т.е. S„= 8min''. Острота зрения равна единице, если 5min = I'.
Частота, при которой глаз перестает воспринимать мелькания яркости, называется критической частотой мельканий fKp. Для яркости современных экранов мониторов, равной примерно 100...200 кд/м2, fK(,=45...48 Гц.
При заданном контрасте глазом воспринимается определенное количество градаций яркости, в среднем равное ш=92.
Для возможности эффективного использования методов компрессии требуется определить основные пространственно-временные характеристики видеоданных.
Определим видеопоток как последовательность изображений или их фрагментов, сменяющих или уточняющих друг друга по некоторому закону через заданные промежутки времени, представленную в виде, пригодном для транспортировки, сохранения или просмотра.
Особенностью видеоданных, по сравнению с набором не связанных между собой изображений, является наличие корреляционной зависимости между соседними кадрами. Такая зависимость является причиной избыточности в представлении видеопотока как последовательности отдельных изображений, причем избыточность между соседними кадрами (inter-frame) обычно многократно превышает избыточность представления внутри кадров (intra-frame).
Для детального анализа особенностей видеопотока и выявления в нем типовых закономерностей воспользуемся следующим представлением:
№,/.=1 с = 1,2,.... »V: 1 = 1,2, ...,Ы г- = 12,.... 1)
где (-' - просгранственная матрица видеогюгока, - ширина кадра, Л -высота кадра, / - количество кадров.
Выполняя сечения ориентации / , получаем набор двумерных матриц размера /х/, каждой из которых соответствует свое изображение (рисунок 8).
Рисунок 8. К понятию темпоральных кривых.
Анализ полученных изображений (временных сечений) позволяет выявить ярко выраженные кривые, образованные неизменными пикселами в последовательных кадрах (темпоральные кривые).
Длина темпоральных кривых зависит от типа контента в видеопотоке, так для систем видеонаблюдения (на которых подавляющая часть кадра остается неподвижной) характерны длины темпоральных кривых до нескольких минут (десятки тысяч кадров). В данном случае обрыв темпоральных кривых обуславливается щумом, изменением освещенности или движением мелких объектов (листва деревьев, трава и т.д.). В более распространенных типах контента (фильмы, телевидение) длима темпоральных кривых в основном определяется сменой сюжета и резким движением объектов.
Для оценки средней длины темпоральных кривых и,, на реальных видеоданных был реализован следующий алгоритм:
, И,если !(' . -У. . .,,'<£ , .......
иначе О
В таблице 1 приведены характерные значения для основных типов видеоконтента для е = 1 ___Таблица 1
Тип видеоконтента Средняя длина темпоральных кривых (количество кадров)
Музыкальные клипы 10-20
Фильмы, динамичные сцены 6-8
Фильмы, медленные сцены 8-14
Системы видеонаблюдения >10000
В пятой главе рассматриваются несколько конкретных методов и алгоритмов построения кодеков для ряда практических применений на базе общей схемы алгоритма компрессии (рисунок 9).
Пред- Дискре- Трансляция » Кванто- > Развертка Вторичное
обработка тизация вание сжатие
Рисунок 9. Общая схема алгоритма компрессии с потерями для цифрового информационного объекта.
Для задачи компрессии видеоданных (кодек БТУС) разработан способ представления ЗБ-видеоданных в виде дискретного трехмерного пространства (видеокуба). Подавляющее большинство существующих цифровых видеокодеков основаны на принципах передачи только изменяющихся (движущихся) фрагментов изображения в предположении, что большая часть кадра неподвижна. В случае, когда изображение изменяется постоянно, такое сжатие оказывается неэффективным и приводит к потере информации и увеличению объема данных.
Предлагаемый подход отличается от известных альтернативных подходов и заключается в использовании пространственных и временных корреляций в видеопотоке.
Представим пространственную матрицу видеопотока V в виде видеокуба. На рисунке 10 схематически представлено сравнение способов традиционного представления видеоданных в форме последовательности кадров и в форме видеокуба.
Рисунок 10. Представление видеоданных в виде последовательности кадров и в виде видеокуба.
Представление видеоданных в форме трехмерного пространства -видеокуба позволяет сохранять локальные особенности как в пределах одного кадра, так и между кадрами. Это дает возможность сжатия видеоданных не только за счет избыточности в пределах одного кадра, но и между кадрами.
Компрессия и декомпрессия производятся по схемам, приведенным на рисунках 11 и 12.
RGB в YUV
Дискретизация
3D
* дкп *
Квантование
3D в RLE
> ID » *
Вторичное сжатие
Рисунок 11. Общая схема алгоритма компрессии STVC.
Декомпрессия (вторичная)
RLE
ID в 3D
Декванго-вание
ооратное ДКП
Восстан овление
YUV в RGB
Рисунок 12. Общая схема алгоритма декомпрессии STVC.
На этапе преобразования из RGB в YCbCr осуществляется перевод изображения из цветового просгранства RGB с компонентами, отвечающими за красную (Red), зеленую (Green) и синюю (Blue) составляющие цвета точки, в цветовое пространство YCrCb (вариант YUV), в котором Y - яркостная составляющая, а Cr, СЬ - компоненты, отвечающие за цвег (хроматический красный и хроматический синий).
В связи с тем, что человеческий глаз менее чувствителен к изменениям цвета, чем к изменениям яркости, имеется возможность компрессировать данные для Cr и СЬ компонент с большими потерями и, соответственно, большей степенью сжатия (на практике в 4-8 раз).
На этапе дискретизации (рисунок 13) производится разбиение исходного дискретного параллелепипеда на элементы видеокуба - кубы /V х Л' х ,v, где N обычно равно 8 (эмпирическое значение). Из каждого элемента формируется три рабочие матрицы по 8 бит отдельно для каждой компоненты для дальнейшего преобразования.
KVÖ 8x8x8
iF
Рисунок 13. Этап дискретизации 3 D-пространства.
Для повышения степени компрессии может использоваться только часть данных о цветовых компонентах изображения. В этом случае данные компонента У используются полностью, а для компонентов Сг и СЬ матрицы набираются через строчку и через столбец. В этом случае из исходного элемента видеокуба размером 16x16x16 пикселов формируется только одна рабочая матрица.
С целью обеспечения высокой степени компрессии исходных видеоданных требуется, с помощью некоторого преобразования, сформировать структуру данных, которая будет эффективно сжата алгоритмом вторичной компрессии.
Одним из таких преобразований является перевод данных в спектральную область с помощью дискретного косинусного преобразования (ДКП) по 3 координатам. При этом низкочастотные и высокочастотные компоненты изображения расположены в противоположных участках элемента видеокуба. В большинстве реальных изображений преобладают низкочастотные компоненты, что позволяет учитывать психофизиологическую особенность зрения для уменьшения точности представления высокочастотных компонент матрицы на этане квантования без существенного ухудшения качества восприятия.
Преобразование ДКП производится согласно выражению:
(=О/=(Н=0 ¿М 11
1/у[м,1=0
\j2/M,l<t<M-] где k ,
М, N, Р - размеры фрагмента видеокуба,
5 - матрица исходных значений (данные после этапа дискретизации), D - матрица результирующих значений (передается на следующий этап), В случае дискретизации видеокуба на элементы 8x8x8 значения M=N = P = 8.
На этапе квантования полученные после ДКП данные квантуются согласно выражению:
S(x,y,t)
4
й(х,у,1) =
где 5 - матрица после ДКП,
£> - результат квантования,
9 — значение параметра квантования.
Этап квантование кроме обеспечения высокой степени компрессии является основной причиной потери качества. Квантование позволяет представить данные с минимальной точностью, которая обеспечивает требуемый уровень качества изображения.
Для высокочастотных составляющих используются большие значения q, чем для низкочастотных. Таблица значений ц определяется эмпирически и может быть как статической (заданной в алгоритме), так и динамической (передается в потоке видеоданных).
При декомпрессии алгоритм деквантования устраняет эффекты квантования. Процесс деквантования определяется согласно выражению:
0(х,у,!) = д5(х,у,1).
На этапе отображения элементов видеокуба в вектор происходит формирование битового потока данных, подлежащих последующему вторичному сжатию.
С целью эффективного применения алгоритмов вторичного сжатия требуется организовать формирование длинных последовательностей нулевых значений в потоке. Для формирования данных в такой форме используется
алгоритм трехмерной «зиг-заг развертки». Применение такой развертки позволяет в начале полученной последовательности получить коэффициенты элемента видеокуба, соответствующие низким частотам, а в конце -высокочастотные составляющие, которые после этапа квантования имеют близкие к нулю или нулевые значения. На рисунке 14 показан вид кривой, последовательно проходящей через элементы видеокуба размером 8x8x8 при зиг-заг сканировании.
Рис. 14. Вид сканирующей кривой (а - начальный и конечный участки сканирующей кривой, b - общий вид сканирующей кривой).
Предварительным этапом вторичного сжатия является RLE кодирование. Алгоритм RLE (Run-Length Encoding) осуществляет групповое кодирование длинных последовательностей нулей. При этом формируются пары вида <S,V>, где S является счетчиком пропускаемых нулей, а V - значение, которое необходимо поставить в следующую ячейку. Так, последовательность 42 3 0 0 0 -2 0 0 0 0 1 ... будет свернута в пары (0,42) (0,3) (3,-2) (4,1)....
В качестве заключительного этапа вторичного сжатия может быть использован один из методов энтропийного сжатия, например, арифметическое сжатие или сжатие Хаффмана. Эти алгоритмы компрессии позволяют уменьшать среднюю длину кодового слова для символов алфавита.
В модифицированной версии кодека для передачи видеоданных (кодек HTVC) на втором этапе используется пирамидально-иерархическое представление.
Следующим примером реализации кодера/декодера является кодек, ориентированный на представление реальных трехмерных сцен для объемного телевидения (True3D Vision). Для передачи объемных данных используют понятие «воксел» - элемент объемного изображения, содержащий значение элемента регулярной сети в трёхмерном пространстве, аналогично пикселю в двухмерном пространстве. Вокселыше представления часто используются для визуализации и анализа медицинской, научной и технической информации. По аналогии с пикселами, положение воксела определяется его позицией при заданном методе сканирования пространства (то есть задаются их положением в структуре данных). Недостатком таких представлений является большой объем передаваемых данных.
Развивая идею, предложенную для трехмерных данных на четырехмерный случай, можно получить способ представления изменяющихся во времени трехмерных данных (рисунок 15).
а
b
ъ
/
\
X
Рисунок 15. Представление данных в виде последовательности изменяющихся трехмерных пространств
В случае, когда каждому вокселу сопоставлено несколько числовых значений (вектор данных), обработка производится отдельно и независимо для каждого воксельного пространства, например, в случае использования цветового пространства УиУ для стереотелевидения.
В качестве заключительного примера в главе 5 рассматривается применение методов компрессии данных в медицине для представления томографических данных.
Одним из наиболее распространенных видов томографических данных являются данные компьютерной томографии, полученные в результате исследований, проводимых на рентгеновском томографе. В типичном случае такие данные представляют собой набор томограмм (слоев) общим числом до нескольких сотен, при этом каждая томограмма является полутоновым изображением, целочисленные значения яркости которого соответствуют относительным плотностям тканей в плоскости сканирования (в единицах Хаунсфилда).
Здесь следует заметить, что для медицинских исследований требуется сохранение локальных особенностей данных. Обработка многомерных данных в виде плоскостного послойного сканирования массивов не обеспечивает трехмерной связности (не обеспечивается изотропия данных по направлениям). Соответственно, потенциально более эффективными являются методы, основанные на сохранении локальных особенностей данных (обеспечивающие трехмерную связность данных).
Предлагаемый метод компрессии имеет структуру, сходную с БТУС, и основан на разбиении трехмерного (ЗБ) пространства томографических данных (объединенной последовательности срезов) на элементы Л'хЛ'х /V точек, каждый из которых компрессируется независимо.
Этап квантования повышает степень компрессии в случае, если задача допускает сжатие с потерями (которое в случае томографических данных проявляется как появление дополнительных артефактов на изображении).
Квантование позволяет представить данные с минимальной точностью, которая обеспечивает требуемый уровень качества изображения.
Предложенный подход построения систем инфокоммуникации может быть также применен к задаче обработке текстовых данных. Метод автоматического реферирования текстовых данных основан на построении графа семантического окружения текста (этап нормализации), семантической редукции семантического окружения и обратное преобразование понятийного окружения в текст. При этом формируется сжатое изложение исходного текста.
Текстовые данные определяются как синтаксически связанная упорядоченная последовательность идентификаторов, являющихся словами \у. Текст состоит из синтаксически выделенных конструкций (предложений), разделенных символом конца предложения (символы множества Т^={".'\ "?", "!"}). Множество слов {\\'ь\у2,... ) синтаксически связанных друг с другом (находящимся в одном естественно-языковом предложении, заканчивающимся символом из множества Тс) является предложением Б, \уе{\У}с{со}, где и-слово, \У-множество слов в тексте, ш-множество допустимых слов в языке.
Перед началом выполнения семантической компрессии текста производится морфологическая предобработка т(\у)=Ь при которой каждое слово \у заменяется на слово Ь, являющейся нормальной формой слова Вся дальнейшая обработка производится над идентификаторами слов Ь. Для слов строится отношение К2 по следующему правилу:
V е Я & У\у:б8 => \у2) € К2 Для отношения Я2 строится рейтинговое распределение ¡^ связей элементов.
Этап семантической редукции основан на удалении связей терминов, для которых \\2) < е2, где е2 - значение порога семантического критерия. В
случае > е2 слова и \у2 считаются семантически связанными, и
соответствующая связь добавляется в семантическое окружение обрабатываемого текста.
После обработки текста производится построение множества Я^:
Ск2(\\'ь \У2) > е2 => (\уь \У2) е Параметр е2 может изменяться пользователем для управления степенью компрессии текста при реферировании.
После этого, в исходном тексте оставляются только предложения 5, удовлетворяющие следующему условию:
е 5 & \у2 е Я & (\\ ь \\'2) е Описанный метод позволяет выбрать из текста предложение (или набор предложений), наиболее полно отражающее содержимое текста, т.е. предложение (предложения), содержащее максимальное количество словесных пар (связей), имевших наибольшую частоту использования в тексте. При этом значение частоты является параметром компрессии получаемого реферата. Экспериментальная проверка показала эффективность метода реферирования для технических текстов и информационных текстов типа новостей. Для художественных текстов метод, как правило, не дает приемлемого решения.
Программная реализация автоматического реферирования апробнрована в качестве онлайн-сервиса в сегги Интернет.
В шестой главе рассматривается реализация реконфигурируемой коммуникационной платформы для передачи видеоданных.
При решении задачи организации связи с мобильными объектами требуется организовать канал, обладающий заданными свойствами и при заданных ограничениях на скорость потока передавать несколько потоков разнотипных цифровых данных (аудио, видео, телеметрии, управления).
С другой стороны часто имеется реализованный цифровой канал или устройство хранения данных (например, SD-карта памяти), по которому необходимо организовать передачу видео-аудио-данных и/или организовать сохранение данных на карту памяти.
Коммуникационная аппаратура с жесткой архитектурой, успешно решая задачу, для которой она разрабатывалась, тем не менее, не способна к масштабированию и решению сходных задач.
В последние несколько лет появились тенденции разработки коммуникационной аппаратуры на базе встраиваемых компьютеров, что уменьшает время разработки и сокращает ее стоимость. Недостатком такого подхода является множество компромиссов в реализации между ценой, массогабаритиыми показателями, величиной энергопотребления, надежностью и др.
Главным достоинством классической архитектуры компьютера является универсальность, которую дает использование системной шины. При этом все необходимые устройства подключаются к шине унифицированным образом (как правило, через пространство портов ввода-вывода или выделенных областей памяти). Такая организация, несмотря на известную универсальность, оказывается предельно неэффективной - в момент обмена данными с одним внешним устройством все остальные вынуждены бездействовать, ожидая освобождения шины. В результате, чтобы на классической архитектуре организовать обработку данных в реальном времени, приходится неоправданно увеличивать тактовую частоту процессора и шины, что приводит к увеличению энергопотребления и другим трудностям.
С другой стороны, системы, построенные на базе заказных СБИС, представляют собой, как правило, конвейерные структуры с параллельной обработкой данных при сравнительно низкой тактовой частоте. Главный недостаток решений на СБИС - большое время разработки и сложность повторного использования в новых проектах (в том числе в случаях, когда возможности масштабирования закладывались при разработке).
Оптимальным решением в такой ситуации может стать реконфигурируемая коммуникационная платформа, представляющая собой СБИС, содержащую основные блоки, требуемые для построения систем передачи и хранения данных в компрессированной форме.
Существующие зарубежные решения для организации коммуникационного канала или систем хранения данных, как правило,
используют реализацию компрессии-декомпрессии данных в виде стандартных кодеров-декодеров (кодеков).
Тем не менее, существующие и ряд вновь разрабатываемых методов компрессии состоят из схожей последовательности этапов обработки, предложенных в главе 5, каждый из которых можно реализовать соответствующим функциональным блоком.
Такое решение, являясь «конструктором кодеков», позволяет за короткое время реализовывать гибридные кодеки, учитывая конкретную специфику данных. Реконфигурируемая коммуникационная платформа реализована на базе технологии «система на кристалле» (SoC) и аппарагно реализует следующие функции:
• поддержка физического канала,
• контроллер внешней памяти SDRAM,
• ввод и вывод физических данных (видео, аудио),
• первичное (семантическое) сжатие данных различных типов (нормализация данных),
• вторичное (физическое) сжатие данных (Deflate, RLE, Huffman),
• предобработка данных (нормализация и компенсация яркости, цветового тона),
• постобработка данных (изменение типа развертки),
• реструктуризация данных.
Внеяияэ SDRAM
хл
Видео ЦДЛ
Процессор R JSC-ядро
Конгроплер р^эеертки
Конфигурируемое коммам*«иионное пространство
Первичное сжатие
Вторичное с **we
Монитср •
ОТЛЭДчю
6 пони постобработки
ioHTponrwp фИ^ИЧвСКОГО
Ксмпыотер со средой рвоработж
Рисунок 16. Архитектура реконфигурируемой коммуникационной платформы для задачи компрессии видеоданных.
Кроме того, программно осуществляется реконфигурирование системы при помощи взаимной коммутации аппаратных модулей и их настройки.
При этом разработка кодека сводится к организации конвейеров, состоящих из блоков обработки, соединенных, при необходимости, через буферы FIFO.
Пример реализации реконфигурируемого коммуникационного процессора на базе программируемой логической интегральной схемы (ПЛИС) Altera Cyclone II для организации передачи видеоданных приведен на рисунке 16.
Реализация коммуникационной платформы представляет набор функциональных блоков, объединенных конфигурируемым коммуникационным пространством и процессорное RISC-ядро. При этом на процессорное ядро возлагаются задачи начального конфигурирования системы, самодиагностики, внешнего управления, общей синхронизации (обработка прерываний по готовности данных) и реализация функций, отсутствующих в аппаратной реализации.
Конфигурируемое коммуникационное пространство представляет собой выделенное множество межблочных связей, которое может изменяться программно при запуске системы (включении питания или динамическом изменении конфигурации в процессе работы). Конфигурационной емкости пространства коммуникации и объема буферов достаточно для реализации кодера-декодера видеопотока в одном физическом корпусе СБИС.
Контроллер развертки (рисунок 16) дает возможность нелинейного чтения памяти в случае использования нестандартных разверток (пирамидальной развертки, заполняющей пространство кривой и им подобных).
Видеоконтроллер управляет видео-ЦАП и видео-АЦП, формируя (разбирая) поток цифровых видеоданных в формате ITU-R ВТ.656. Видеоконтроллер также позволяет в качестве источника видеоданных использовать ПЗС или КМОП цифровую камеру, а в качестве потребителя -ЖК-дисплей с цифровым интерфейсом.
Приведенная в примере реализация имеет аналоговый видеовход и видеовыход (композитный и компонентный), интерфейс физического канала LVDS, контроллеры USB и UART, а также шину ГС. В качестве внешнего кадрового буфера использована SDRAM память. Архитектура процессора одноядерная с гарвардской архитектурой, RISC ядро (производительностью около 25 MIPS), программно совместимое с PIC16. Для оперативного управления и отладки операционная система платформы, выполняющаяся на RISC-ядре, предоставляет текстовый интерфейс через UART-терминал. Проект реализован в виде синтезируемого RTL описания.
Коммуникационная платформа может использоваться для организации каналов связи с компрессией для передачи видеоданных с различными характеристиками (стандартное телевизионное разрешение, телевизионное изображение высокой четкости, малокадровое и техническое телевидение). В платформе заложена возможность создавать кодеки с управляемой скоростью
передачи данных (variable bitrate), введением кодов коррекции ошибок, функций шифрования, управления интерфейсом радиоканала и другими распространенными коммуникационными функциями.
В седьмой главе разрабатывается критерий адекватности цифровых каналов связи передаваемым данным для оценки качества эффективности и адекватности цифровых программируемых инфокоммуникационных систем.
Принципиальной особенностью цифровых каналов связи, использующих компрессию с потерями, является передача приблизительной копии исходного содержимого, что связано с уменьшением объема передаваемых данных.
Обобщенная структура канала передачи видеоданных представлена на рисунке 17.
Традиционно для оценки качества канала связи и его адекватности передаваемым данным в теории связи использовались энергетические
критерии, которые не учитывали особенности передаваемого контента.
-
внешняя
среда камера
канал передачи \
устройство отображения
Рисунок 17. Обобщенная структура каната передачи видеоданных.
При передаче видеоданных по каналу вследствие технологических особенностей источников данных (камер, сканеров), особенностей каналов передачи,, промежуточных этапов обработки данных, а также средств отображения данных (ЭЛТ и ЖК-дисплеев, проекторов) существует конструктивное несоответствие областей значений передаваемых данных.
Задача оценки адекватности рассмотрена на примере канала цветности в трактах передачи видеоданных.
Оиенки критериев адекватности источника (камеры), канала связи и устройства отображения могут быть основаны на психовизуальных особенностях восприятия человека, которые позволяют адаптировать достаточный информационный объем аудиовизуальных данных (уменьшать разрешение или исключать граничные значения) без ухудшения восприятия.
В случае использования в тракте компонентов, осуществляющих обработку видеоданных, в том числе компрессию с потерями, происходит дополнительное сужение цветового диапазона, то есть уменьшение количества различимых пикселов.
Для оценки сужения цветового диапазона была использована следующая методика: производилась имитация передачи по каналу с компрессией изображения сечений цветового пространства RGB, содержащего полный опорный набор цветов, представимых в этой системе (16581375 значений). Компрессия производилась на основе двух различных базисов: DCT (дискретное косинусное преобразование) и DWT (дискретное вейвлет-преобразование) с различными значениями величины компрессии.
После получения компрессированного изображения производилось его сопоставление с исходным, при этом оставались только те пикселы, значения
цветовых компонент которых полностью соответствовали исходным. Далее производился подсчет количества различимых пикселов, оставшихся неизменными после компрессии. Результаты представлены в таблице 2.
Таблица 2
Базис Параметр сжатия Размер компрессированного файла Количество различимых цветовых значений
DCT(JPEG) q=l 278 Кб 13255
q=5 663 Кб 311508
DWT (JPEG2000) q=10 69.6 Кб 2108691
q=50 101 Кб 11318717
Для наглядности представления результатов, в качестве примеров уменьшения цветового диапазона при использовании компрессии на Фурье- и вейвлет- базисах, было выбрано RGB отображение цветовой диаграммы CIE. Результаты обработки для разных базисов показаны на рисунке 18.
\\\Чч
а) б)
Рисунок 18. Характеристическое изображение для критерия адекватности при компрессии в базисе БСТ (а) и (б).
Введем понятие критерия адекватности тракта - отношение количества идентифицируемых (различимых) точек цветового пространства после всех этапов обработки, передачи и хранения (.V) к количеству идентифицируемых точек, воспроизводимых устройством отображения (Им) или генерируемых камерой ( Л',.„ ), соответствующих количеству различных представимых пикселов.
Критерий адекватности камеры к устройству отображения ( /1д, ) -отношение количества идентифицируемых (различимых) точек цветового пространства, воспроизводимых устройством отображения, к количеству идентифицируемых точек цветового пространства генерируемых камерой. При
Да, > 1 имеется информационная недостаточность (устройство отображения может воспроизводить значения цвета, которые не способна генерировать камера), при Л1ч. < 1 имеет место информационная избыточность, т.е. канал передачи данных используется для передачи значений, которые не способно воспроизвести устройство отображения:
Рассмотрение специфики устройств формирования и отображения видеоданных, а также особенностей каналов передачи данных с компрессией, выявило наличие несоответствия, выраженного в информационной избыточности передаваемых данных. Учет наличия такой избыточности может способствовать повышению эффективности каждого элемента тракта, а также их оптимального совместного использования в каналах цифрового телевидения.
Рассмотренный подход и введенный критерий могут служить методологической основой для повышения степени компрессии передаваемых по каналу изображений при неизменном субъективном их качестве.
Совокупность рассмотренных в диссертации методов построения цифровых программируемых инфокоммуникационных систем расширяет прикладные возможности широкого класса перспективных задач:
- создание систем «виртуального присутствия», включающих коммуникационную среду для организации удаленной пространственной визуализации для мобильных объектов (робототехнических комплексов, беспилотных летательных аппаратов и др.);
- создание единой унифицированной информационно-коммуникационной среды для обеспечения коммуникационной доступности, обеспечивающей возможность коммуникации между любыми объектами или субъектами, находящимися в пределах покрытия этой среды, через унифицированный коммуникационный интерфейс;
-создание систем когнитивного моделирования инфологического процесса представления знаний, мониторинга и онтологической кластеризации русскоязычных текстов.
В прнложешш 1 и приложении 2 приводятся примеры и результаты работы предложенных алгоритмов. В приложении 3 приведен пример реализации модуля НСиВЕ на языке Verilog для реконфигурируемой коммуникационной платформы. В приложении 4 дается терминологический глоссарий по теме диссертации.
ЗАКЛЮЧЕНИЕ
В диссертационной работе предложены методы и технология построения цифровых программируемых инфокоммуникационных систем, совокупность которых составляет теоретические и технологические основы решения
проблемы повышения эффективности систем передами цифровых данных за смет применения парадигмы адаптивного программируемого канала передачи данных, внедрение которых вносит значительный вклад в развитие экономики страны. Получены следующие результаты:
1. Концепция и теоретические основы цифровой программируемой технологии построения инфокоммуникационных систем. Введено понятие цифрового информационного объекта. На основе свойств цифрового информационного объекта показана независимость компонентов цифрового информационного объекта (канала, контейнера, контента).
2. Архитектура цифрового программируемого коммуникационного канала с процессорными элементами. Сформулированы базовые свойства цифровых каналов с процессорными элементами и ограничения на возможности их применения.
3. Контейнерный принцип представления битового потока и принцип сепарации представления цифрового контента для систем инфокоммуникации. На основе предложенных принципов в рамках архитектуры цифрового программируемого канала показана возможность подготовки контента под требования каналов для минимизации энергет ических затрат при его передаче.
4. Введено понятие гибридного кодека как реконфигурируемого элемента в рамках технологии программируемых инфокоммуникационных систем. Предложена методология построения гибридных кодеков с заданными параметрами для компрессии видеоданных.
5. Метод и техническое решение для оптимизации энергетических и информационных характеристик для различного вида информационного контента. В основе метода - корреляция энергопотребления от битового потока и формы представления содержания.
6. Алгоритм и программа для компрессии видеоданных, отличающиеся использованием унифицированного пространственно-временного (30) представления последовательности кадров.
7. На основе цифровой программируемой технологии предложена архитектура коммуникационного канала, разработана и реализована универсальная коммуникационная платформа на базе ПЛИС с ориентацией на семантику передаваемых данных.
8. Методы оценки адекватности цифровых каналов при передаче по ним информационного контента. Разработаны критерии оценки каналов передачи аудиовизуальных данных относительно восприятия человека и энергетической эффективности компрессии видеопотока.
9. На основе предложенного подхода к построению универсальной цифровой коммуникационной платформы с возможностью программного реконфигурирования под требуемую задачу (системы высокой готовности) приведен пример разработки реконфигурируемого
коммуникационного процессора на базе ПЛИС Altera для организации передачи видеоданных.
Разработанная коммуникационная платформа способна упростить решение ряда типовых задач по организации систем передачи и хранения данных. Подобное решение имеет преимущество по сравнению с реализацией алгоритмов компрессии данных на процессорах обычного назначения в виде подпрограммы (при последовательном выполнении) или процесса (при параллельном выполнении) в степени компрессии, а в некоторых случаях по показателям надежности и энергопотребления.
Предложенный инструментарий способен упростить разработку коммуникационных решений. Благодаря снижению стоимости лицензирования отечественной технологии передачи видеоданных, по сравнению с зарубежными аналогами, возможно обеспечить экономический эффект. Введение в реконфигурируемую коммуникационную платформу дополнительного функционала (шифрования, кодирования для коррекции ошибок) позволит реализовать функции коммуникационного терминала в виде системы на кристалле с использованием минимального количества электронных компонентов.
Описанный подход может заменить ряд существующих систем цифровой передачи данных для специализированных типов данных, что положительно отражается на унификации и стандартизации протоколов передачи и форматов хранения данных.
СПИСОК ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Монография и главы в книгах
1. Александров В.В., Кулешов C.B., Цветков О.В. Цифровая технология инфокоммуникации. Передача, хранение и семантический анализ текста, звука, видео. — СПб.: Наука, 2008. — С. 57-124, 189-195, 200-205, 216220.
В журналах из перечня ВАК
2. Александров В.В., Кулешов C.B., Цветков О. В. Концепция программируемой технологии цифровой теории связи: от герц к бит/с. // "Информационио-измерительиые и управляющие системы", №6, т.5, 2007, —С. 62-72.
3. Кулешов С. В. Терминальные программы "цифровой" передачи и обработки данных, энергетическая и информационная эквивалентность. // "Информационно-измерительные и управляющие системы", №9, т.5, 2007. —С. 10-15
4. Кулешов C.B. Потенциальные свойства цифровых каналов передачи данных — Изв. вузов. Приборостроение. 2010. Т. 53, № 11, с. 16-19
5. Александров В.В., Кулешов C.B. Этерификация и терминальные программы — "Информационно-измерительные и управляющие системы", №10, т.6,2008. — С. 50-53.
6. Александров В.В., Кулешов C.B. Аналитический мониторинг Internet контента. Мифологический подход — Качество. Инновации. Образование №3,2008, —С. 68-70
7. Кулешов C.B. Пространственно-временное представление, обработка и компрессия видеопотока. — "Информационно-измерительные и управляющие системы", №4, т.6,2008. — С. 33-37.
8. Кулешов C.B. Оптимизация энергоинформационной передачи данных. — "Информационно-измерительные и управляющие системы" №11, т.7, 2009.— С. 16-21.
9. Кулешов C.B. Формат представления реальных трехмерных сцен для объемного телевидения (True3D Vision) — "Информационно-измерительные и управляющие системы", №4, т.7,2009. — С. 49-52.
Ю.Кулешов C.B. Метод ЗО-компрессии данных рентгеновской компьютерной томографии — Изв. вузов. Приборостроение. 2011. Т. 54, № 1, —С. 12-16
Н.Кулешов C.B., Цветков О.В. Цифровая программируемая технология информационно-энергетической передачи данных. — "Информационно-измерительные и управляющие системы", №7, т.8,2010. — С. 43-47.
12.Александров В.В., Кулешов C.B. Цифровая программируемая технология управления робототехническими комплексами — "Мехатроника, Автоматизация, Управление" №2,2011. — С. 21 - 24
13.Кулешов C.B. Критерий оценки энергетической эффективности компрессии видеопотока. — "Информационно-измерительные и управляющие системы", №11, т.8,2010. — С. 16-18.
14.Кулешов C.B. Реконфигурируемая коммуникационная платформа передачи радиолокационных данных. Вопросы радиоэлектроники. — Вып. 1., 2010, —С. 173-177
15.Кулешов C.B. Цифровой биометрический браслет контроля функционального состояния — Научное приборостроение, 2011, том 21, №2. — С. 54-57
16.Кулешов C.B. Программируемый канал для организации передачи сенсорных данных — Радиотехника № 6,2011.
17.Кулешов C.B. Временной анализ активности видеопотока — "Информационно-измерительные и управляющие системы", №4, т.9, 2011. — С.48-51
В других изданиях
18. Александров В.В., Андреева Н.А., Кулешов C.B. Системное моделирование. Методы построения информационно-логистических систем / Учеб. пособие. — СПб.: Изд-во Политехи, ун-та, 2006. — 95 с.
19.Александров В.В., Кулешов С.В., Аксенов А.Ю., Зайцева А.А. Цифровая программируемая технология в бортовых интеллектуальных системах -Материалы 6й научной конференции «Управление и информационные технологии» — СПб, 2010. — С. 145-148.
20.Александров В.В., Кулешов С.В. Цифровая программируемая технология в интегрированных интеллектуальных системах — Экстремальная робототехника. // Труды XXI Международной научно-технической конференции — СПб.: "Политехника-сервис", 2010 — С.487-492
21.Kuleshov S., Zaytseva A., Aksenov A. Spatiotemporal Video Representation and Compression — 10th International Conference on Pattern Recognition and Image Analysis: New Information Technologies (PRIA-10-2010). St. Petersburg, December 5-12, 2010. Conference Proceedings (Vol. f-II), Volume I, SPb.: Politechnika, 2010. — pp. 231-236
22.Кулешов C.B., Кокорин П.П. Аппаратная реализация СУБД в инфологических системах. // Труды СПИИРАН. 2010. Вып. 14. — С. 244250.
23.Александров В.В., Кулешов С.В., Цветков О.В., Левашкин С.II. Мифологическая система формирования семантических понятий инвариантных по отношению к естественно-языковому окружению в Интернет среде — "Информационно-измерительные и управляющие системы", №4, т.7,2009. — С. 5-10.
24.AIexandrov V., Kuleshov S. Digital paradigm of a civilization growth. — Proceedings of the Distributed Intelligent Systems and Technologies Workshop, St. Petersburg, Russia, 8-10 June 2009, pp. 65-69
25.AIexandrov V., Andreeva N., Kokorin P., Kolesnikov R., Kuleshov S., Zaytseva A. Digital intelligent services based on the concept of programmed technology. — Proceedings of the Distributed Intelligent Systems and Technologies Workshop, St. Petersburg, Russia, 8-10 June 2009, pp. 71-75
26.Кулешов C.B., Зайцева A.A., Аксенов АЛО. Ассоциативно-пирамидальное представление данных. — "Информационно-измерительные и управляющие системы", №4, т.6,2008. — С. 14-17.
27.Кулешов С.В., Аксенов А.Ю., Зайцева А.А. О критерии адекватности цифровых трактов передачи данных — "Информационно-измерительные и управляющие системы", №4, т.7,2009. — С. 75-77
28.Александрова В.В., Андреева Н.А., Кулешов С.В. VisualWorld.ru когнитивная технология представления знаний. // Труды Вторых Всероссийских научных чтений «Будущее сильной России - в высоких технологиях» — ООО "Издательство «Логос», СПб., 2008. — С. 28-32
29.Кулешов С.В., Зайцева А.А. Селекция и локализация семантических фрагментов — "Информационно-измерительные и управляющие системы", №10, т.6,2008. — С. 88-90.
30.Alexandrov V., Kuleshov S., Semushkina N. The Visual Glossary as New Information Technology for Science Education — The 6th International
Conference on Education and Information Systems, Technologies and Applications: EISTA 2008, Orlando, Florida, USA.
31.Кулешов C.B., Зайцева A.A. Локализация семантических блоков на растровых изображениях без предварительного обучения. // Информационные технологии и системы (ИТиС'08): сборник трудов конференции. — М.: ИППИ РАН, 2008. — С. 468-470
32.Александров В.В., Кулешов C.B., Кокорин ГШ. Концепция построения информационно-логистических систем. // Системные проблемы надёжности, качества, математического моделирования, информационных и электронных технологий в инновационных проектах (Инноватика-2008). // Материалы Международной конференции и Российской научной школы. Часть 1. — М.: Энерго-атомиздат, 2008. — С. 21-23
33.Александров ВВ., Кулешов C.B., Цветков О.В., Зайцева A.A. Концепция и теория нанотехнологии физической среды инфотелекоммуникации (прототип SDR). // Труды СПИИРАН. Вып. 6. — СПб.: Наука, 2008.
34.Александров В.В., Кулешов C.B. От спектральной теории В.А.Котельникова к цифровой программируемой технологии передачи данных. — 9-я международная научно-техническая конференция "проблемы техники и технологий телекоммуникаций" ПИиТТ-2008, Казань, 2008.— С. 149-150
35.Аль-Рашайдех X., Кулешов C.B. Распознавание арабско-индийских чисел с использованием составных классификаторов и комбинирования векторов признаков.// Изв. Вузов. Приборостроение. 2007. — Т.50, №12. — С.8-12.
36.Александров В.В., Кулешов C.B. Компьютерный симулятор рече-визуалыюго интерфейса управления и контроля летательным аппаратом // Материалы конференции "Человеческий фактор в авиации и космонавтике" —Москва-Ярополец, 13-15 июня 2007 г.
37.Купешов C.B., Цветков О.В. О критериях метрологической оценки информационных сообщений // Изв. Вузов. Приборостроение. 2007. Т.50, №5. — СЛ1-15.
38.Александров В.В., Кулешов C.B. Аналитический мониторинг INTERNET контента. Инфологический подход. // Системные проблемы надёжности, качества, математического моделирования, информационных и электронных технологий в инновационных проектах (Инноватика-2007). // Материалы Международной конференции и Российской научной школы. Часть 2, Том 1, — М.: Энергоатомиздат, 2007 — С.80-83.
39.Кулешов C.B., Аксенов АЛО., Зайцева A.A., Идентификация факта компрессии с потерями в процессе обработки изображений. // Труды СПИИРАН. Вып. 5. — СПб.: Наука, 2007.
40.Кулешов C.B., Зайцева A.A., Аль-рашайда X. Выявление несанкционированных вставок в видеонотоке методом ранговых распределений. // Труды СПИИРАН. Вып. 3, т. 2. — СПб.: Наука, 2006.
41.Александров В.В., Кулешов C.B. Алгоритм и программа. Бит и джоуль. — По пути прогресса - к новым достижениям / ОАО "Научно-производсгвенное предприятие «Радар ММС»/ Сб. материалов под ред. ген. директора - ген. конструктора Г.В. Аниева. — СПб.: ООО "Издательство "Логос", 2006. — С. 192-197.
42.Александров В.В., Андреева А.Н., Кулешов C.B. Визуальный динамический глоссарий - VISOLOSS. // Материалы X Международной конференции и Российской научной школы «Системные проблемы надежности, качества, информационных технологий (Инноватика-2005)» ч. 6 — Москва, Радио и связь, 2005. — С.4-8.
43.Александров В.В., Кулешов C.B. Семиологические информационные системы - аналитическое самореферирование.// Материалы X Между народной конференции и Российской научной школы «Системные проблемы надежности, качества, информационных технологий (Инноватика-2005)» ч. 6 — Москва, Радио и связь, 2005. — С.9-14
44.Александров В.В., Кулешов C.B. Нарротивные представления информационных процессов. — Электронный научный журнал «Информационные процессы», том 4, N2,2004 — с.160-169. www.jip.ru
45.Кулешов С.В Фрактальное шифрование. Труды СПИИРАН. Вып. 2 — СПб: СПИИРАН, 2004.
46.Александров В.В., Андреева H.A., Кулешов C.B. Семиологический подход построения информационно-аналитических систем. — Материалы Международной конференции и Российской научной школы «Системные проблемы надежности, качества, информационных и электронных технологий (ИННОВАТИКА-2004)», ч.7, том 1, Москва, Радио и связь, 2004. — С.3-16.
47.С.В. Кулешов, A.A. Зайцева, «Объектная локализация семантических блоков на растровых изображениях», Тр. СПИИРАН, 7 (2008). — С. 41-47
Типография «Восстания-1» Санкт-Петербург, Средний пр. В.О., д.28. Подписано в печать 05 .07 .2011 г. Формат 60x84 1/16. Тираж 100 экз.
Текст работы Кулешов, Сергей Викторович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
Учреждение Российской академии наук Санкт-Петербургский институт информатики и автоматизации РАН
На правах рукописи
05201100422
Кулешов Сергей Викторович
(
МЕТОДЫ И ТЕХНОЛОГИЯ ПОСТРОЕНИЯ ЦИФРОВЫХ ПРОГРАММИРУЕМЫХ ИНФОКОММУНИКАЦИОННЫХ СИСТЕМ
Специальность 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
ДИССЕРТАЦИЯ на соискание ученой степени доктора технических наук
Санкт-Петербург - 2011
/
Содержание
Содержание...................................................................................................2
Список сокращений.....................................................................................5
Глава 1. Цифровая программируемая технология инфокоммуникации
................................................................................................................................17
1.1. Структура систем на основе цифровой программируемой
технологии.........................................................................................................37
Выводы по главе 1..................................................................................42
Глава 2. Теоретические основы построения цифровых каналов передачи данных...................................................................................................43
2.1.Принцип сепарации представления цифрового информационного объекта...............................................................................................................44
2.2. Базовые свойства и ограничения каналов связи...........................46
2.3. Цифровые каналы передачи данных с процессорными элементами, гибридные кодеки.......................................................................52
2.4. Интерфейсное согласование модулей в гибридных кодеках......55
2.5. Принцип использования вложенных контейнеров при организации цифровых каналов......................................................................58
2.6. Оптимизация энергопотребления при организации каналов передачи данных...............................................................................................61
Выводы по главе 2..................................................................................70
Глава 3. Методы оценки сложности представления битовых последовательностей. Алгоритмическая сложность по А.Н.Колмогорову (А1С).......................................................................................................................72
3.1. Алгоритмическая сложность по А. Н. Колмогорову (А1С).........74
3.2. Оценка сложности по В. И. Арнольду...........................................77
3.3. Формализм терминальных программ............................................81
3.4. Принцип сепарации представления цифрового контента...........86
3.5. Нарротивное представление цифрового контента.......................89
3.6. Программируемая сложность в инфокоммуникации..................95
Выводы по главе 3..................................................................................99
Глава 4. Методы построения гибридных кодеков для видеоданных . 100
4.1 Особенности зрительной системы человека................................100
4.2. Оценка информационной избыточности представления видеоданных относительно психофизиологической достаточности восприятия человека.......................................................................................110
4.3 Видеоданные - структура и особенности....................................113
4.4. Схема построения видеокодека....................................................123
4.5. Сравнение базисов для компрессии видеоданных.....................125
4.6. Применение квантования в методах компрессии с потерями... 128
4.7. Использование компрессии при построении систем цифрового телевидения.....................................................................................................131
4.8 Обобщенная схема построения гибридного кодека для видеоданных....................................................................................................135
Выводы по главе 4................................................................................139
Глава 5. Методы построения кодеров/декодеров для ряда практических применений.........................................................................................................140
5.1. Методы построения кодеков для передачи видеоданных (кодек STVC)...............................................................................................................141
5.2. Модифицированный вариант кодека для передачи видеоданных на основе пирамидально-иерархического представления (кодек HTVC). 157
5.3. Модификация кодека для передачи видеоданных на заполняющей пространства кривой (ЗПК-кодек)........................................163
5.4. Формат представления реальных трехмерных сцен для объемного телевидения (True3D Vision - кодек)........................................164
5.5. Методы компрессии многомерных данных (рельефы земной поверхности)....................................................................................................172
5.6. Методы компрессии медицинских томографических данных . 173
5.7. Методы компрессии текстовых данных (автоматическое реферирование)...............................................................................................179
Выводы по главе 5................................................................................183
Глава 6. Разработка реконфигурируемой коммуникационной платформы для передачи видеоданных...........................................................185
6.1. Разработка реконфигурируемой платформы..............................188
6.2. Описание и реализация модулей..................................................197
Выводы по главе 6................................................................................201
Глава 7. Методы и критерии оценки качества, эффективности и адекватности цифровых программируемых инфокоммуникационных систем ..............................................................................................................................203
7.1 Субъективные критерии качества изображений.........................203
7.2 Объективные критерии качества изображений...........................207
7.3. Критерий энергетической эффективности процесса компрессии ...........................................................................................................................209
7.4. Критерий адекватности цифровых трактов передачи данных.. 211 Выводы по главе 7................................................................................218
Заключение...............................................................................................219
Литература................................................................................................ 222
Приложение 1...........................................................................................241
Приложение 2...........................................................................................250
Приложение 3...........................................................................................254
Приложение 4...........................................................................................262
Список сокращений
БПЛА - беспилотный летательный аппарат
ДКП - дискретное косинусное преобразование.
ДПЛА - дистанционно пилотируемый летательный аппарат
ЗПК - заполняющая пространство кривая
ПЛИС - программируемая логическая интегральная схема
РКП - реконфигурируемая коммуникационная платформа
СКО - среднеквадратическое отклонение
СнК- система на кристалле
ТП - терминальная программа
ЦИО — цифровой информационный объект
ЦОС - цифровая обработка сигналов
ЦПК - цифровой программируемый канал
MPEG - Moving Picture Experts Group — стандарт сжатия видеоданных PSNR (peak signal-to-noise ratio) - пиковое отношение сигнала к шуму RGB (Red, Green, Blue) - цветовая модель, описывающая способ синтеза цвета
SDR - Software Defined Radio (программируемое радио) YUV - цветовая модель в которой цвет представляется как 3 компоненты — яркость (Y) и две цветоразностных (U и V).
Введение
На протяжении последних 50 лет микроэлектроника, развиваясь в соответствии с законом Мура, расширяет функциональные возможности систем инфокоммуникации, увеличивая скорость и битовой объем передаваемых данных, трансформируя традиционные аналоговые системы связи и телевидения в цифровые мультимедийные технологии. Это вызывает появление новых общецивилизационных понятий: информационные технологии; on-line доступность; адаптивное, когнитивное, программируемое радио (SDR); виртуализация SD-окружения; наноэлектроника. В то же время системы связи продолжают проектироваться исходя из традиционной методологии теории информации, общей теории связи К. Шеннона, В. А. Котельникова, А. А. Харкевича. Потенциальная помехоустойчивость таких систем определяется среднеквадратической ошибкой (СКО) - энергетическим критерием спектральной разности между сигналом, шумом и их вероятностными распределениями, гипотезой об эргодичности, а также критериями типа Неймана-Пирсона, Вальда и др. [33, 117, 127, 158]. Транспортировка сигнала в таких системах (передача и прием) основана на принципе гетеродина, при котором контейнер (несущая частота) и контент (информационное содержание) представлены как единое целое. Появление цифровой микроэлектроники привело к разработке цифровых схем, реализующих передаточные функции (операторы Хевисайда), а также к появлению эффективных рекурсивных схем обработки и передачи данных: алгоритмам А. Д. Витерби, В. В. Александрова (быстрым преобразованиям Адамара), самоподобным функциям Вейерштрасса, и ряду других [3, 39].
Основной парадигмальный недостаток классической архитектуры систем связи - модуляция несущей информационной составляющей сигнала, которая влечет за собой жесткую зависимость полосы пропускания (и
диапазона выделенных частот) от типа передаваемого контента (звука, видео, сигналов управления, навигации, локации и телеметрии), что является причиной низкой энергоэффективности таких систем. Очевидность этого факта приводит к демонтажу энергетически затратных передающих комплексов и внедрению систем передачи данных, основанных на пакетной передаче данных, сотовой архитектуре и интернет-технологиях.
Отставание в наноэлектронике создает ситуацию научно-образовательной некомпетентности, в которой новейшие тенденции диктуются зарубежными организациями, в частности Wireless Innovation Forum (ранее SDR-forum), в котором Россия даже не имеет своего представительства.
Wireless Innovation Forum сформулировал тенденции беспроводной высокоскоростной цифровой технологии передачи данных, ряд из которых следует отметить особо:
• Полностью цифровая передача, прием и обработка принятого с антенны сигнала с программируемыми параметрами спектральной области и типа модуляции (software defined radio);
• Цифровое управление выбором протокола связи на основании мониторинга трафика на беспроводных интерфейсах в широком диапазоне частот (adaptive radio);
• Организация единого виртуального канала на базе нескольких физических беспроводных интерфейсов (cognitive radio);
• Обеспечение поддержки очень широкого диапазона частот для организации канала.
Нельзя сказать, что в нашей стране не используют новейшие достижения мировой индустрии, но их применение сводится к покупке лицензий и последующей комбинации из готовых блоков требуемых решений, что приводит к появлению таких «инновационных решений» как
«российский смартфон», «отечественные системы цифрового телевидения» и др.
Это приводит к проблеме научно-образовательного коллапса и несовместимости англо-русскоязычных глоссариев для прогрессирующих предметно-профессиональных тем и потребительского интерфейса. Исчезает возможность и потребность развития междисциплинарных знаний и инновационных технологий.
Для массового внедрения появившихся технологических возможностей необходимо концептуальное и теоретическое исследование специфических свойств цифрового программируемого канала, в котором основой является не просто цифровая модуляция контентом (манипуляция) несущей частоты, а возможность адаптивного, когнитивного управления контентом и его представления в виде битового потока, передаваемого в физическую среду, (в том числе и беспроводную) с целью достижения качественно иных предельных показателей (надежность, энергоэффективность, защищенность, скрытность и ряд других).
Для решения этих задач в диссертационной работе ставится и решается научная проблема разработки теории и методологии построения цифровых программируемых инфокоммуникационных систем и на этой основе разработки методов, алгоритмов и программ для организации каналов передачи цифрового контента.
Суть рассматриваемой цифровой программируемой технологии инфокоммуникации (в дальнейшем «программируемой технологии») - это совмещение трех дополняющих друг друга информационных составляющих: «имя» - идентификационный адрес, в отличие от обезличенной широковещательной передачи сигнала; «контейнер» — совокупность форматов и протоколов, не зависящих от вида канала; «контент» (содержание) - семантико-информационное представление (звук, видео, текст и т.д.) Такой составной цифровой информационный объект расширяет
функциональные возможности задач мониторинга, организации когнитивных процессов представления семантики, а также решает проблему энергоинформационной оптимизации.
Данная диссертационная работа является междисциплинарным исследованием в области современной цифровой технологии импульсно-временной регистрации сигналов, контейнерной транспортировки, согласования межканальных протоколов и семантических методов представления, хранения и передачи информационного контента.
Целью работы является разработка научно обоснованной методологической базы и программно-технических решений для повышения эффективности систем инфокоммуникации за счет применения парадигмы программируемого канала передачи данных. Для достижения поставленной цели в работе решены следующие задачи:
1. Исследование основных направлений в области построения систем передачи цифровых данных.
2. Разработка теоретических основ, архитектуры цифрового программируемого коммуникационного канала.
3. Разработка методов и программ построения гибридных кодеков с заданными параметрами, определяемыми задачей.
4. Создание формализма терминальных программ для оценки предельной сложности цифрового информационного объекта.
5. Разработка методов и критериев оценки адекватности цифровых программируемых инфокоммуникационных систем. Семантический анализ текстовых, аудио- и видео- данных.
6. Обобщение и оценка результатов исследований по проблеме организации программируемых каналов передачи данных с оценкой эффективности полученных результатов.
Объект исследования. Информационные и энергетические аспекты представления разнотипных данных (текст, аудио, видео), а также свойства сложных структур данных, представляющих цифровой информационный объект.
Предмет исследования. Закономерности, принципы, способы, методы, модели, алгоритмы, методики технические решения нового класса задач организации передачи компрессированных цифровых данных.
Методы исследования. Для решения поставленных задач используются методы цифровой обработки разнотипных сложно структурированных данных, объектно-ориентированного проектирования и программирования, алгоритмическая теория А. Н. Колмогорова, теория графов, синтеза цифровых логических схем, особенности психовизуального восприятия.
Научная новизна. Разработаны методы и технология построения цифровых программируемых инфокоммуникационных систем, в том числе:
1. Предложена концепция и теоретические основы цифровой программируемой технологии построения инфокоммуникационных систем, введено понятие цифрового информационного объекта, позволяющее рассматривать канал, контейнер, контент как независимые компоненты инфокоммуникации.
2. Сформулирован контейнерный принцип формирования битового потока, инвариантного к свойствам физического канала, для систем передачи цифровых данных.
3. Предложен принцип сепарации цифрового контента на транспортный поток и порождающую программу, позволяющий осуществлять адаптацию контента под требования каналов при его передаче.
4. Введено понятие гибридного кодека как реконфигурируемого элемента в рамках технологии программируемых
инфокоммуникационных систем, предложена методология построения гибридных кодеков с заданными параметрами для компрессии видеоданных.
5. Предложена архитектура и сформулированы базовые свойства цифрового программируемого коммуникационного канала с процессорными элементами, отличающегося наличием в своем составе конфигурируемых гибридных кодеков.
6. Предложен метод и техническое решение оптимизации энергетических и информационных характеристик для различного вида информационного контента.
7. Разработаны алгоритм и программа для компрессии видеоданных, отличающиеся' использованием унифицированного пространственно-временного (ЗБ) представления последовательности кадров.
8. На основе цифровой программируемой технологии предложена архитектура коммуникационного канала, разработана и реализована универсальная коммуникационная платформа на базе программируемой логической интегральной схемы (ПЛИС) с ориентацией на семантику передаваемых данных.
Обоснованность научных положений и выводов обеспечена за счет анализа состояния исследований в данной области, а также согласованностью теоретических выводов с результатами экспериментальной проверки моделей. Новизна технических предложений подтверждается их востребованностью при проведении научно-исследовательских работ, относящихся к цифровому телевидению и организации каналов связи с дистанционно контролируемыми автономными объектами.
Положения, выносимые на защиту. На основе проведенных теоретических работ и их экспериментальной апробации на защиту выносятся следующие положения:
1. Концепция и теоретические основы цифровой программируемой технологии построения инфокоммуникационных систем.
2. Архитектура цифрового программируемого коммуникационн
-
Похожие работы
- Моделирование интеллектуальных систем управления защитой информации в инфокоммуникационных системах ОВД
- Модели предоставления инфокоммуникационных услуг
- Параллельные цифровые нейрокомпьютеры и их применение в задачах распознавания зрительных образов
- Полигауссовы алгоритмы совместной демодуляции-декодирования сигналов в каналах мобильных инфокоммуникационных систем
- Исследование и разработка устройств обработки сложных сигналов на многозначных элементах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность