автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Динамический анализ и диагностика состояния IP-сети

кандидата технических наук
Шалаев, Максим Павлович
город
Санкт-Петербург
год
2005
специальность ВАК РФ
05.13.13
Диссертация по информатике, вычислительной технике и управлению на тему «Динамический анализ и диагностика состояния IP-сети»

Автореферат диссертации по теме "Динамический анализ и диагностика состояния IP-сети"

На правах рукописи

Шалаев Максим Павлович

ДИНАМИЧЕСКИЙ АНАЛИЗ И ДИАГНОСТИКА СОСТОЯНИЯ ЕР-СЕТИ

Специальность 05.13.13 - Телекоммуникационные системы и компьютерные сети

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 2005

Работа выполнена в Санкт-Петербургском государственном университете информационных технологий, механики и оптики

Научный руководитель:

Официальные оппоненты:

доктор технических наук, профессор Гуров Игорь Петрович

доктор технических наук, профессор Алиев Тауфик Измайлович

кандидат технических наук, старший научный сотрудник Ногин Сергей Борисович

Ведущая организация:

Санкт-Петербургский институт информатики и автоматизации Российской академии наук

Защита диссертации состоится «14» июня 2005 года в часов на заседании диссертационного совета Д.212.227.05 в Санкт-Петербургском государственном университете информационных технологий, механики и оптики, 197101, Санкт-Петербург, ул. Саблинская 14, СПбГУ ИТМО.

С диссертацией можно ознакомиться в библиотеке СПбГУ ИТМО. Автореферат разослан «13» мая 2005 г.

Ученый секретарь Поляков Владимир Иванович

Совета Д.212.227.05, кандидат технических наук, доцент

\AG5G

№7397-

3

Общая характеристика работы

Актуальность

Активное развитие информационных технологий и расширение объемов информационных услуг основываются в значительной мере на научно-технологических разработках в области телекоммуникационных сетей. По данным различных исследований, приблизительная динамика роста Интернет трафика за последние десять лет составляет 70-150% в год, т.е. в среднем каждый год количество информации, передаваемой через сеть, удваивается. Объем информации, передаваемой через Интернет в России в первом полугодии 2004 г. вырос по сравнению с аналогичным периодом 2003 г. на 245% и достиг 18400 Тбайт. Развитие телекоммуникационных сетей обуславливает необходимость исследований, разработок и внедрения новых технологий.

Существующие исследования в области магистрального сетевого трафика показывают, что сетевые технологии сильно опережают в своем росте теоретическое и аналитическое понимание сетевых взаимодействий. Узкоспециализированные и ограниченные телекоммуникационные задачи прошлых лет хорошо изучены и математически формализованы, в частности, на основе положений теории массового обслуживания, что позволяло достаточно точно предсказывать такие характеристики как длины очередей и сетевые задержки. Однако традиционные принципы теоретического анализа и существующие методики не соответствуют необходимым требованиям.

Адекватные модели трафика и методики, обеспечивающие получение оценок характеристик сетевых взаимодействий играют важную роль в ускорении эволюции гигабитных и более скоростных сетевых технологий. Теоретический и экспериментальный анализ сетевых процессов приобретает особое значение по сравнению с классическими математическими моделями прошлых лет. По различным причинам, проблема исследования агрегированного Интернет трафика, например, магистральных каналов, на данный момент изучена недостаточно. По мнению автора, основная причина этого заключается в высоком приоритете усилий в операционной области. Провайдеры услуг Интернет главным образом концентрируют свои усилия на каждодневных требованиях клиентов, стороне

систематический сбор и анализ данных сетевого трафика. По этим причинам, существующие работы в области исследования сетей явно указывают на пробел между сравнительно успешными экспериментами и исследованиями изолированных систем и неизученными характеристиками сетевых взаимодействий в широком смысле.

Таким образом, теоретическое и экспериментальное исследование характеристик трафика в телекоммуникационных сетях является актуальной научной задачей. Актуальность проблематики информационных технологий подтверждается тем, что 18 ноября 2004 г. Правительство РФ одобрило «Концепцию развития рынка информационных технологий в Российской Федерации», предложенную Мининформсвязи России.

Целью работы является построение адекватной модели поведения 1Р-сети на основе строгих объективных критериев, корректно характеризующей трафик магистральных сетевых каналов, разработка и верификация методики мониторинга и диагностики состояния сети. Основные задачи работы состоят в следующем.

1. Анализ существующих методов оценки характеристик, моделирования и мониторинга сетевого трафика, получение представительных данных мониторинга магистрального канала ГР-сети.

2. Теоретическая разработка, построение и исследование модели информационной сети на основе теории Марковских случайных процессов.

3. Разработка метода и практической методики мониторинга сети с использованием предложенной теоретической модели.

4. Практическая реализация и апробирование предлагаемой методики при диагностике магистрального канала сети.

Методы исследования

В соответствии с целями и задачами диссертационной работы, объектом исследования является 1Р-сеть, а предметом исследования -свойства данной сети. В работе использованы теоретические и экспериментальные методы исследования, включая методы теории вероятности и теории случайных процессов.

В работе выполнена постановка задачи динамического анализа и диагностики состояния 1Р-сети на основе строгих объективных критериев и получены следующие научные результаты, которые выносятся на защиту.

1. Теоретическая математическая модель трафика магистрального канала распределенной сети на основе теории Марковских случайных процессов и результаты исследования сетевого трафика и предложенной модели с целью диагностики состояния и выявления аномального функционирования сети.

2. Метод диагностики состояния сети на основе предложенной математической модели.

3. Результаты исследования адекватности модели на синтезированных и реальных входных данных как совокупности параметров, объективно характеризующих состояние распределенной сети.

4. Методика исследования данных магистрального канала реально функционирующей сети как основополагающего фактора принятия решения об адекватности и применимости разработанных моделей. Практическое значение работы состоит в том, что:

- разработана методика получения данных о сетевом трафике с интерфейсов современных высокопроизводительных сетевых устройств, что позволяет решать задачи распределения сетевых ресурсов, выявления некорректной политики маршрутизации, определения эффективности работы информационных сервисов;

- разработана и внедрена система сбора информации на узловом маршрутизаторе магистрального канала реально функционирующей сети с возможностью динамического изменения количественной и качественной детализации получаемых данных для их дальнейшего аналитического исследования;

- реализован программный модуль, интегрируемый в существующую систему мониторинга исследуемой сети на основе открытой архитектуры с обеспечением простоты реализации интерфейсов, четкой алгоритмизации задачи и низкой вычислительной ресурсоемкости, связанной с выбранным математическим аппаратом;

- разработана методика анализа данных реально функционирующих сетевых объединений, что позволяет проводить экспериментальные исследования состояния сети, опираясь на конкретные требования сетевых администраторов.

Достоверность научных положений, выводов и практических рекомендаций диссертационной работы подтверждается детальным анализом особенностей

трафика магистральных телекоммуникационных каналов на основе представительных данных мониторинга состояния сети, корректными методиками расчетов, совпадением теоретических и экспериментальных результатов исследований. Реализация результатов работы

Результаты, полученные в диссертации, используются на практике в Санкт-Петербургском филиале Республиканского научного центра компьютерных телекоммуникационных сетей высшей школы при мониторинге магистрального канала телекоммуникационной сети ШИШе^ в проекте Санкт-Петербургского филиала Государственного научно-исследовательского института информационных технологий и телекоммуникаций «Информика» и в учебном процессе кафедры Компьютерных Технологий СПбГУ ИТМО по дисциплине «Теория информации и передачи сигналов». Апробация диссертации

Основные положение диссертационной работы докладывались на Международной научно-методической конференции «Телематика 2000» (Санкт-Петербург, 2000); Всероссийской научно-методической конференции «Телематика 2003» (Санкт-Петербург, 2003); I конференции молодых учёных СПбГУ ИТМО, 2004 (Санкт-Петербург, 2004); IX Санкт-Петербургской международной конференции «Региональная информатика» (Санкт-Петербург, 2004); II конференции молодых учёных СПбГУ ИТМО, 2005 (Санкт-Петербург, 2005); Всероссийской научно-методической конференции «Телематика 2005» (Санкт-Петербург, 2005). Публикации

По теме диссертационной работы опубликовано 7 печатных работ, в том числе три статьи в научных журналах и сборниках и четыре статьи в трудах научных конференций. Структура диссертации

Диссертация состоит из введения, четырех глав и заключения. Список литературы содержит 33 наименования. Работа иллюстрирована 32 рисунками. Работа включает 4 приложения.

Содержание работы

Во введении обосновывается актуальность проблематики диссертационной работы, ставится цель и формулируются задачи исследования, приводятся результаты, представляющие научную новизну и практическую значимость работы, а также формулируются положения, выносимые на защиту.

В первой главе диссертации приводятся результаты анализа основных особенностей архитектуры протокола 1Р, и соответствующих сетевых технологий, важные для дальнейшего изложения результатов работы. Отмечаются основные проблемы диагностики 1Р-сетей, состоящие, в частности, в сложности организации системы мониторинга сети, наличии сетевых аномалий и отсутствии объективных методов их идентификации. Анализируется ряд известных методов и моделей анализа состояния сети, указывается область их применения и основные недостатки, в том числе, узкоспециализированный характер и ограниченность применения при исследовании трафика магистральных каналов распределенных сетей.

Доказывается актуальность поставленной задачи, ее научная новизна и практическая ценность, а также формулируются задачи, решаемые в последующих главах работы.

Во второй главе диссертации излагаются результаты теоретической разработки математической модели информационной сети.

Взаимодействия в распределенной сети подчиняются вероятностным законам, и в общем случае сетевой трафик представляет собой случайный процесс {£(*)}, зависящий от времени, и представляющий собой совокупность реализаций случайной функции параметров трафика на интерфейсе сетевого устройства.

Мбит/с

Рис. 1. Ансамбль реализаций случайного трафика на примере интенсивности входящего трафика международного магистрального канала -

ШЫЛЛиЛ-ТеНа

Интерпретируя п -мерную плотность вероятности рассматриваемого случайного процесса рп{хих2»—,*в;'1>*2>—>0> как показатель того, что значения случайной функции параметров трафика £(/) в п моментов времени заключены соответственно в малых полуиигервалах [х1ух1 + Л1),...,[хп,хп + *&„), можно судить о связи между вероятными значениями параметров трафика в п произвольных моментов времени.

Изучение случайных взаимодействий в гетерогенных сетях не сводится к изучению совокупности случайных величин, а имеет некоторые принципиальные особенности, в частности, наблюдаемые при многочисленных экспериментах корреляционные зависимости параметров сетевого трафика. Данное наблюдение обуславливает применение аппарата теории Марковских процессов при разработке математической модели сети.

Применительно к 1Р-сетям, случайный процесс, определяющий изменение сетевого трафика во времени, будет Марковским, если условная функция распределения текущего значения вектора параметров трафика определятся только его предыдущим значением.

Рассматривая в качестве объекта моделирования некоторую сетевую систему, например, совокупность интерфейсов узлового маршрутизатора

магистрального канала, фильтрующего входящий 1Р трафик автономной системы, будем рассматривать последовательную смену состояний 0О в1 ~+в2 -> • • •, где вп=в (/„) состояние системы через п шагов, а

=в ('о) - начальное состояние системы. Определив состояние системы как

вектор параметров, в совокупности учитывающий специфику магистрального сетевого соединения, например, вектор случайных значений интенсивности трафика, разложенный по ТСР портам или протоколам, получим, что полное вероятностное описание поведения рассматриваемой системы определяется совместными конечномерными вероятностями Р{вй,вх,...,вп) при всех п. Для случайного процесса, обладающего свойством Марковости, данная вероятность определяется как

1^-1)- О)

Для магистральных сетевых каналов, представляющих собой суперпозицию большого числа независимых источников трафика, Марковские модели являются наиболее адекватными, поскольку учитывают корреляционные зависимости случайной последовательности, описывающей поступление пакетов ЕР трафика. Кроме этого, поскольку одномерные Марковские модели по определению ограничены вторым порядком временной зависимости, это позволяет реально применять теоретический аппарат на практике, что полностью отвечает цели, поставленной в данной работе. Адекватность теоретической модели и сделанных предположений полностью подтверждается практической апробацией модели, представленной в гл. 4.

В третьей главе представлены результаты разработки метода мониторинга и диагностики сети на основе Марковской модели.

Диагностика состояния информационной сети основывается на использовании ряда допущений, обоснованных результатами анализа характеристик сети и практическим опытом сетевого администрирования.

Как правило, при долговременной эксплуатации сети возможна идентификация режима нормального функционирования сети при котором не наблюдались существенные аномалии. Для краткости назовем такой режим нормальным профилем работы сети. Определение

Нормальным профилем или шаблоном работы сети назовем такую совокупность характеристик рассматриваемой сети в течение определенного промежутка времени, которая соответствует работе всей системы без каких-либо существенных отклонений от нормы.

Для решения проблемы мониторинга и диагностики сети на основе Марковской модели предлагается метод, состоящий из следующих этапов.

1. Формальное определение нормального профиля работы сети в рамках Марковской модели.

2. Разработка алгоритма настройки модели с учетом характеристик нормального профиля параметров работы конкретной сети.

3. Реализация метода обнаружения аномальных режимов функционирования сети как отклонений от нормального профиля работы.

Рассматриваемая сетевая система представляет собой магистральный канал распределенной сети. Система описывается моделью простой цепи Маркова, при этом с учетом экспериментального анализа особенностей трафика магистрального канала предполагается, что вероятности одношаговых переходов тгДб?^ | как и вероятности нахождения системы

в том или ином состоянии, не зависят от времени. В этом случае, общее выражение (1) перепишется в виде

= (2) //=1

Таким образом, предлагается использовать формальное описание модели нормального профиля работы сети с помощью стационарной цепи Маркова.

Для эмпирического определения нормального профиля работы исследуемой сети предлагается следующее решение.

На основе экспериментальной последовательности N состояний системы в0,вх,...,6и в моменты времени 10 <{2 < матрица-столбец

вероятностей начального состояния и стохастическая матрица переходов системы определяются следующим образом:

где - количество в, в состоянии Эк \ N - общее количество наблюдений

где Иу - количество пар в(_х, в,, в которых в,_х находится в состоянии , а д[ - в состоянии ^; - количество пар в(_х, в(, в которых находится в состоянии 91, а в,-в любом другом состоянии 9к,...,9К.

Рис. 2. Алгоритм построения матрицы одношаговых переходов системы

Для определении механизма сравнения теоретического шаблона нормальной работы сети с данными, поступающими с маршрутизатора, выбирается временное «окно» или интервал наблюдения размером N временных отсчетов. При наложении «окна» на непрерывный поток трафика через маршрутизатор, получаем набор значений случайных состояний вектора параметров системы в^ы • Критерием оценки

состояния сетевой системы будет являться вероятность того, что Марковская модель нормального профиля работы системы поддерживает данную последовательность состояний ,...,0,.

Указанная вероятность определяется, исходя из разработанной математической модели, как:

/>(<?,_„,...,*,) =/>(£,_„) (3)

А=НЛМ)

Чем выше значение вероятности, вычисленное в (3), тем вероятнее, что последовательность Д-(д>_1)1 >•■•,0/ является отображением нормальной

работы сети. Аномалии в сети, в свою очередь, должны отрицательно сказаться на полученном значении, тем самым, делая вероятность поддержки моделью последовательности очень малой.

Разработанный метод учета эмпирических данных позволяет апробировать предложенный теоретический подход на любой реально функционирующей сети. При этом в качестве критерия оценки функционирования сети может выбираться вектор параметров, представляющих набор конкретных характеристик исследуемой сети, имеющих практический интерес. Предложенная методика определения состояния сети не зависит от субъективных оценок и основывается на строгих математических критериях, определяющих отклонения наблюдаемого вектора параметров от идеального, полученного в результате эмпирической настройки модели.

В четвертой главе диссертации представлены результаты экспериментальных исследований предложенной математической модели при диагностике магистрального канала телекоммуникационной сети

ншш.

Для получения необходимой информации о функционировании рассматриваемой магистральной сети, была собрана информация о потоках 1Р трафика узлового маршрутизатора ШЖЫе1 - Ж)1Шипе1. В работе использовались данные о трафике, отличающиеся от данных, обычно используемых при подобных исследованиях. Данные собирались в течение месяца, 7 дней в неделю и 24 часа в сутки и составляют около 4300 Гбайт прошедших через маршрутизатор 1Р пакетов. В качестве источника данных

использовался маршрутизатор магистрального канала распределенной сети RUNNet, что позволило исследовать поведение сети в целом, а не отдельного соединения. Экспериментальные данные были получены не на основе сбора пакетной информации, а на применении современной технологии коммутации потоков NetFIow, а также с использованием SNMP статистики работы маршрутизатора. Для предоставления полноценного интерфейса, были разработаны программы-анализаторы, а также платформонезависимый визуализатор на языке Java.

Ниже приводятся результаты эксперимента - последовательности отсчетов случайной суточной интенсивности трафика с маршрутизатора канала RUNNet-NORDUnet и вероятности их поддержки системой. На рисунках log Ps вводится для удобства отображения результатов работы модели. Ps - вероятность поддержки моделью системы, определенная формулой (3).

Мбит/с log Я,

Рис. 3. Последовательность отсчетов интенсивности входящего трафика международного магистрального канала RUNNet и вероятность ее поддержки моделью

На рис. 3 представлена последовательность отсчетов случайной интенсивности входящего трафика магистрального канала ЯтШе^ отвечающая нормальному функционированию сети, а также вероятность поддержки моделью данной последовательности, свидетельствующая о нормальном режиме функционирования сети.

Рис. 4. Последовательность отсчетов интенсивности входящего трафика международного магистрального канала с выделенными аномалиями

и вероятность ее поддержки моделью

На рис. 4 представлена последовательность отсчетов случайной интенсивности входящего трафика магистрального канала ШЖКе^ с выделенной потенциальной операционной аномалией работы сети, связанной с возможной перегрузкой. Малые значения вероятности поддержки моделью выделенного сегмента отсчетов входящего трафика данной последовательности свидетельствуют об аномальном режиме работы сети.

Мбит/с Р,

Рис. 5. Последовательность отсчетов интенсивности входящего трафика международного магистрального канала ЛШЛ^ с выделенными аномалиями и вероятность ее поддержки моделью

Мбит/с

Рис. 6. Последовательность отсчетов интенсивности входящего трафика международного магистрального канала ШЮТ^ с выделенными аномалиями и вероятность ее поддержки моделью

На рис. 5 и рис. 6 приводятся экспериментальные отсчеты интенсивности трафика с выделенными потенциальными аномалиями запрещенного воздействия на сеть, а также вероятности поддержки моделью аномальных режимов функционирования сети, которые существенным образом отличаются от нормальных. Таким образом, продемонстрирована эффективность разработанной модели и метода диагностики состояния 1Р-сети.

Проведенные экспериментальные исследования узлового маршрутизатора глобального объединения сетей МЖ№1 показали, что чувствительность модели обеспечила идентификацию незначительных локальных отклонений интенсивности трафика, что дает возможность экспериментально выявить потенциальные операционные аномалии, а также потенциальные аномалии запрещенного воздействия на сеть. Апробирование модели доказало возможность использования предложенной методики для динамического анализа и диагностики состояния сети.

Заключение

В диссертационной работе проведены теоретические и экспериментальные исследования, выполнена разработка метода динамической диагностики состояния 1Р-сети и доказана адекватность, теоретическая и практическая ценность следующих научных результатов, полученных в работе.

1. На основе исследования и анализа существующих подходов и требований к анализу трафика ЕР-сетей показано, что наиболее актуальной и практически значимой является задача мониторинга сети с целью определения нормальных и аномальных режимов функционирования на основе объективных критериев оценки.

2. Исследован трафик магистрального канала распределенной сети и получены представительные данные о временном, количественном и качественном характере сетевых взаимодействий магистрального телекоммуникационного канала, объединяющего трафик распределенных гетерогенных сетей.

3. Предложенный теоретический подход к моделированию сетевых взаимодействий на основе Марковских процессов является адекватным с теоретической точки зрения, а также обладает свойствами, позволяющими эффективно использовать его при практической реализации.

4. Разработана архитектура системы, объединяющей в себе функции сбора и анализа априорной информации о характеристиках сети, и реализован программный модуль, интегрируемый в существующую систему мониторинга исследуемой сети на основе открытой архитектуры с обеспечением простоты реализации интерфейсов, четкой алгоритмизации задачи и низкой вычислительной ресурсоемкости, связанной с выбранным математическим аппаратом.

5. Предложена методика и реализованы алгоритмы анализа данных реально функционирующих сетевых объединений, что позволяет проводить экспериментальные исследования состояния сети, опираясь на конкретные требования сетевых администраторов.

6. Предложенная теоретическая модель исследована с точки зрения практической применимости и адекватности, которая подтверждена экспериментально при исследовании больших объемов представительных выборок данных, при этом чувствительность метода обеспечила идентификацию локальных отклонений интенсивности трафика, что позволило экспериментально выявить потенциальные операционные аномалии, а также потенциальные аномалии запрещенного воздействия на сеть.

Список публикаций по теме работы

1. Гугель Ю.В., Гуров B.C., Гуров И.П., Семенов H.A., Шалаев М.П.

Оценка качества передачи динамических изображений в формате MPEG по реальным каналам связи // Сборник Международной научно-методической конференции «Телематика 2000». СПб.: СПбГУ ИТМО, 2000. С. 87-88.

2. Васильев В.Н., Гугель Ю.В., Гуров И.П., Шалаев М.П. Анализ характеристик информационного трафика в компьютерных сетях на основе моделей Марковских процессов // Труды X Всероссийской научно-методической конференции «Телематика 2003». СПб.: СПбГУ ИТМО, 2003. С. 285-286.

3. Васильев В.Н., Гугель Ю.В., Гуров И.П., Шалаев М.П. Анализ характеристик информационного трафика в компьютерных сетях на основе моделей Марковских процессов // Известия Вузов. Приборостроение. 2003. Т. 46, №8. С. 19-24.

4. Шалаев М.П. Моделирование трафика в компьютерных сетях на основе Марковских процессов // Вестник конференции молодых ученых СПбГУ ИТМО. Сборник научных трудов 2004. СПб: СПбГУ ИТМО, 2004. С. 262-268.

5. Шалаев М.П. Стохастическое моделирование трафика в компьютерных сетях и оперативное выявление сетевых аномалий // Представлен на IX Санкт-Петербургской международной конференции «Региональная информатика -2004». СПб.: 2004.

6. Шалаев М.П. Математическое моделирование аномалий в компьютерных сетях // Представлен на П конференции молодых ученых СПбГУ ИТМО. СПб.: 2005.

7. Шалаев М.П., Гуров И.П. Теоретическая модель и практическая методика диагностики состояния 1Р-сети // Представлен на Всероссийской научно-методической конференции «Телематика 2005». СПб.: 2005.

Тиражирование и брошюровка выполнены в Центре «Университетские телекоммуникации». Санкт-Петербург, Саблинская ул., 14. Тел. (812)233-46-69 Объем 1 п.л. Тираж 100 экз.

РНБ Русский фонд

2006-4 14656

Оглавление автор диссертации — кандидата технических наук Шалаев, Максим Павлович

ВВЕДЕНИЕ.

ГЛАВА 1. ПРИНЦИПЫ И МЕТОДЫ ДИАГНОСТИКИ СОСТОЯНИЯ IP-СЕТЕЙ.

1.1. Принципы построения IP-сетей.

1.2. Проблемы диагностики состояния сети.

1.3. Методы диагностики состояния сети.,.

Выводы по главе 1.

ГЛАВА 2. МАРКОВСКАЯ МОДЕЛЬ ИНФОРМАЦИОННОЙ СЕТИ.

2.1. Описание информационных сетей на основе моделей случайных процессов .

2.2. Описание информационных сетей на основе Марковских моделей.

Выводы по главе 2.

ГЛАВА 3. МОНИТОРИНГ И ДИАГНОСТИКА СЕТИ НА ОСНОВЕ МАРКОВСКОЙ МОДЕЛИ.

3.1. Нормальный профиль работы сети.

3.2. Настройка модели на основе нормального профиля работы сети.

3.3. Применение Марковской модели для мониторинга и диагностики сети.

Выводы по главе 3.

ГЛАВА 4. ДИАГНОСТИКА МАГИСТРАЛЬНОГО КАНАЛА IP-СЕТИ.

4.1 Система с искусственным трафиком.

4.2 Канал RUNNet-NORDUnet.

Выводы по главе 4.

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Шалаев, Максим Павлович

Активное развитие информационных технологий и расширение объемов информационных услуг основываются в значительной мере на научно-технологических разработках в области телекоммуникационных сетей. По данным исследований [1], приблизительная динамика роста Интернет трафика за последние десять лет составляет 70-150% в год, т.е. в среднем каждый год количество информации, передаваемой через сеть, удваивается. Объем информации, передаваемой через Интернет в России в первом полугодии 2004 г. вырос по сравнению с аналогичным периодом 2003 г. на 245% и достиг 18400 Тбайт [2]. Развитие телекоммуникационных сетей обуславливает необходимость исследований, разработок и внедрения новых технологий.

Объем трафика данных становится соизмеримым с объемом голосового трафика, и данные постепенно становятся основным типом трафика, передаваемого по сетям. Эта фундаментальная перемена ставит целый ряд новых задач перед провайдерами услуг, многие из которых уже прошли "критическую точку", за которой трафик данных превращается в главный рыночный фактор, оказывающий определяющее влияние на экономическую эффективность телекоммуникационной отрасли. По мере того, как трафик данных заполняет Интернет и внутрикорпоративные сети, становится очевидным, что фундаментом развития распределенных сетей, безусловно, являются технологии, основанные на протоколе IP. Развитие сетевых технологий открывает для провайдеров услуг Интернет множество новых возможностей. Исчезают ограничения, когда требовалось обеспечить лишь подключение и оказать услуги низкого уровня. Провайдеры начинают играть все более важную роль в корпоративных сетевых инфраструктурах. Это подразумевает поддержку приложений для глобальных и внутрикорпоративных сетей, интеграцию голоса и данных, а также поддержку различных вариантов доступа - от модемного, до широкополосного - по всей сетевой инфраструктуре общего пользования, включая магистральные каналы, объединяющие глобальные сети.

Существующие исследования в области магистрального сетевого трафика показывают, что сетевые технологии сильно опережают в своем росте теоретическое и аналитическое понимание сетевых взаимодействий. Узкоспециализированные и ограниченные телекоммуникационные задачи прошлых лет хорошо изучены и математически формализованы, в частности, на основе положений теории массового обслуживания [3], что позволяло достаточно точно предсказывать такие характеристики как длины очередей и сетевые задержки. Однако традиционные принципы теоретического анализа и существующие методики не соответствуют необходимым требованиям [4],

5].

Адекватные модели трафика и методики, обеспечивающие получение оценок характеристик сетевых взаимодействий играют важную роль в ускорении эволюции гигабитных и более скоростных сетевых технологий. Теоретический и экспериментальный анализ сетевых процессов приобретает особое значение по сравнению с классическими математическими моделями прошлых лет. По различным причинам, проблема исследования агрегированного Интернет трафика, например, магистральных каналов, на данный момент изучена недостаточно. По мнению автора, основная причина этого заключается в высоком приоритете усилий в операционной области. Провайдеры услуг Интернет главным образом концентрируют свои усилия на каждодневных требованиях клиентов, при этом остается в стороне систематический сбор и анализ данных сетевого трафика. По этим причинам, существующие работы в области исследования сетей явно указывают на пробел между сравнительно успешными экспериментами и исследованиями изолированных систем и неизученными характеристиками сетевых взаимодействий в широком смысле.

Таким образом, теоретическое и экспериментальное исследование характеристик трафика в телекоммуникационных сетях является актуальной научной задачей. Актуальность проблематики информационных технологий подтверждается тем, что 18 ноября 2004 г. Правительство РФ одобрило «Концепцию развития рынка информационных технологий в Российской Федерации», предложенную Мининформсвязи России [6].

Целью работы является построение адекватной модели поведения IP-сети на основе строгих объективных критериев, корректно характеризующей трафик магистральных сетевых каналов, разработка и верификация методики мониторинга и диагностики состояния сети. Основные задачи работы состоят в следующем.

1. Анализ существующих методов оценки характеристик, моделирования и мониторинга сетевого трафика, получение представительных данных мониторинга магистрального канала IP-сети.

2. Теоретическая разработка, построение и исследование модели информационной сети на основе теории Марковских случайных процессов.

3. Разработка метода и практической методики мониторинга сети с использованием предложенной теоретической модели.

4. Практическая реализация и апробирование предлагаемой методики при диагностике магистрального канала сети.

Методы исследования

В соответствии с целями и задачами диссертационной работы, объектом исследования является IP-сеть, а предметом исследования - свойства данной сети. В работе использованы теоретические и экспериментальные методы исследования, включая методы теории вероятности и теории случайных процессов.

В работе выполнена постановка задачи динамического анализа и диагностики состояния IP-сети на основе строгих объективных критериев и получены следующие научные результаты, которые выносятся на защиту.

-61. Теоретическая математическая модель трафика магистрального канала распределенной сети на основе теории Марковских случайных процессов и результаты исследования сетевого трафика и предложенной модели с целью диагностики состояния и выявления аномального функционирования сети.

2. Метод диагностики состояния сети на основе предложенной математической модели.

3. Результаты исследования адекватности модели на синтезированных и реальных входных данных как совокупности параметров, объективно характеризующих состояние распределенной сети.

4. Методика исследования данных магистрального канала реально функционирующей сети как основополагающего фактора принятия решения об адекватности и применимости разработанных моделей.

Практическое значение работы состоит в том, что:

- разработана методика получения данных о сетевом трафике с интерфейсов современных высокопроизводительных сетевых устройств, что позволяет решать задачи распределения сетевых ресурсов, выявления некорректной политики маршрутизации, определения эффективности работы информационных сервисов;

- разработана и внедрена система сбора информации на узловом маршрутизаторе магистрального канала реально функционирующей сети с возможностью динамического изменения количественной и качественной детализации получаемых данных для их дальнейшего аналитического исследования;

- реализован программный модуль, интегрируемый в существующую систему мониторинга исследуемой сети на основе открытой архитектуры с обеспечением простоты реализации интерфейсов, четкой алгоритмизации задачи и низкой вычислительной ресурсоемкости, связанной с выбранным математическим аппаратом;

-7- разработана методика анализа данных реально функционирующих сетевых объединений, что позволяет проводить экспериментальные исследования состояния сети, опираясь на конкретные требования сетевых администраторов.

Достоверность научных положений, выводов и практических рекомендаций диссертационной работы подтверждается детальным анализом особенностей трафика магистральных телекоммуникационных каналов на основе представительных данных мониторинга состояния сети, корректными методиками расчетов, совпадением теоретических и экспериментальных результатов исследований. Реализация результатов работы

Результаты, полученные в диссертации, используются на практике в Санкт-Петербургском филиале Республиканского научного центра компьютерных телекоммуникационных сетей высшей школы при мониторинге магистрального канала телекоммуникационной сети RUNNet, в проекте Санкт-Петербургского филиала Государственного научно-исследовательского института информационных технологий и телекоммуникаций «Информика» и в учебном процессе кафедры Компьютерных Технологий СПбГУ ИТМО по дисциплине «Теория информации и передачи сигналов». Апробация диссертации

Основные положение диссертационной работы докладывались на Международной научно-методической конференции «Телематика 2000» (Санкт-Петербург, 2000); Всероссийской научно-методической конференции «Телематика 2003» (Санкт-Петербург, 2003); I конференции молодых учёных СПбГУ ИТМО, 2004 (Санкт-Петербург, 2004); IX Санкт-Петербургской международной конференции «Региональная информатика» (Санкт-Петербург, 2004); II конференции молодых учёных СПбГУ ИТМО, 2005 (Санкт-Петербург, 2005); Всероссийской научно-методической конференции «Телематика 2005» (Санкт-Петербург, 2005).

Публикации

По теме диссертационной работы опубликовано 7 печатных работ, в том числе три статьи в научных журналах и сборниках и четыре статьи в трудах научных конференций. Структура диссертации

Диссертация состоит из введения, четырех глав и заключения. Список литературы содержит 33 наименования. Работа иллюстрирована 32 рисунками. Работа включает 4 приложения.

Библиография Шалаев, Максим Павлович, диссертация по теме Телекоммуникационные системы и компьютерные сети

1. Odlyzko А. М. Internet traffic growth: Sources and implications. // Optical Transmission Systems and Equipment for WDM Networking 11. 2003. Vol. 5247. P. 1-15.

2. Захарченко В. 245% - рост интернет-трафика в России // Электронный журнал Intemet.ru. 2004. http://www.intemet.ru/index.php?itemid= 10034.

3. Claffy К. Internet Traffic Characterization / Ph.D. thesis. University of CaHfomia, San Diego. 1994.

4. Barford P., Ю1пе J., Plonka D., Ron A. A Signal Analysis of Network Traffic Anomalies / Proceedings of ACM SIGCOMM Internet Measurement Workshop. 2002.

5. Bradford P., Plonka D. Characteristics of Network Traffic Flow Anomalies / Proceedings of ACM SIGCOMM Internet Measurement Workshop. 2001.

6. Министерство информационных технологий и связи Российской Федерации. Концепция развития рынка информационных технологий в Российской Федерации. Проект. / 2005. http://www.minsvyaz.ru/site.shtml?id=3033.

7. Lizcano P. J. et al. MEHARI: a system for analyzing the use of the Internet services// Computer Networks. 1999. Vol. 31.

8. Uhlig S., Bonaventure O. Implications of Interdomain Traffic Characterstics on Traffic Engineering / Infonet group, Unversity of Namur, Belgium. 2001. - 9 7 -

9. Uhlig S., Bonaventure O. Analysis of Interdomain Traffic / Infonet group, Unversity of Namur, Belgium. 2001.

10. Cooperative Association for Internet Data Analysis (CAIDA). Cflowd: traffic flow analysis tool / Technical documentation. 1998.

11. Plonka D. Flowscan: A network traffic flow reporting and visualization tool / Proceedings of the USENIX Fourteenth System Administration Conference LISA XIV. 2000.

12. Keys K. et. al. The Architecture of CoralReef: An Internet traffic monitoring software suite / Cooperative Association for Internet Data Analysis (CAIDA).

13. Hussain A., Heidemann J., Papadopoulos C. A Framework for Classifying Denial of Service Attacks / ACM SIGCOMM. 2003.

14. Jagerman D. L., Melamed В., Willinger W. Stochastic modeling of traffic processes / Frontiers in Queueing: Models, Methods and Problems. 1996.

15. Jagerman D. L., Melamed B. The Transition and Autocorrelation Structure of TBS Processes; Part I: General Theory// Stochastic Models. Vol. 8, No. 2. 1992.

16. Jagerman D., Melamed B. The Transition and Autocorrelations Structure of TES Processes. Part II: Special Cases // Stochastic Models, Vol. 8, No. 3. 1992.

17. Тихонов В. И., Миронов М. А. Марковские процессы / М.: Сов. Радио, 1977.

18. Тихонов В. И. Статистическая радиотехника / М.: Радио и связь, 1982. - 9 8 -

19. Cisco Systems. NetFlow services and applications / Technical documentation. 1999.

20. Кульгин M. Технологии корпоративных сетей. Энциклопедия / СПб.: Издательство «Питер», 1999.

21. Кульгин М. В. Коммутация и маршрутизация 1Р/1РХ-трафика / М.: КомпьютерПресс, 1998.

22. Брентон К. Разработка и диагностика многопротокольных сетей / М.: Издательство «Лори», 1999.

23. Городецкий А. Я., Заборовский В. Информатика. Фрактальные процессы в компьютерных сетях: Учеб. Пособие / СПб.: Изд-во СПбГТУ, 2000.

24. Hlavac Н., Kotsis С , Steinkellner Traffic Source Modeling / Institute of Applied Computer Science and Information Systems, University of Vienna. 1999.

25. Kulkarni L. A., Li S. Q. Measurement-Based Traffic Modeling: Capturing important statistics//Journal of Stochastic Modeling. 1998. Vol. 14.

26. Sang A., Li S. Q. A Predictability Analysis of Network Traffic // Proceedings of IEEE INFOCOM. 2000.

27. Li S.Q., Park S., Arifler D. SMAQ: A measurement-based tool for traffic modeling and queueing analysis. Part I: Design methodologies and software architecture // IEEE Communications Magazine. 1998. Vol. 36, No. 8. P. 56-65. - 9 9 -

28. Lombardo A., Morabito G., Schembra G. Statistical traffic modeling and guaranteed service disciplines: a performance evaluation paradigm // Computer Networks. 2001. Vol. 36. P. 579-595.

29. Che H., Li S. Q. Fast algorithms for measurement-based traffic modeling // IEEE Journal on Selected Areas in Communications, 1998.

30. Hwang C. L., Li S. Q. On the convergence of traffic measurement and queueing analysis: A Statistical-Match And Queuing (SMAQ) Tool // IEEE/ACM Transactions on Networking, 1997.

31. Salvador P., Nogueira A., Valadas R. Modeling local area network traffic with Markovian traffic models / Institute of Telecommunications, University of Aveiro, Portugal. 2001.

32. Jung J., Krishnamurthy В., Rabinovich M . Flash Crowds and Denial of Service Attacks: Characterization and Implications for CDNs and Web Sites // In Proceedings of the World Wide Web Conference. 2002.