автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Разработка моделей выявления взаимозависимых факторов в телекоммуникационном графике на основе регрессионно-когнитивных графов
Автореферат диссертации по теме "Разработка моделей выявления взаимозависимых факторов в телекоммуникационном графике на основе регрессионно-когнитивных графов"
На правах рукописи Мелик-Шахназаров Артём Витальевич
РАЗРАБОТКА МОДЕЛЕЙ ВЫЯВЛЕНИЯ ВЗАИМОЗАВИСИМЫХ ФАКТОРОВ В ТЕЛЕКОММУНИКАЦИОННОМ ТРАФИКЕ НА ОСНОВЕ РЕГРЕССИОННО-КОГНИТИВНЫХ ГРАФОВ
Специальность 05 13 13 Телекоммуникационные системы и компьютерные сети
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Самара, 2007
003069786
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Поволжская государственная академия телекоммуникаций и информатики
Научный руководитель ■
доктор технических наук, профессор Кораблин М А
Официальные оппоненты -
доктор технических наук, профессор Карташевский В Г ,
кандидат технических наук, доцент Симановский Е А
Ведущая организация -
Институт проблем управления сложными системами РАН
Защита диссертации состоится « // » ___2007 г в час
на заседании диссертационного совета Д 219 003 02 при Поволжской государственной академии телекоммуникаций и информатики (ПГАТИ) по адресу 443010, г Самара, ул Л Толстого, 23
С диссертацией можно ознакомиться в библиотеке ГОУВПО
ПГАТИ
Автореферат разослан « _»__2007г
Ученый секретарь
диссертационного совета Д 219 003 02,
дтн, доцент П Мишин Д В
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы
Количество видов телекоммуникационных услуг постоянно растет, а их объемы варьируются от клиента к клиенту, изменяются во времени, подвержены сезонным изменениям и т п Взаимосвязи между объемами услуг разных видов неочевидны существуют ли скрытые связи между услугами, какова «сила» этих связей и к чему приведут возможные изменения объемов оказываемых услуг*7 Ответ на эти и подобные вопросы имеет вполне определенное практическое значение, позволяющее предсказать изменение объемов и, соответственно, экономические эффекты, свойственные той или иной ситуации, складывающейся на рынке телекоммуникационных услуг
Одна из современных парадигм анализа данных, направленная на выявление скрытых закономерностей, реализуется при помощи методов информационной технологии Data Mining (Интеллектуальный Анализ Данных) Эта технология относится к мультидисциплинарной области, возникшей и развивающейся на основе достижений статистики, распознавания образов, методов искусственного интеллекта, теории баз данных Большой вклад в развитие этой технологии внесли работы М Бонгарда, Ф Розенблатта, У Мак-Каллока, У Питса, Е Фикса, Д Ходжеса, Г Лбова, Р Фогеля, А Ивахненко, JI Бреймана, Т Рипли, Т Фрейдмана
Методы технологии Data Mining широко применяются для анализа трафика в телекоммуникационных компаниях Наиболее известными являются система MrneSet и разработки С Рамакришнана, А Мейдана, Б де Виля, В Дюка, М Куприянова, а также компаний SPSS, StatSoft, WizSoft, Megaputer, BaseGroup, Microsoft Вместе с тем эти разработки не позволяют в полной мере реализовать выявление скрытых закономерностей в телекоммуникационном трафике, что ограничивает возможности их использования для достоверного прогнозирования объемов предоставленных услуг
В связи с этим, решение проблемы разработки моделей выявления скрытых закономерностей в телекоммуникационном трафике, позволяющих рационально перераспределять ресурсы компании-оператора, является актуальной
Объектом исследования являются данные биллинговой системы телекоммуникационной компании
Целью работы является построение моделей для анализа информации, хранящейся в биллинговой системе, обеспечивающих рациональное использование ресурсов компании-оператора
Для достижения поставленной цели требуется решить следующие задачи
1 Провести анализ существующих биллинговых систем
2 Выявить наиболее перспективные алгоритмы Data Mining для анализа трафика биллинговой системы
3 Проанализировать выявленные алгоритмы с целью разработки моделей, которые позволят наиболее эффективно решать задачу прогнозирования трафика
4 Разработать алгоритм анализа и прогноза объемов телекоммуникационных услуг
5 Провести моделирование, основанное на предложенном алгоритме и реальных данных биллинговой системы, и сделать выводы о целесообразности использования предложенных моделей
Методы исследования
Основные теоретические и экспериментальные исследования диссертационной работы выполнены с применением методов математической статистики, когнитивного моделирования, регрессионного анализа и использованием аналитической системы PolyAnalyst (Megaputer)
Научная новизна заключается в следующем
Предложен новый алгоритм регрессионно-когнитивного моделирования, который позволяет производить прогнозирование объема трафика телекоммуникационной компании на основе биллингового файла На базе предложенного алгоритма разработана модель, основанная на концепции когнитивных графов
Практическая ценность работы
Представленное регрессионно-когнитивное моделирование позволит телекоммуникационным компаниям эффективно анализировать биллинговые файлы и выстраивать работу, ориентированную на качественное предоставление услуг клиентам для различных тарифных планов на этапе заключения договора
Реализация результатов работы
Разработанный в работе алгоритм регрессионно-когнитивного моделирования принят к использованию Самарским филиалом ОАО «ВолгаТелеком», внедрен в учебный процесс в Поволжской государственной академии телекоммуникаций и информатики г Самара
Апробация работы
Основные результаты по теме диссертационного исследования докладывались на Международной научно-технической конференции
"Проблемы техники и технологии телекоммуникаций" (Самара, 2006) Научные и прикладные результаты диссертационной работы опубликованы в 5 статьях в периодических научных изданиях Публикации
Основное содержание диссертации отражено в 6 научных изданиях
На защиту выносятся
модель прогнозирования объемов телекоммуникационных услуг, построенная на основе регрессионно-когнитивного анализа,
алгоритм реализации вышеупомянутой модели применительно к реальным данным оператора связи,
результаты применения модели для прогнозирования объемов телекоммуникационных услуг Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложений Основная част ь работы содержит 136 страниц машинописного текста, 44 рисунка, 5 таб тиц Список литературы содержит 82 наименования
СОДЕРЖАНИЕ РАБОТЫ Введение
Здесь обоснована актуальность темы, приведен обзор работ по теме диссертации, сформулированы цель и основные задачи исследования, описан состав и структура работы, определена научная новизна
Глава 1 посвящена обзору биллинговых систем и структуре их построения В ней обозначены цели исследования телекоммуникационного трафика
Биллинговые системы представляют собой комплексы, работающие во взаимосвязи с коммутатором и другими внешними устройствами, вычисляющие стоимость услуг связи для каждого клиента, хранящие информацию обо всех тарифах и прочих стоимостных характеристиках, которые используются телекоммуникационными операторами для выставления счетов абонентам и взаиморасчетов с другими поставщиками услуг На рисунке 1 представлены «стандартные» функции биллинговых систем
Управление трафиком на сегодняшний день является одной из центральных задач телекоммуникационного оператора Аналитическое управление позволит оператору найти в своем трафике такие зависимости, которые ранее не учитывались, но правильное использование которых позволит установить взаимосвязи между предлагаемыми
услугами Использование этих взаимосвязей позволит оператору создать новые модели, которые скрыты в файлах данных и использование которых может быть гарантом успешной работы на телекоммуникационном рынке
Рисунок ] Функции биллинговой системы
Глава 2 посвящена сравнительному анализу использования методов Data Mining (интеллектуальный анализ данных), для выявления скрытых закономерностей в информации о трафике, содержащейся в биллинговой системе
В телекоммуникациях технология Data Mining используется для решения различных задач
- Сегментация рынка, с помощью которой компании могут создавать «маркетинговые сегменты», объединяя клиентов в группы по предпочтениям и запросам, используемым услугам и их объемам,
- Построение профиля абонента компании для выработки целенаправленной маркетинговой политики, обеспечения лояльности клиента,
- Повышение эффективности рекламных кампаний путем выделения целевой аудитории (Direct marketing),
- Выявление групп нелояльных абонентов
- Персонализация содержания web-сайта оператора для привлечения и удержания посетителей сайта, увеличения продаж услуг через Интернет
- Управление телекоммуникационным трафиком и перераспределение услуг, предоставляемых телекоммуникационной компанией
- Предоставления данных для CRM и ERP систем
Одной из актуальных задач для любого телекоммуникационного оператора является задача управления трафиком, связанная с перераспределением услуг Решение данной задачи позволит, например, решать такую проблему, как загруженность каналов Задачу можно решить, используя эволюционное программирование, имеющее в своем составе мощный аналитический аппарат
Глава 3 посвящена исследованию нового класса регрессионно-когнитивных моделей (РКМ) В ней приведены основные принципы моделирования при помощи данной методологии, описаны системные подходы, связанные с прогнозированием объемов трафика телекоммуникационной компании на основе данных биллинговой системы
Когнитивный подход к поддержке принятия управленческих решений ориентирован на то, чтобы активизировать интеллектуальные процессы эксперта и помочь ему зафиксировать свое представление о проблемной ситуации в виде формальной модели В качестве такой модели обычно используется так называемая когнитивная карта ситуации (А Кулинич, Ф Роберте, Д Хейс), которая представляет известные эксперту основные законы и закономерности наблюдаемой ситуации в виде ориентированного знакового графа, в котором вершины графа - это факторы (признаки, характеристики ситуации), а дуги между факторами - причинно-следственные связи
Графовая модель такой карты характеризуется наличием вершин-факторов и дуг, помеченных знаками «+» и «-» Такая разметка определяет положительные и отрицательные связи между факторами Пример когнитивной карты некоторой ситуации для рынка телекоммуникационных услуг представлен на рисунке 2 Более детальная модель требует перехода на следующий уровень структуризации информации, тек собственно когнитивной модели Цель когнитивного моделирования заключается в генерации и проверке гипотез о функциональной структуре наблюдаемой ситуации, способной объяснить поведение системы
Уровень прибыли
Рисунок 2 Пример когнитивной карты ситуации
На рисунке 3 отражена схема взаимодействий когнитивного моделирования, в основу которого положены входные факторы С учетом этих факторов создается модель исследуемой ситуации как совокупность гипотез, способных объяснить развитие системы Кроме того, создаются гипотезы, способные объяснить механизмы влияния между теми или иными факторами системы и установить причинно-следственные связи между ними
Рисунок 3 Схема взаимодействий когнитивного моделирования
Такие взаимосвязи, как правило, не очевидны, поэтому возникает вопрос существуют ли скрытые связи между различными факторами, какова «сила» этих связей и к чему приведут возможные количе-
ственные изменения для каждого из факторов Ответ на эти и подобные вопросы имеет вполне определенное практическое значение, позволяющее предсказать экономические эффекты, свойственные той или иной ситуации, складывающейся на рынке телекоммуникационных услуг
Для анализа и прогнозирования взаимовлияний телекоммуникационных факторов предлагается использовать методологию регрессионно-когнитивного моделирования, которая дополняет когнитивный граф ситуации механизмами регрессионного анализа Весь процесс регрессионно-когнитивного моделирования можно разделить на несколько этапов, представленных на рисунке 4
Рисунок 4 Этапы регрессионно-ког нитивногомоделирования
На первом этапе регрессионно-когнитивного моделирования происходит представление всех имеющихся факторов в виде когнитивной карты, которая должна отражать общие представления о ситуации в виде опредепенных семантических категорий, под которыми понимаются признаки, факты, события, понятия, имеющие отношение к конкретной ситуации
На следующем этапе на основе имеющихся данных проводится количественный анализ взаимных влияний в сконструированном полносвяшом графе Для этого создается регрессионная модель для каждого из имеющегося набора факторов
Vф = 1,п, VJ|J = Ьи, ехерг г = ), п
\ф =фс+ у . ф П)
I ¡6 у *
Здесь представлена линейная модель из п факторов, Ф] б, Фг б, Фп6 - базовые значения факторов (свободные члены регрессий), к —
коэффициенты влияния Например, определяет влияние фак-
тора Ф| на фактор Ф2
В общем случае влияние связей и цепочек когнитивного графа исследуемой системы, реализуемое через коэффициенты влияния кф _>,/> ■. определенные статистическими методами, должны учитывать
и временные задержки изменения зависимых и влияемых факторов Такие задержки в простейшем случае можно рассматривать как одинаковые для всех факторов, определяемые из практических соображений, связанных с поставленной задачей В этом случае моделируемые процессы приобретают характер временных рядов, когда каждое прогнозируемое значение любого фактора отстоит от его предыдущего значения на величину М - интервала дискретизации, свойственного системе (так называемый принцип «АЫ в имитационном моделировании) Введение этого аспекта преобразует систему уравнений (1) в систему динамических процессов, анализ которых требует в общем случае использования методов имитационного моделирования В этом состоит т ретий этап исследования (см рисунок 4) Этот этап должен демонстрировать динамику развития РКМ, показывая хронологическую «борьбу» тенденций для сигнальной формы графа
Для РКМ, включающей фактор-вершину времени (0 система уравнений (1) преобразуется к следующему виду
V/// = 1,лт, \/J/^ = l,n, cxept l = J,
}у Iй I
/
В общем случае линейная компонента = ( Для
многих ситуаций оказывается слишком упрощенной (недостоверной) Поэтому хронологический аспект РКМ целесообразно реализовать с использованием обобщенной авторегрессии, которая связывает текущие значение фактора ф/ ({) с предыдущим его значением Ф1 (( — Д/), а в более сложных случаях с предыдущими значениями
Ф1 (г)=фг(/-фх(г,Ф1 (/-Ш)]
Здесь Г-время, к - порядок авторегрессии Ограничиваясь значениями к-1, систему хронологических взаимовлияний факторов можно представить следующей линейной моделью
ехери^,
У=1 у
Здесь коэффициент кф^ф определяет авторегрессию Ф[ (/) на Ф (/ - А/), реализуемую петлей обратной связи
Общая постановка задачи целевого управления в рамках РКМ связана с выделением целевой вершины-фактора, значение которого желательно повысить, понизить или «вписать» в определенный диапазон значений При этом структура РКГ остается прежней, а задача поиска заключается в таком подборе коэффициентов - дуг графа, при котором реализуется желаемая цель
Методология поиска решения в сочетании с РКМ в первую очередь полезна для моделирования варианта принимаемого решения, тактики или стратегии управления Конструируемая модель поиска решения в совокупности с моделями РКМ позволит найти оптимальный вариант решения перехода от реального значения какого-либо фактора к желаемому, который может быть использован при принятии соответствующего решения
Глава 4 посвящена использованию предлагаемой методологии РКМ для обработки реальных данных биллинговой системы Здесь получены конкретные результаты прогнозирования, на основе которых компания-оператор может выстраивать свою работу более эффективно Целью данной главы является анализ прогностических возможностей регрессионно-когнитивного моделирования на предмет определения перспективности его использования для прогнозирования объемов телекоммуникационных услуг
В работе был использован анализ биллингового файла для прогнозирования объемов четырех видов услуг: международная связь (М), местная связь (МС), передача данных (ПД) и Интернет (И) с учетом фактора времени, в качестве которого выступает месяц предоставления услуги (Месяц).
Пример структуры подученного файла в системе Ро1уАпз1уз1, в которой будет реализован последующий анализ, представлен на рисунке 5, где значения по видам услуг отражены в рублях.
Ы Таблица ■ Тл6л._1
' ИС1е1 I ЭяСЛ | ЧИСКИо'
г 1 1иш ГП'Л 1 <«( Л
? 13М56 }79Г8 1 зггш
3 3 Же 21 1ЗДГ0О ЗВЗ.'З 1220318
1 195575 137000 773^5 0
5 пьеса 103 №4?
б й 1Ш77 Ш« 0
/ ! 0
е 1547*;» 25в; э а
.51 Ё 067 ле?й<1 в
и__ М- __3941 __ 1ВЯ4И_____ __а_
Рисунок 5. Структура биллингового файла в системе Ро1уАпа1укС
На рисунке 6 приведен когнитивный граф, иллюстрирующий возможные связи между услугами. Двунаправленные стрелки иллюстрируют взаимные влияния факторов друг на друга. Для количественного а ими за таких влияний, используется линейная регрессионная модель вида:
И = Ил + км-,и ■ М + кмс_и ■ МС +■ кщьШ ■ ПД + к■ Месяц, М - к„^м ■ И + М3 + кмс-,й ■ МС+кГО(_м ■ ПД + кмес„,^м - Месяц," I МС = ^мс- ■ И + мс ' А"/ + Шц + Аяд-ме ■ Щ + ] ^'м.-си-мс ' Месяц:
ПД - ки^пд ■ И + кду-.вд ■ М + кМ(--.пл - МС + Г1Д, + I, кль-сщ^пя ■ Месяц
где Мб, Иб, МСб, ПДб - базовые объемы по видам услуг (свободные члены регрессий), к - коэффициенты влияния. Например, км-определяет влияние объемов международной связи на объемы услуг Интернета.
Рисунок 6. Полносвязный граф, иллюстрирующий возможные связи между услугами с учетом фактора времени
Для построения модели РКМ при помощи системы Ро1уЛпа1уз( конструируются линейные регрессионные уравнения для каждой из вершин графа, за исключением вершины «Месяц». Для этого анализируются данные биллинговой системы, поочередно задавая необходимую вершину И все факторы, от которых может зависеть целевой фактор.
В качестве примера на рисунке 7 представлен текстовый отчет выполненного регрессионного анализа в системе Ро1уАпа1уБ1 для вершины Интернет (И).
Из отчета для вершины «Интернет» видно, что на нее влияют все «иды услуг, но не влияет месяц предоставления услуги, причем наибольшее положительное влияние оказывает «Местная связь», также положительная сила влияния и у «Передачи данных», а «Междугородняя связь» оказывает отрицательное влияние.
Тексгодьш 01461 - 1_Н_и*иерне1
• найдено правило:
интернет- ■ 26?£№(3 -0,092964* междугородняя связь + 0,359721* местная с»язь + О.ОббСМбЭ ' передаче данных
стандартная ошие*з Я здиагей ; стандартное откл. обработано точек индекс - с я сводный член . стд откл. сооб члена
Фаглоркл.
0,5632 0.67221 1,372е+05 800
177
■ 14МЯ каэо егтд откл. Р.тйЛю част сумма ■ ■
между ГОГШДняп сарЭЬ .0.09^6 0.01Э77 3.752 0.Й31011
гцг-естнар связь 0,3537 0.04563 59,; В.0694 з
передача данных 11.05505 0,037) 7,161 0,002666
Рисунок 1. Текстовый отчет регрессионного анализа для еершины «Интернет» с учетом фактора «Месяц»
Результирующие значения базовых объемов и коэффициентов сведены в таблицу 1, где по диагонали расставлены базовые объемы услуг, а в остальных клетках коэффициенты линейных связей
Таблица 1 Регрессионные коэффициенты линейных связей и базовые
значения полученной регрессионной модели
и м МС ПД Месяц
и 28704 3 -0 092964 0 359721 0 0560489 0
м -0 12894а 114059 0 831809 0 -4651 8
МС 0 193472 0120125 18804 -0 0349213 2884 39
ПД 0 0398273 0 0 20869 -5312 49
Полученная регрессионно-когнитивная модель позволяет на основе общей информации проводить прогнозирование объемов услуг с учетом временного фактора, т е появляется возможность прогнозирования величины той или иной услуги для любого месяца в году, на который необходимо сделать прогноз Система (Иб, Мб, МСб, ПДб) рассматривается как планируемые объемы услуг, реализуемые в определенный период времени
На последующих рисунках приведены примеры перераспределения услуг, отраженных при помощи графика Кивиата Данные рисунки иллюстрируют сочетание плановых объемов услуг (Иб, Мб, МСб, ПДб) и ожидаемых результатов такого планирования (И, М, МС, ПД), предсказанных системой Кроме того, на представленных ниже рисунках отражены соответствующие суммарные объемы по всем видам услуг £б = (Иб + Мб + МСб + ПДб) и Е = (И + М + МС + ПД)
Рисунок 8 иллюстрирует вариант, когда скрытые стационарные связи между объемами услуг в первом месяце увеличивают объем £ по сравнению с Хб, т е обеспечивают дополнительную прибыль за счет перераспределения плановых объемов по видам услуг Здесь заявленный нулевой объем местной связи (МС) вызывает «перетекание» объемов Интернета (И) и междугородней связи (М) в местную связь, т к услуги И и М нуждаются в МС
Рисунок 9 иллюстрирует обратную ситуацию, связанную с уменьшением £ по сравнению Бб Кроме того, при тех же базовых значениях с учетом того, что прогнозирование проводится для девятого месяца, значения объемов И и М уменьшаются, что опять же связано с их физической зависимостью от МС Также следует отметить, что объем услуги ПД с увеличением месяца также уменьшается, что может быть связанно с сезонной зависимостью этого фактора
<Нб Мб М('б ГТДо) = (¿8-04 134916 (I 4068^> 2о = 21~Л0о
Я1 М ЫГ ПД)= (1&-5—НОоо! 4162') 2 = 24&"0-5
Рисунок 8 Пример перераспределения услуг в январе
(По Ма МГс ДДв) = (2?"04 П£."1<ч.о 40о=!<) 2о = 21~306
01 М М<" = <4440 "010 1121) 2 = "ц.
Рисунок 9 Пример перераспределения услуг в сентябре
Заключение
В заключении сформулированы результаты работы Были решены следующие задачи
- Обозначена необходимость эффективного управления телекоммуникационным трафиком с целью увеличения доходов оператора связи
- Проведен анализ существующих биллинговых систем, рассмотрены возможности сбора и хранения информации о трафике
- Осуществлен сравнительный анализ алгоритмов выявления скрытых закономерностей и предложен наиболее перспективный для анализа телекоммуникационного трафика
- На основании выбранного алгоритма построена модель, апробированная на данных биллинговой системы оператора связи, и сделаны выводы о возможности управления трафиком с ее помощью
Публикации
1 Кораблин М А , Мелик-Шахназаров А В , Салмин А А Методы регрессионно-когнитивного анализа в задачах прогнозирования данных биллинговой системы России [Электронный документ] //Исследовано в России - С 785-792 Режим доступа
http //zhurnal gpi ruferticles/2005/075 pdf - 02 04 2007
2 Кораблин M А , Мелик-Шахназаров А В , Салмин А А Регрессионно-когнитивные графы в задачах анализа биллинговых систем // Информационные технологии, 2005,№ 8, стр 35-39
3 Кораблин М А , Мелик-Шахназаров А В , Салмин А А Оценка лояльности клиентов телекоммуникационной компании на основе байесовского подхода // Информационные технологии, 2006,№ 4, стр 63-67
4 Кораблин М А , Мелик-Шахназаров А В , Салмин А А Байесовский подход для оценки лояльности клиентов телекоммуникационной компании // Инфокоммуникационные технологии, 2006, том 4, № 2, стр 85-90
5 Львов А А , Мелик-Шахназаров А В Биллинг как организация бизнеса // Инфокоммуникационные технологии 2005 - с 42-44
6 Мелик-Шахназаров А В Место аналитического CRM в потоке различных решений и модулей управления взаимоотношениями с клиентами телекоммуникационной компании // Материалы VII международной научно-технической конференции "Проблемы техники и технологии телекоммуникаций", Самара, ПГАТИ, 20-23 ноября 2006, с 162-164
Подписано в печать 13 04 07 Формат 60х84'/|6 Бумага писчая № 1 Гарнитура Тайме Заказ 019174 Печать оперативная Уел печ л 0,93 Физ печ л 1,00 Уч-изд л 0,52 Тираж! 00 экз Бесплатно
Типография государственного образовательного учреждения высшего профессионального образования «Поволжская государственная академия телекоммуникаций и информатики» 443010, г Самара, ул Л Толстого,23 Тел/факс (846) 339-11-11,339-11-81
Оглавление автор диссертации — кандидата технических наук Мелик-Шахназаров, Артем Витальевич
ВВЕДЕНИЕ .;.
ГЛАВА 1. ТЕЛЕКОММУНИКАЦИОННЫЙ ТРАФИК В БИЛЛИНГОВЫХ СИСТЕМАХ.
1.1. Обзор биллинговых систем.
1.2. Основные функции и архитектура биллинговых систем.
1.3. Требования, предъявляемые к биллинговым системам.
1.4. Основные процессы и организация биллинга.
1.5. Телекоммуникационный трафик и задачи аналитического управления
1.6. Выводы.
ГЛАВА 2. КЛАССИФИКАЦИЯ МЕТОДОВ ВЫЯВЛЕНИЯ СКРЫТЫХ ЗАКОНОМЕРНОСТЕЙ ПРИМЕНИТЕЛЬНО К ТЕЛЕКОММУНИКАЦИОННОМУ ТРАФИКУ.
2.1. Определение Data Mining.
2.2. Классификация задач Data Mining.
2.3. Этапы исследования данных с помощью методов Data Mining.
2.4. Методы Data Mining.
2.4.1. Кластеризация.
2.4.2. Ассоциация.
2.4.3. Деревья решений.
2.4.4. Метод «ближайших соседей».
2.4.5. Нейронные сети.
2.4.6. Нечеткая логика.
2.4.7. Генетические алгоритмы.
2.4.8. Эволюционное программирование.
2.4.9. Визуализация.
2.5. Практическое использование Data Mining в телекоммуникационных системах.
2.6. Выводы.
ГЛАВА 3. РЕГРЕССИОННО-КОГНИТИВНЫЕ МОДЕЛИ ДЛЯ АНАЛИЗА БИЛЛИНГОВЫХ СИСТЕМ.
3.1. Концепция когнитивного моделирования.
3.2. Регрессионно-когнитивные модели (РКМ).
3.3. Регрессионный анализ телекоммуникационных данных.
3.4. Поиск решения для РКМ.
3.5. Выводы.
ГЛАВА 4. ОЦЕНКА ВЗАИМОВЛИЯНИЙ И ПРОГНОЗИРОВАНИЕ ОБЪЕМОВ ТЕЛЕКОММУНИКАЦИОННЫХ УСЛУГ НА ОСНОВЕ РКМ.
4.1. Процесс сегментирования в телекоммуникациях.
4.2. Прогнозирование объемов телекоммуникационных услуг на основе РКМ
4.2.1. РКМ для прогнозирования объема трафика телекоммуникационной компании.
4.2.2. РКМ для прогнозирования объема трафика телекоммуникационной компании с учетом фактора времени.
4.2.3. РКМ для прогнозирования объемов трафика клиентов телекоммуникационной компании.
4.3. Выводы.
Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Мелик-Шахназаров, Артем Витальевич
Количество видов телекоммуникационных услуг постоянно растет, а их объемы варьируются от клиента к клиенту, изменяются во времени, подвержены сезонным изменениям и т.п. Взаимосвязи между объемами услуг разных видов неочевидны: существуют ли скрытые связи между услугами, какова «сила» этих связей и к чему приведут возможные изменения объемов оказываемых услуг. Ответ на эти и подобные вопросы имеет вполне определенное практическое значение, позволяющее предсказать изменение объемов и, соответственно, экономические эффекты, свойственные той или иной ситуации, складывающейся на рынке телекоммуникационных услуг.
Одна из современных технологий анализа данных, направленная на выявление скрытых закономерностей, реализуется при помощи методов современной информационной технологии Data Mining (Интеллектуальный Анализ Данных). Одним из её основателей является Г. Пиатецкий-Шапиро. Data Mining является мультидисциплинарной областью, возникшей и развивающейся на основе достижений статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. Большой вклад в развитие внесли работы М. Бонгарда, Ф. Розенблатта, Мак-Каллока, Питса, Е.Фикса, Д. Ходжеса, Г.С. Лбова, Фогеля (Fogel), Уолша (Walsh), А.Г. Ивахненко, Бреймана (Breiman), Рипли (Repley), Фрейдмана (Freidman). Наиболее рельефно возможности ИАД характеризуют механизмы классификации данных и выявления цепочек. Классификация позволяет выявить классообразующие признаки, по которым тот или иной объект можно отнести к заданному классу. Например, признаки устойчивости (надежности, стабильности) клиента. Выявление цепочек (событий или связанных факторов) позволяет установить связи между факторами, которые на первый взгляд не связаны друг с другом. Такие цепочки могут быть хронологическими или причинно-следственными, связи между элементами цепочек могут определяться на различных основах: вероятностной, корреляционной, регрессионной и т.п.
В настоящее время различные методы технологии Data Mining широко применяются для анализа трафика в телекоммуникационных компаниях. Наиболее известными являются разработки Сриканта Рамакришнана (Ramakrishnan Srikant), А. Мейдана, Б. де Виля, В. Дюка, М. Куприянова, а также компаний SPSS, StatSoft, WizSoft, Megaputer, BaseGroup, Microsoft. Однако эти разработки обладают недостатками (невысокая точность прогнозов, низкая скорость работы, высокая стоимость), что не позволяет широко и в полной мере использовать их для прогнозирования объемов трафика предоставляемых услуг. Кроме того, невысокая точность прогноза препятствуют применению существующих аналитических систем для интеллектуального анализа данных и её использование в биллинговых системах для анализа объемов услуг, предлагаемых клиентам. В связи с этим, решение проблемы, связанной с перераспределением имеющихся ресурсов у компании-оператора в телекоммуникационных системах, является актуальным.
Объектом исследования является биллинговый файл телекоммуникационной компании.
Целью работы является разработка метода анализа биллинговой системы в телекоммуникациях с использованием технологии Data Mining (интеллектуального анализа данных) для эффективного управления трафиком.
Для достижения поставленной цели требуется решить следующие задачи:
1. Провести анализ существующих биллинговых систем.
2. Выявить наиболее перспективные алгоритмы технологии Data Mining для анализа трафика биллинговой системы.
3. Проанализировать выявленные алгоритмы с целью определения лучшего из них.
4. Разработать алгоритм анализа и прогноза файла данных биллинговой системы.
5. Провести моделирование, основанное на предложенном алгоритме и реальных данных биллинговой системы, и сделать выводы на полученных результатах о целесообразности использования предложенной методологии.
Методы исследования
Основные теоретические и экспериментальные исследования диссертационной работы выполнены с применением методов математической статистики, когнитивного моделирования, регрессионного анализа; аналитической системы Ро1уАпа1уз1 (Ме£арШ;ег).
Научная новизна заключается в следующем:
Предложен новый алгоритм регрессионно-когнитивного моделирования, который позволит производить прогнозирование объема трафика телекоммуникационной компании на основе биллингового файла.
Практическая ценность работы
Представленное регрессионно-когнитивное моделирование позволит телекоммуникационным компаниям эффективно анализировать свои биллинговые файлы и выстраивать работу, ориентированную на качественное предоставление своих услуг клиентам и увеличение прибыли.
Реализация результатов работы
Разработанный в работе алгоритм регрессионно-когнитивного моделирования принят к использованию Самарским филиалом ОАО
ВолгаТелеком», внедрен в учебный процесс в Поволжской государственной академии телекоммуникаций и информатики г. Самара.
Апробация работы
Основные результаты по теме диссертационного исследования докладывались на Международной научно-технической конференции "Проблемы техники и технологии телекоммуникаций" (Самара, 2006) . Научные и прикладные результаты диссертационной работы опубли-кованы в 5 статьях в периодических научных изданиях.
Публикации
Основное содержание диссертации отражено в 6 научных изданиях.
На защиту выносятся
- модель прогнозирования объемов телекоммуникационных ус-луг, построенная на основе регрессионно-когнитивного анали-за;
- алгоритм реализации вышеупомянутой модели применительно к реальным данным оператора связи;
- результаты применения модели для прогнозирования объемов телекоммуникационных услуг.
Структура и объём работы
Диссертационная работа состоит из введения, четырёх глав, заключения, списка литературы и приложений. Основная часть работы содержит 116 страниц машинописного текста, 44 рисунка, 3 таблицы. Список литературы содержит 82 наименования.
Заключение диссертация на тему "Разработка моделей выявления взаимозависимых факторов в телекоммуникационном графике на основе регрессионно-когнитивных графов"
Выводы и положения диссертационного исследования Мелик-Шахназарова A.B. применяются в процессе выявления факторов, влияющих на объёмы потребления услуг, и способствуют своевременному принятию управленческих решений по поддержанию уровня рентабельности.
Заместитель директора филиала по информационным технологиям
АКТ О ВНЕДРЕНИИ В УЧЕБНЫЙ ПРОЦЕСС
Результаты диссертационной работы Мелик-Шахназарова Артёма Витальевича «Разработка моделей выявления взаимозависимых факторов в телекоммуникационном трафике на основе регрессионно-когнитивных графов»:
- Регрессионно-когнитивная модель для анализа и прогнозирования объемов телекоммуникационных услуг;
- Алгоритм выявления скрытых закономерностей в больших массивах данных внедрены и используются в учебном процессе на кафедре электронной коммерции факультета информационных систем и технологий, в дисциплинах «Обработка данных», «Интеллектуальный анализ данных», «Инструментальные средства фондового рынка».
Зав. кафедрой электронной коммер] д.э.н., профессор
-
Похожие работы
- Формирование оценки лояльности клиентов телекоммуникационной компании на основе байесовского подхода
- Иерархические нечеткие многоколониальные муравьиные алгоритмы и комплекс программ оптимизации телекоммуникационных сетей нефтетранспортных предприятий
- Алгоритмы многоуровневого моделирования корпоративных телекоммуникационных сетей
- Методы и программные средства когнитивной графики для интеллектуальных систем поддержки принятия решений
- Статистический мониторинг и анализ телекоммуникационных сетей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность