автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Формирование оценки лояльности клиентов телекоммуникационной компании на основе байесовского подхода

кандидата технических наук
Салмин, Алексей Александрович
город
Самара
год
2008
специальность ВАК РФ
05.13.13
Диссертация по информатике, вычислительной технике и управлению на тему «Формирование оценки лояльности клиентов телекоммуникационной компании на основе байесовского подхода»

Автореферат диссертации по теме "Формирование оценки лояльности клиентов телекоммуникационной компании на основе байесовского подхода"

ООЗ169731

На правах рукописи

Салмин Алексей Александрович

ФОРМИРОВАНИЕ ОЦЕНКИ ЛОЯЛЬНОСТИ КЛИЕНТОВ ТЕЛЕКОММУНИКАЦИОННОЙ КОМПАНИИ НА ОСНОВЕ БАЙЕСОВСКОГО ПОДХОДА

Специальность 05 13 13 Телекоммуникационные системы и компьютерные сети

Г

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

2 2 20(18

003169731

На правах рукописи

Салмин Алексей Александрович

ФОРМИРОВАНИЕ ОЦЕНКИ ЛОЯЛЬНОСТИ КЛИЕНТОВ ТЕЛЕКОММУНИКАЦИОННОЙ КОМПАНИИ НА ОСНОВЕ БАЙЕСОВСКОГО ПОДХОДА

Специальность 05 13 13 Телекоммуникационные системы и компьютерные сети

74

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Поволжская государственная академия телекоммуникаций и информатики» (ГОУВПО ПГАТИ)

Научный руководитель -Официальные оппоненты -

Ведущая организация -

доктор технических наук, профессор Кораблин М А

доктор технических наук, профессор Прохоров С А ,

кандидат технических наук, доцент Шаталов В Г

Институт проблем управления сложными системами РАН (ИПУСС РАН), г Самара

Защита диссертации состоится «20» июня 2008 г в 14 00 час на заседании диссертационного совета Д 219 003 02 при Поволжской государственной академии телекоммуникаций и информатики по адресу 443010, г Самара, ул Л Толстого, 23

С диссертацией можно ознакомиться в библиотеке ГОУВПО ПГАТИ Автореферат разослан « 16» мая 2008 г

Ученый секретарь

диссертационного совета Д 219 003 02, д т н , доцент

' Мишин Д В

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы исследования

Одним из основных недостатков современных систем обслуживания клиентов телекоммуникационных компаний заключается в том, что клиент фактически обезличивается, рассматривается как «лицевой счет» Такой подход к клиенту может привести к образованию упущенной выгоды, которая связана с недоучетом потребностей и возможностей клиента. Во многих ситуациях размер этой упущенной выгоды весьма значителен, поэтому в условиях обостряющейся конкурентной борьбы за клиента на первый план выходит индивидуальный подход к обслуживанию, способный найти наиболее рациональный индивидуальный баланс интересов на рынке телекоммуникационных услуг

Одной из основных проблем при этом становится проблема лояльности (loyalty) и оттока клиентов (chum prédiction). В настоящее время существуют различные методики анализа клиентской базы данных телекоммуникационной компании с целью формирования оценки лояльности клиентов Наиболее известными в этой области являются исследования таких зарубежных и отечественных авторов, как' Вернер Дж Рейнартц. В Кумар, И Ансофф, Д Аакер, Ф Котлер, Д Кревенс, Ж Ламбен, А Макаров и др Большой вклад в развитие этого направления внесли работы Д Пепперс, M Роджерс, Ф Райчхелд, РД Блэкуелл, Пол У Минард, Ф Котлер, Д Шет, Р Голдсмит, С Браун, этой проблеме посвящены работы российских авторов А В Зозулева, Ю. Морозова, В. Дорошева, Г Багиева и др Однако эти разработки не всегда позволяют учесть специфические особенности телекоммуникационных систем организацию данных, биллинга, учет индивидуальных свойств клиента и т.п.

Неполнота априорной информации о свойствах клиентов препятствует использованию существующих аналитических систем для интеллектуального анализа данных в телекоммуникационных системах В связи с этим, решение проблемы оценки лояльности клиентов с учетом полноты разнородной информации об индивидуальных качествах клиента представляется актуальным, тесно связанным с развитием общих концепций CRM-систем (Customer Relationship Management)

Объектом исследовании являются алгоритмы обработки данных биллинговой системы телекоммуникационной компании

Целью работы является построение моделей и алгоритмов анализа данных телекоммуникационной компании, формирующих

количественные оценки лояльности клиентов по отношению к компаниям-операторам

Для достижения поставленной цели требуется решить следующие задачи:

1. Выявить наиболее перспективные подходы и методы оценки лояльности клиентов телекоммуникационной компании

2 Проанализировать концепции апостериорного анализа данных для эффективного прогнозирования взаимодействий с клиентами

3 Разработать алгоритмы сегментированного анализа данных с учётом индивидуальных свойств клиентов и оценки взаимосвязей между сегментами и услугами

4 Провести моделирование, основанное на предложенных алгоритмах и реальных данных компании-оператора, и сделать выводы о целесообразности использования разработанных моделей

Методы исследования

Основные теоретические и экспериментальные исследования диссертационной работы выполнены с применением методов теории вероятности, математической статистики, когнитивного моделирования, регрессионного анализа

Научная новизна диссертационной работы заключается в следующем

Предложены алгоритмы формирования оценок лояльности клиентов телекоммуникационной компании с использованием их индивидуальных личностных характеристик, алгоритм наполнения сегментов и алгоритм оценки взаимосвязей между сегментами Алгоритм наполнения сегментов основан на использовании формулы Байеса, которая определяет апостериорную вероятность принадлежности клиента к сегменту с учетом его индивидуальных характеристик Алгоритм оценки взаимосвязей между сегментами позволяет выявить скрытые закономерности между объёмами телекоммуникационных услуг на основе регрессионно-когнитивного моделирования

Достоверность результатов работы обеспечивается адекватным использованием методов теории вероятности, математической статистики. Достоверность положений и выводов работы подтверждается результатами моделирования.

Практическая ценность работы

Использование разработанных алгоритмов позволяет повысить эффективность взаимодействия с клиентами и обеспечить достоверность оценок их лояльности и платёжеспособности.

Реализация результатов работы

Разработанные в работе алгоритмы анализа приняты к использованию ОАО «ВолгаТелеком» (г. Самара), а также внедрены в учебный процесс Поволжской государственной академии телекоммуникаций и информатики (г Самара)

Апробация работы

Отдельные законченные этапы работы докладывались и обсуждались на Российских научных конференциях профессорско-преподавательского состава, научных сотрудников и аспирантов (Самара, 2006-2008), Международных научно-технических конференциях «Проблемы техники и технологии телекоммуникаций» (Самара, 2006, Уфа, 2007), 4-й международной научно-технической конференции «Информатизация процессов формирования открытых систем на основе САПР, АСНИ, СУБД и систем искусственного интеллекта ИНФОС-2007» (Вологда, 2007), 6-й Всероссийской научно-практической конференции «Компьютерные технологии в науке, практике и образовании» (Самара, 2007), 7-й Всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2007)

Публикации

Основное содержание диссертации отражено в 11 опубликованных работах Публикации включают 4 статьи в научных изданиях, рекомендуемых ВАК для публикации научных работ, и 7 материалов докладов на научно-технических конференциях

На защиту выносятся

- модель прогнозирования лояльности клиентов телекоммуникационной компании, основанная на использовании их индивидуальных свойств,

- алгоритмы выявления скрытых зависимостей (корреляций) между объемами услуг телекоммуникационной компании,

- рекуррентные алгоритмы пересчета апостериорных вероятностей при сегментном анализе платежных диапазонов

Структура и объём работы

Диссертационная работа состоит из введения, трех глав, заключения и списка литературы Основная часть работы содержит 97 страниц машинописного текста, 39 рисунков, 9 таблиц Список литературы содержит 51 наименование

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, приведён обзор работ по теме диссертации, сформулированы цель и основные задачи

исследования, описан состав и структура работы, обоснована достоверность полученных результатов, определена научная новизна

Глава 1 посвящена обзору методов анализа лояльности клиентов и принципам многофакторного сегментного статистического анализа платёжных диапазонов

Одно из основных свойств телекоммуникационных систем заключается в том, что они являются многопараметрическими и содержат множество различных факторов, влияющих на работу компании в целом Взаимодействия между факторами в общем случае нетривиальны Это объясняется многими обстоятельствами и в первую очередь спецификой предоставления телекоммуникационных услуг и потребления клиентами этих услуг. В связи с этим возникает одна из центральных проблем телекоммуникационного оператора, связанная с предсказанием лояльности клиента, которая характеризует стабильность отношений между клиентом и телекоммуникационной компанией

В результате обзора методов оценки лояльности клиентов было установлено, что в качестве механизма оценки лояльности целесообразно использовать сегментный анализ личностных характеристик клиента, позволяющий формировать стереотипы, определяющие поведение клиента в компании и предсказывающие его лояльность При этом выявляемые статистические закономерности должны дать оператору возможность на основе индивидуальных данных о клиенте отнести его к одной из категорий (стереотипов), базируясь на основе использования правдоподобных математических построений

Глава 2 содержит разработки, описание и анализ предлагаемого алгоритма сегментирования клиентской базы компании с использованием вероятностных оценок, построенных на основе формулы Байеса Приведены основные принципы анализа лояльности при помощи данного алгоритма

Показано, что в качестве оценки лояльности клиента телекоммуникационной компании целесообразно использовать вероятностную меру, позволяющую реализовать пересчет априорной вероятности в апостериорную на основе анализа статистики сегментов

На рис. 1 представлен пример сегментированного анализа, позволяющего совершать процесс сегментации с учетом личностных характеристик клиента и производить вероятностные выводы о его лояльности Например, если клиент обладает личностной характеристикой 2 или 3 в категории ЛХ 2, то клиент со стереотипом 1 или 2 с характеристикой 1 или 2 в категории ЛХ 1 соответственно

считается лояльным Если клиент обладает характеристикой 1 в

категории ЛХ 2, то он считается нелояльным

ЛХ1_ _ЛХг

' _____ ____ I I __^ I

Уровень

предъявления ЛХ

Уровень проверки ЛХ на стереотип

Уровень проверка стереотипа на лояльность

Рис 1 Пример проверки лояльности клиента

количественно с учетом его предлагается

В качестве механизма, позволяющего охарактеризовать значение лояльности клиента индивидуальных личностных характеристик, использовать формулу Байеса

p(s.) 1=1

где

/'(^¡{лх}) - вероятность принадлежности клиента сегменту S, при

условии, что клиент имеет набор личностных характеристик {ЛХ}, p({jix\s,) - вероятность того, что клиент имеет набор личностных

характеристик {ЛХ} при условии его принадлежности сегменту S„

P(s,) - безусловная априорная вероятность принадлежности клиента сегменту S, Схема сегментного анализа на основе использования формулы (1) (см рис 2) позволяет определить сегмент, к которому следует отнести клиента с учетом его {ЛХ} Формируя набор личностных характеристик, по формуле Байеса можно определить количественную оценку лояльности клиента, состоящую из набора вероятностей принадлежности клиента ко всем сегментам компании {SJ. Наибольшая апостериорная вероятность принадлежности клиента к сегменту из всего полученного набора определяет максимальное

правдоподобие пребывания клиента именно в этом сегменте и дополняет априорные сведения о клиентах апостериорными значениями с учетом их индивидуальных характеристик

(ЛХ)

С=с>

Апостериорные вероатоми принадлежа ости клиент« с набором ЛХ х сехмппу

У

Рис 2 Сегментный анализ, построенный на формуле Байеса

Набор сегментов, представленный на рис 2, обладает отличной друг от друга статистикой (стереотип сегмента), в которую входят данные об общем количестве клиентов в сегменте и количестве клиентов, дифференцированных по значениям личностных индивидуальных свойств Стереотипы сегментов образуют общую сегментарную базу компании, на основе которой формируется итерационный процесс пересчёта вероятностей по формуле (1) с учётом предъявляемых личностных характеристик клиента (рис 3)

Начало ^

Определение набора

•1

Цшсх по ЛХ/ \

Щ

I

Определение набора сегментов и набора апостериорных вероятностей

Цнет по$

Пересчет апостериорных вероятностей для 1-го сегмента с учетом¿-й ЛХ

Быбор сегмента с наибольшей апостериорной вероятностью принадлежности клиента к сегменту с учетом набора ЛХ

<£ТТ>

I

I

я

Пересчет по формуле Байеса

Г

Быбор сегмента

Конец

Рис 3 Алгоритм перечёта апостериорных вероятностей на основе формулы Байеса

На рис 2 и 3 т - количество сегментов, п - количество личностных характеристик клиента

В этой главе также рассматриваются и синтезируются алгоритмы выявления скрытых зависимостей между объёмами услуг компании-оператора Такие зависимости идентифицируются как внутри сегментов, так и в общем (многосегментном) диапазоне Концептуальная основа этих алгоритмов связана с понятием когнитивных графов В диссертации эта концепция развивается с использованием методов регрессионного анализа, на основе которого удаётся получить разметку когнитивного графа (коэффициенты взаимовлияния факторов - объемов услуг и/или трафика)

Если Ф\ б, Ф2 б, , ФП6 ~ базовые значения факторов Фь Ф2, , Ф„ (свободные члены регрессий), а к- коэффициенты влияния (например, кф^ф^ определяет влияние фактора на фактор Ф2), то общая линейная модель взаимовлияний представляется в виде.

Уф = \,п, Уу/у = 1ехерП=у,

= ^ + фу (2)

Такая регрессионно-когнитивная модель позволяет оценить взаимосвязи между факторами

В классической регрессионной модели коэффициенты взаимовлияний размерны (могут быть разной размерности) Для использования этих коэффициентов в сегментном анализе целесообразно привести значения этих коэффициентов к вероятностной шкале (от 0 до 1) С этой целью в работе используется логистическая регрессия, которая переводит фактор Ф„ рассчитанный по (2), в вероятностную шкалу

(3)

1+е •

Здесь /^¡Ф,) рассматривается как условная вероятность

наполнения сегмента ^ при наличии взаимовлияний Ф, (Ф,

интерпретируется как фактор - регрессор)

В целом алгоритмы, описанные во 2-й главе, позволяют реализовывать эффективный вычислительный процесс анализа

телекоммуникационных данных и формирования оценки лояльности клиентов с учётом различных взаимовлияющих факторов

В главе 3 рассмотрены вопросы реализации разработанных алгоритмов с целью определения лояльности клиентов на реальных данных биллинговой системы оператора мобильной связи

Для реализации предлагаемых алгоритмов был использован файл данных оператора мобильной связи, в котором были отражены сведения по платежам за услуги, оказанные клиентам в течение года Каждый клиент характеризуется определёнными индивидуальными (личностными) характеристиками пол клиента (SEX), регион предоставления услуги для данного клиента (REGION) и месяц его подключения к сети оператора (DATE) {JIX}=(SEX, REGION, DATE). Характеристики могут быть категориальными (SEX, REGION), темпоральными (DATE) и числовыми В общем случае количество и состав {ЛХ) может меняться. Из множества услуг выбраны те, которые несут наибольшую информативность о платежеспособности клиента мобильная связь (MOB), включающая в себя звонки между операторами только мобильной связи, внутригородская связь (GOROD), которая отражает звонки между компаниями, предоставляющими услуги стационарной связи и мобильной связи, услуга SMS, услуга GPRS, группа вспомогательных услуг под названием «сервис» (SERVICE) (абонентская плата, услуги по обеспечению работы сети и т д)

Анализ клиента в соответствии с {ЛХ} на основе алгоритмов, изложенных во 2-й главе, формирует оценку лояльности как вероятность тяготения к услугам и платёжным диапазонам компании

Для осуществления сегментации по услугам весь диапазон исходных данных разбивается на поддиапазоны (для примера выбирается пять типичных услуг). Smob - тяготение клиента к мобильной связи, Sgorod - к внутригородской связи, Ssms - к услуге sms, Sgprs- к услуге gprs, Ssem<x - к «сервису» оператора На рис 4 представлена гистограмма априорного распределения вероятностей P(SJ (i = 1, ,5) тяготения клиента к конкретной услуге, построенная на основе данных биллинговой системы

Для реализации сегментации в соответствии с индивидуальными личностными характеристиками «оцениваемого» клиента используется стереотип клиента (см. рис. 5 для услуги «мобильная связь» - сегмент Smob) В структуру стереотипа входят три гистограммы SEX, REGION, DATE, построенные по соответствующим данным Сопоставляя стереотип клиента в сегменте Smob с личностными характеристиками оцениваемого клиента, например,

{JIX} = (SEX= О, REGION = Оренбург, DA ТА = Январь) (4)

на основе формулы Байеса (1) определяется вероятность тяготения клиента к сегменту Smob.

0.50 0.43 0.40 0.3S 0.30 025 0.20 0.15 О.Ю 0.05 0.00

щ

-

уда

ЕЛ \

Ш<\ Ш

0.7 0.6 0.5 0.4 03 02 0,1 О

Рис. 4. Гистограмма априорного распределения вероятностей тяготения клиента к услугам, представленным сегментами

РМ

0.16 х 0.14 В 0.12

£ a,to Е 0,08

s ооб

£ 0В4

0,02 ПВО

J

it it — ■ — Й :\z\\

0,504

¡«ода

0,4SS 0.494

-

Ж— 1

с/

Рис. 5. Характеристика стереотипа клиентов, принадлежащих сегменту БтоЬ

Аналогично проводится анализ для всех возможных услуг, после чего формируется общая оценка тяготения клиента к услугам компании. На рис. 6 в качестве примера приведены результаты эксперимента для клиента с индивидуальными характеристиками (4).

0.5 0,45 0.4

f 0,35 —

0

| 0,3

1 0.25

f <W

0.15 0.1 0.05

ВДОСб-р

P(S) с учетом ЛХ

Рис. 6. Тяготение клиента к услугам при наборе JIX (4)

В левой части рис 6 представлено априорное распределение (рис 4), в правой — апостериорное, формируемое с учётом набора (4)

Полученное распределение интерпретируется как процентное соотношение услуг (в объёмах времени, выделяемого клиентом на реализацию услуг) Для данного примера после предъявления JIX наибольшее время (45%) выделяется на услугу GOROD, 22% всего времени - на услугу MOB, 6% - на услугу sms, 2% - на услугу gprs, 25% - на услугу SERVICE

Пересчёт формулы (1) с учётом (4) иллюстрирует изменение общего процентного соотношения услуг применительно к анализируемому клиенту Согласно рис. 6, клиент в априорном распределении с наибольшими вероятностями тяготеет к услугам MOB и SERVICE, а в апостериорном с учётом набора (4) к услуге GOROD Априори факт тяготения анализируемого клиента к этой услуге очень мал (0,05 против 0,45).

Сегментированный анализ платёжеспособности клиента наряду с анализом его тяготения к услугам, может проводиться на уровне шкалы платежеспособности Для этого такая шкала платёжеспособности разбивается на поддиапазоны (ПД) (для примера выделено шесть ПД) ПД\ - клиент ничего не платит в течение месяца, ПД2 — клиент платит от 0 до 5 условных единиц (у е.) в месяц, ПДЪ - от 5 до 10 у.е, ПДА - от 10 до 20 у е, ПДЪ - от 20 до 30 у е , ПД6 - более 30 уев месяц

Внутри каждого из ПД имеется набор услуг, которые взаимосвязаны между собой Зная ПД и зависимости между услугами, можно количественно оценить лояльность и объемы этих услуг для конкретного клиента

В общем случае лояльность клиента L определяется средними выплатами с учетом вероятностей принадлежности клиента к ПД -

где ПД ^ и ПД} - соответственно нижняя и верхняя границы у-го ПД

Для выявления тяготения клиента к ПД аналогично рис 4, 5 формируются гистограммы априорного распределения вероятностей Р(ПД) принадлежности клиента к ПД) (/ = 1, , /V) и характеристики

ФДу)

(5)

стереотипов клиентов каждого из диапазонов в соответствии с атрибутами клиентов.

При помощи формулы Байеса (1) определяется вероятность принадлежности клиента к каждому из 6-и платёжных диапазонов ПД) с учётом личностных характеристик клиента р{пД

Рис. 7 иллюстрирует изменение вероятностной структуры ПД) в связи с тяготением клиента с набором свойств (4). В априорном распределении вероятностей ЯДУ доминирует ЯДЬ в апостериорном -ПД2, что прогнозирует существенное увеличение платёжеспособности и лояльности клиента. Априори его лояльность была недооценена (по формуле (5) априори - I = 4,42 у.е., апостериори - I = 4,56 у.е. в месяц).

O.S 0.45 0.4 »35 £ 0.3 I 0.25 1 «

nr

пдг

ВД»тие—hi

-ПД2-

-fw

пдз

ПП5Щ6 "

Pfnqj с учетом ПХ

Рис. 7. Тяготение клиента к ПД2 при наборе JIX (4)

Для определения взаимозависимостей между услугами внутри платёжного диапазона формируется таблица 1, в которой приведён пример результирующих значений базовых объёмов и коэффициентов, полученных для второго платёжного диапазона ПД2. По диагонали расставлены базовые объёмы услуг (в у.е.), а в остальных клетках безразмерные коэффициенты линейных связей. Данная таблица получена на основе системы (2) с использованием программы Poly Analyst, относящейся к классу систем Data Mining.

Таблица 1. Коэффициенты линейных связей и базовые значения

MOB GOROD SMS GPRS SERVICE

MOB 2,2273 -0,29018 -0,25446 -0,39053 -0,385

GOROD -0,0546 0,816831 -0,02294 -0,1024 0

SMS -0,05198 -0,025319 0,88941 0 0

GPRS -0,03 720 i -0,051833 0 0,65658 0

SERVICE -0,012618 0 0 0 0,110668

Путём пересчёта системы (2) в соответствии с взаимосвязями между услугами внутри платёжного диапазона (таблица 1) определяются возможные объёмы услуг для клиента с учётом процентного отношения услуг (пример рис. 6). На рис. 8 представлена диаграмма прогнозируемых значений услуг для клиента во 2-м платёжном диапазоне с набором характеристик (4).

Рис. 8. Прогнозируемые объёмы услуг для ПД2 при наборе JIX (4)

ЗАКЛЮЧЕНИЕ

В работе показано, что при современной ситуации на рынке телекоммуникационных услуг, использование предлагаемых алгоритмов оценки лояльности клиентов является важным фактором повышения эффективности деятельности телекоммуникационной компании.

Выполнен аналитический обзор методов анализа лояльности клиентов, по результатам которого установлено, что наиболее перспективным при решении данных задач является сегментный анализ, основанный на байесовском подходе.

Предлагаемая в работе сегментация телекоммуникационных данных с учётом стереотипов клиентов компании, основанная на индивидуальных (личностных) характеристиках, позволяет оперативно и с большей достоверностью принимать управленческие решения, а также делать соответствующие прогнозы платежеспособности как для индивидуальных, так и для корпоративных клиентов.

НАУЧНЫЕ ПУБЛИКАЦИИ IIO ТЕМЕ ДИССЕРТАЦИИ:

1) Кораблин, М.А. Байесовский подход для оценки лояльности клиентов телекоммуникационной компании / М.А. Кораблин, A.B. Мелик-Шахназаров, A.A. Салмин // Инфокомму-никационные технологии. - 2006. - Т. 4, № 2. - С. 85- 90.

2) Кораблин, М А Оценка лояльности клиентов телекоммуникационной компании на основе байесовского подхода / М А Кораблин, А В Мелик-Шахназаров, А А Салмин // Информационные технологии - 2006 - № 04. - С 6367

3) Кораблин, МА. Регрессионно - когнитивные графы в задачах анализа биллинговых систем / М А Кораблин, А В Мелик-Шахназаров, А А Салмин II Информационные технологии -2005 -№08 -С 35-39

4) Салмин, А А Задачи аналитического управления трафиком в современных биллинговых системах / А А Салмин // Инфокоммуникационные технологии - 2007. - Т 5, № 10 -С 58-61

5) Салмин, А А Лояльность как категория эффективности телекоммуникационной компании / А А Салмин // VII Всероссийская научно-техническая конференция «Проблемы информатики в образовании, управлении, экономике и технике» сб статей - Пенза, ПДЗ, 2007 - С. 146-148

6) Салмин, А А Методы индивидуального подхода к абонентам в биллинговых системах / А А Салмин // XIII Юбилейная российская научная конференция профессорско-преподавательского состава, научных сотрудников и аспирантов материалы конференции - Самара, ПГАТИ, 2006 -С 178

7) Салмин, А А Сегментация клиентов телекоммуникационной компании на основе формулы Байеса / А А Салмин // VII МНТК «Проблемы техники и технологии телекоммуникаций»: материалы конференции - Самара, ПГАТИ, 2006 -С 162-164

8) Салмин, А А Сегментированный анализ данных телекоммуникационного оператора для выявления лояльности клиента / А А Салмин // VIII МНТК «Проблемы техники и технологии телекоммуникаций» материалы конференции - Уфа, УГАТУ, 2007 - С 136-138

9) Салмин, А А Технология Data Mining и ее практическое использование в телекоммуникационных системах / А А Салмин // XIV Российская научная конференция профессорско-преподавательского состава, научных сотрудников и аспирантов материалы конференции. - Самара, ПГАТИ, 2007 -С 160-161

10) Салмин, А А. Задачи аналитического управления трафиком в современных биллинговых системах / А А Салмин // 4-я МНТК «Информатизация процессов формирования открытых систем на

основе САПР, АСНИ, СУБД и систем искусственного интеллекта» (ИНФОС-2007) материалы конференции - Вологда, ВоГТУ,2007 -С 176-178 11) Салмин, А. А Процесс «поиска решения» для анализа телекоммуникационных данных / А.А Салмин // 6-я Всероссийская научно-практическая конференция

«Компьютерные технологии в науке, практике и образовании» материалы конференции. - Самара, СамГТУ, 2007 - С 94-96

Отпечатано фотоспособом в соответствии с материалами, представленными заказчиком

Подписано в печать13 05 08г Формат бОхМ'/ю Бумага писчая№1 Гаршпура Тайме Заказ51 Печать операмвная Физ печ л 1 Уч.-щд. л 0 95 тираж 100 экз

Типография государственного образовательного учреждения высшего профессионального образования «Поволжская государственная академия телекоммуникаций и информатики» 443090, г Самара, Московское шоссе 77 Тел/факс (846) 228-00-44

Оглавление автор диссертации — кандидата технических наук Салмин, Алексей Александрович

ВВЕДЕНИЕ.

ГЛАВА 1. ЗАДАЧИ АНАЛИЗА ЛОЯЛЬНОСТИ КЛИЕНТОВ ТЕЛЕКОММУНИКАЦИОННОЙ КОМПАНИИ.

1.1. Лояльность как категория эффективности телекоммуникационной компании.

1.2. Системный анализ данных компании.

1.3. Сегментация по характеристикам клиента.

1.4. Выводы.

ГЛАВА 2. СЕГМЕНТАЦИЯ ДАННЫХ ДЛЯ ОЦЕНКИ ЛОЯЛЬНОСТИ.

2.1. Сегментированный анализ, основанный на формуле Байеса.

2.2. Сети Байеса.

2.3. Оценка взаимосвязи между факторами сегмента.

2.4. Выводы.

ГЛАВА 3. АЛГОРИТМЫ ОЦЕНКИ СЕГМЕНТОВ ТЕЛЕКОММУНИКАЦИОННЫХ ДАННЫХ.

3.1. Алгоритмы оценки наполнения сегментов и их реализация.

3.2. Алгоритмы оценки взаимосвязей между сегментами в телекоммуникационных данных и их реализация.

3.2.1. Определение взаимосвязей между услугами компании при помощи регрессионно-когнитивного моделирования.

3.2.2. Оценка лояльности клиента по отношению к услугам компании с учётом его характеристик.

3.3. Выводы.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Салмин, Алексей Александрович

Актуальность темы исследования. Одним из основных недостатков современных систем обслуживания клиентов телекоммуникационных компаний заключается в том, что клиент фактически обезличивается, рассматривается как «лицевой счёт». Такой подход к клиенту может привести к образованию упущенной выгоды, которая связана с недоучётом потребностей и возможностей клиента. Во многих ситуациях размер этой упущенной выгоды весьма значителен, поэтому в условиях обостряющейся конкурентной борьбы за клиента на первый план выходит индивидуальный подход к обслуживанию, способный найти наиболее рациональный индивидуальный баланс интересов на рынке телекоммуникационных услуг.

Одной из основных проблем при этом становится проблема предсказания оттока клиентов (churn prediction) или оценка «лояльности» клиентов. Как показывают оценки экспертов [34], привлечение нового клиента стоит примерно в 10 раз больше, чем удержание старого, а возврат ушедшего - в 100 раз больше. Для реализации качественного формирования оценки лояльности клиента должны быть использованы интеллектуальные методы анализа данных, которые позволяют выявить «скрытые» знания о взаимосвязях между индивидуальными характеристиками клиента и его отношением к компании-оператору. Лояльность клиента может измеряться в некоторых условных единицах и оцениваться достоверностью принадлежности клиента к определенному платёжному диапазону по шкале доходности компании, - здесь возможны разные методы и модели оценки.

Сфера использования таких методов и моделей отличается тем, что накопленные компанией объёмы данных должны обобщаться до такого уровня представления информации, который может быть охарактеризован как получение новых знаний о мотивациях поведения клиента.

В настоящее время существуют различные методики анализа клиентской базы данных телекоммуникационной компании с целью формирования оценки лояльности клиентов. Наиболее известными в этой области являются исследования таких зарубежных и отечественных авторов, как: Вернер Дж. Рейнартц, В. Кумар, И. Ансофф, Д. Аакер, П. Дойль, К. Келлер, Ф. Котлер, Д. Кревенс, Ж. Ламбен, А. Макаров и др. Большой вклад в развитие внесли работы Д. Пепперс, М. Роджерс, Ф. Райчхелд, Р.Д. Блэкуелл, Пол У. Минард, Джейн Ф. Энджел, Ф. Котлер, Ж. Ламбен, Д. Говард, Д. Шет, Р. Голдсмит, С. Браун; этой проблеме посвящены работы российских авторов А.В. Зозулева, Ю. Морозова, В. Дорошева, Г. Багиева и др. Однако эти разработки не всегда позволяют учесть специфические особенности телекоммуникационных систем: организацию данных, биллинга, учёт индивидуальных свойств клиента и т.п.

Неполнота априорной информации о свойствах клиентов препятствует использованию существующих аналитических систем для интеллектуального анализа данных в телекоммуникационных компаниях. В связи с этим, решение проблемы оценки лояльности клиентов с учётом полноты разнородной информации об индивидуальных качествах клиента представляется актуальным, тесно связанным с развитием общих концепций CRM-систем (Customer Relationship Management).

Объектом исследования являются алгоритмы обработки данных биллинговой системы телекоммуникационной компании.

Целью работы является построение моделей и алгоритмов анализа данных телекоммуникационной компании, формирующих количественную оценки лояльности клиентов по отношению к компаниям-операторам.

Для достижения поставленной цели требуется решить следующие задачи:

1. Выявить наиболее перспективные подходы и методы оценки лояльности клиентов телекоммуникационной компании.

2. Проанализировать концепции апостериорного анализа данных для эффективного прогнозирования взаимодействий с клиентами.

3. Разработать алгоритмы сегментированного анализа данных с учётом индивидуальных свойств клиентов и оценки взаимосвязей между сегментами и услугами.

4. Провести моделирование, основанное на предложенных алгоритмах и реальных данных компании-оператора, и сделать выводы о целесообразности использования разработанных моделей.

Методы исследования. Основные теоретические и экспериментальные исследования диссертационной работы выполнены с применением методов теории вероятности, математической статистики, когнитивного моделирования, регрессионного анализа.

Научная новизна диссертационной работы заключается в следующем:

Предложены алгоритмы формирования оценок лояльности клиентов телекоммуникационной компании с использованием их индивидуальных личностных характеристик: алгоритм наполнения сегментов и алгоритм оценки взаимосвязей между сегментами. Алгоритм наполнения сегментов основан на использовании формулы Байеса, которая определяет апостериорную вероятность принадлежности клиента к сегменту с учётом его индивидуальных характеристик. Алгоритм оценки взаимосвязей между сегментами позволяет выявить скрытые закономерности между объёмами телекоммуникационных услуг на основе регрессионно-когнитивного моделирования.

Достоверность результатов работы обеспечивается адекватным использованием методов теории вероятности, математической статистики. Достоверность положений и выводов работы подтверждается результатами моделирования.

Практическая ценность работы. Использование разработанных алгоритмов позволяет повысить эффективность взаимодействия с клиентами и обеспечить достоверность оценок их лояльности и платёжеспособности.

Реализация результатов работы. Разработанные в работе алгоритмы анализа приняты к использованию Самарским филиалом ОАО «ВолгаТелеком», а также внедрены в учебный процесс Поволжской государственной академии телекоммуникаций и информатики (г. Самара).

Апробация работы. Отдельные законченные этапы работы докладывались и обсуждались на Российских научных конференциях профессорско-преподавательского состава, научных сотрудников и аспирантов (Самара, 2006-2008); Международных научно-технических конференциях «Проблемы техники и технологии телекоммуникаций» (Самара, 2006; Уфа, 2007); 4-й международной научно-технической конференции «Информатизация процессов формирования открытых систем на основе САПР, АСНИ, СУБД и систем искусственного интеллекта: ИНФОС-2007» (Вологда, 2007); 6-й Всероссийской научно-практической конференции «Компьютерные технологии в науке, практике и образовании» (Самара, 2007); 7-й Всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2007).

Публикации. Основное содержание диссертации отражено в 11 опубликованных работах. Публикации включают 4 статьи в научных изданиях, рекомендуемых ВАК для публикации научных работ, и 7 материалов докладов на научно-технических конференциях.

На защиту выносятся:

- модель прогнозирования лояльности клиентов телекоммуникационной компании, основанная на использовании их индивидуальных свойств;

- алгоритмы выявления скрытых зависимостей (корреляций) между объемами услуг телекоммуникационной компании;

- рекуррентные алгоритмы пересчёта апостериорных вероятностей при сегментном анализе платёжных-диапазонов.

Структура и объём работы

Диссертационная работа состоит из введения, трёх глав, заключения и списка литературы. Основная часть работы содержит 97 страниц машинописного текста, 39 рисунков, 9 таблиц. Список литературы содержит 51 наименование.

Заключение диссертация на тему "Формирование оценки лояльности клиентов телекоммуникационной компании на основе байесовского подхода"

3.3. Выводы

1) Разработаны методы анализа лояльности клиента, которые позволят компании-оператору выявлять наиболее лояльных клиентов, учёт которых может сильно отразиться на перераспределении средств, а, следовательно, и на деятельности компании в целом.

2) Эффективность данных подходов заключается в том, что они позволяют своевременно производить анализ клиентов и прогнозирование объёмов услуг для данных клиентов с целью эффективного выстраивания с ними своей работы.

3) Подход анализа лояльности клиента при помощи сегментации, основанной на формуле Байеса, и оценки взаимовлияний между факторами внутри сегмента, основанные на регрессионно-когнитивном моделировании и логит-преобразованиях, решают принципиально различные задачи, но интегрирую эти методики, компания может выявить полезную для себя информацию с целью увеличения лояльности своих клиентов.

ЗАКЛЮЧЕНИЕ

В работе показано, что при современной ситуации на рынке телекоммуникационных услуг, использование предлагаемых алгоритмов оценки лояльности клиентов является важным фактором повышения эффективности деятельности телекоммуникационной компании.

Выполнен аналитический обзор методов анализа лояльности клиентов, по результатам которого установлено, что наиболее перспективным при решении данных задач является сегментный анализ, основанный на байесовском подходе. Также с целью установки возможных взаимосвязей между элементами сегмента целесообразно использовать методологию регрессионно-когнитивного анализа.

Предлагаемая в работе сегментация телекоммуникационных данных с учётом стереотипов клиентов компании, основанная на индивидуальных (личностных) характеристиках, позволяет оперативно и с большей достоверностью принимать управленческие решения, а также делать соответствующие прогнозы платежеспособности как для индивидуальных, так и для корпоративных клиентов.

Библиография Салмин, Алексей Александрович, диссертация по теме Телекоммуникационные системы и компьютерные сети

1. Албитов, A. CRM (Customer Relationship Management) эффект Электронный ресурс. / А. Албитов, Е. Соломатин. Режим доступа: http://www.cfin.ru/itm/crm-review.shtml, свободный. - Загл. с экрана.

2. Атанов, Г.А. Диагностика знаний и умений с помощью экспертных систем: Учебное пособие для студентов физического факультета / Г.А. Атанов, И.Н. Пустынников. Донецк: ДонГУ, 1997. - 64 с.

3. Атре, Ш. Структурный подход к организации баз данных / Ш. Атре. — М.: Финансы и статистика, 1983. — 320 с.

4. Балтрашевич, В.Э. Реализация инструментальной экспертной системы / В.Э. Балтрашевич. СПб.: Политехника, 1997. - 237 с.

5. Бернштейн, С.Н. Собрание сочинений. Т.4. Теория вероятностей. Математическая статистика / С.Н. Бернштейн. М.: Гостехимиздат, 1964. -578 с.

6. Буч, Г. Объектно-ориентированный анализ и проектирование с примерами приложений на С++ / Г. Буч. М.: Бином, 1998. - 560с.

7. Дич, Л.З. Биллинговые системы в телекоммуникациях / Л.З. Дич. М.: Радио и связь, 2003. - 232 с.

8. Дюк, В. Data Mining. Учебный курс / В. Дюк, А. Самойленко. СПб.: Питер, 2001.-368 с.

9. Елисеева, И.И. Эконометрика: учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева: под ред. Елисеевой И.И. М.: Финансы и статистика, 2005. - 576 с.

10. Копытько, Т. Прямой маркетинг универсальный ключ к лояльности клиента Электронный ресурс. / Т. Копытько. - Режим доступа: http://www.terrasoft.com.Ua/academy/articles/l 1/, свободный. - Загл. с экрана.

11. Кораблин, М.А. Байесовский подход-для оценки-лояльности-клиентов----телекоммуникационной компании / М.А. Кораблин, А.В. Мелик

12. Шахназаров, A.A. Салмин // Инфокоммуникационные технологии. 2006. -Т. 4, №2.-С. 85-90.

13. Кораблин, М.А. Оценка лояльности клиентов телекоммуникационной компании на основе байесовского подхода / М.А. Кораблин, A.B. Мелик-Шахназаров, A.A. Салмин // Информационные технологии. 2006. - № 04. - С. 63-67.

14. Кораблин, М.А. Регрессионно — когнитивные графы в задачах анализа биллинговых систем / М.А. Кораблин, A.B. Мелик-Шахназаров, A.A. Салмин // Информационные технологии. 2005. - № 08. - С. 35-39.

15. Кулинич, A.A. Система когнитивного моделирования «Канва» // Программные продукты и системы. 2002. - № 3 Электронный ресурс. / A.A. Клинич. - Режим доступа: http://www.raai.org/about/persons-/kulinich/pages/ kanva2003.html, свободный. - Загл. с экрана.

16. Мазитов, Ю.И. Инновации в CRM: вызовы времени и выгоды реализации / Ю.И. Мазитов, Ю.В. Пуха // Вестник связи. 2005. - №3. - С. 32-35.

17. Министерство связи РФ Электронный ресурс. Режим доступа: http://www.minsvyaz.ru/site.shtml?id=2522, свободный. - Загл. с экрана.

18. Назначение систем Data Mining Электронный ресурс. Режим доступа: http://www.iso.ru/journal/articles/276.html, свободный. - Загл. с экрана.

19. Некрасов В. Мобильный OLAP Электронный ресурс. // Открытые системы. 2003. - N° 05. — Режим доступа: http://www.osp.ru/os/2003/05/183051/, свободный. -Загл. с экрана.

20. Особенности маркетинга в телекоммуникациях Электронный ресурс. — Режим доступа: http://www.nii-ecos.ru/?a=23, свободный. Загл. с экрана.

21. Павлюков, Ю.А. Биллинговые системы в телекоммуникационной отрасли Электронный ресурс. / Ю.А. Павлюков // Информост Радиоэлектроника и Телекоммуникации. - 2003 - № 05 (29) - Режим доступа: http://informost.ru/ss/29/13.shtml, свободный. - Загл. с экрана.

22. Павлюков, Ю.А. Сбор и предобработка CDR в биллинговых системах Электронный ресурс. / Ю.А. Павлюков // Биллинг. Компьютерная телефония. 2003. - № 04. — Режим доступа: http://www.cti-online.ru/libraryreg.shtml, свободный. — Загл. с экрана.

23. Пугин, В.В. Разработка и исследование сетевых диагностических систем на основе вероятностных критериев: дис. . канд. техн. наук / В.В. Пугин — ПГАТИ, 2007.- 111с.

24. Роберте, Ф.С. Дискретные математические модели с приложениями к социальным, биологическим и экономическим задачам / Ф.С. Роберте. -М.: Наука, 1986.-496 с.

25. Романов, B.C. Понятие рисков и их классификация как основной элемент теории рисков / B.C. Романов // Инвестиции в России. -2007. № 12. -С. 41-43.

26. Салмин, A.A. Задачи аналитического управления трафиком в современных биллинговых системах / A.A. Салмин // Инфокоммуникационные технологии. 2007. - Т. 5, № 10.-С. 58-61.

27. Салмин, A.A. Сегментация клиентов телекоммуникационной компании на основе формулы Байеса / A.A. Салмин // VII МНТК «Проблемы техники и технологии телекоммуникаций»: материалы конференции. Самара, ПГАТИ, 2006. - С. 162-164.

28. Салмин, A.A. Сегментированный анализ данных телекоммуникационного оператора для выявления лояльности клиента / A.A. Салмин // VIII МНТК «Проблемы техники и технологии телекоммуникаций»: материалы конференции. Уфа, УГАТУ, 2007. - С. 136-138.

29. Системы планирования ресурсов предприятия ERP Электронный ресурс. Режим доступа: http://erpnews.ru/docl596.html, свободный. - Загл. с экрана.

30. Технология DM и CRM-системы: синергический эффект Электронный ресурс. — Режим доступа: http://www.snowcactus.ru/crm.htm, свободный. — Загл. с экрана.

31. Тимур Василенко О.Генри и когнитивные карты Электронный ресурс. / Т. Василенко. Режим AOCTyna:http://www.improvement.ru/zametki/cognitive/, свободный. - Загл. с экрана.

32. Федулов, A.A. Введение в теорию статистически ненадежных решений / A.A. Федулов, Ю.Г. Федулов, В.Н. Цыгичко. М.: Статистка, 1979. - 279 с.

33. Фелан, С. Информация о клиенте стратегический ресурс Электронный ресурс. / С. Фелан. - Режим доступа: http://citforum.gatchina.net/consu lting/articles/client/index.shtml, свободный. - Загл. с экрана.

34. Хабаров, С. Байесовские сети доверия как средство разработки экспертных систем Электронный ресурс. / С. Хабаров. Режим доступа: Ьйр://йгт.й-аёе.8рЬ.ги/8еф/та1пе8.Мт, свободный. - Загл. с экрана.

35. Хейс, Д. Причинный анализ в статистических исследованиях / Д. Хейс: перевод с англ. Ю.Н. Гаврильцева, JI.M. Кутикова, М.А. Кутикова. М.: Финансы и статистика, 1981. - 256 с.

36. Храбров, В. Как удержать абонентов? Электронный ресурс. / В. Храбров. Режим доступа: http://www.sas.com/offices/europe/russia/articles/-2002/con06.html, свободный. — Загл. с экрана.

37. Цой, А. Конвергентный биллинг реального времени следующее поколение систем тарификации / А. Цой // Вестник связи. - 2004. - №4. -С. 32-35.

38. Чанышев, О.Г. Критерий близости документов и кластеризация/ О.Г. Чанышев // Математические структуры и моделирование: сб. научн. тр. / Под ред. А.К. Гуца. Омск: ОмГУ, 2001. - С. 121-130. - Вып. 8.

39. Частиков, А.П. Использование байесовской сети при разработке экспертных систем с нечеткими знаниями Электронный ресурс. / А.П. Частиков, И.Ю. Леднева. — Режим доступа: http ://ito. е du. ru/2 О О 0/II/5/5152.html, свободный. Загл. с экрана.

40. Школин, A. CRM: управление клиентами. Электронный ресурс. / А. Школин. — Режим доступа: http://www.finansmag.rU/4/9121/9179/9180, , свободный. — Загл. с экрана.

41. Щавелев, JI.В. Способы аналитической обработки данных для поддержки принятия решений Электронный ресурс. / JI.B. Щавелев // СУБД. 1998. -№ 04-05, № 06. Режим доступа: http://infovisor.ivanovo.ru/rus/press/-paper04.htm, свободный. - Загл. с экрана.

42. Data Mining and Knowledge Discovery Электронный ресурс. Режим доступа: http://www.dbmsmag.com/9807m01.html, свободный. — Загл. с экрана.

43. Data Mining в телекоммуникациях Электронный ресурс. Режим доступа: http:// www.megaputer.ru, свободный. - Загл. с экрана.

44. Doug, Alexander. Data Mining Электронный ресурс. / Alexander Doug. -Режим доступа: www.eco.utexas.edu/~norman/BUS.FOR/course.mat/Alex/. -Загл. с экрана.

45. Poly Analyst & Data mining Электронный ресурс. Режим доступа: http://www.polyanalyst.ru, свободный. — Загл. с экрана.

46. SAS INSTITUTE в телекоммуникационной индустрии Электронный ресурс. — Режим доступа: http://www.sas.com, свободный. Загл. с экрана.