您的浏览器版本太低,拖慢上网速度且存在安全隐患,建议升级浏览器 ×
学术动态
基于机器学习的运营商市场精准营销研究与实践
【发布时间:2020-12-16】 【来源:厦门联通 韩永涛 厦门通信学会优秀论文评选三等奖】

摘要

针对目前粗放式流量经营存在的营销成本高、营销效率低、未能充分挖掘用户潜在价值的问题,某省运营商积极探索大数据挖掘分析应用,引入数据挖掘构建目标用户模型,建立高效的信息支撑平台支撑市场营销,提升营销效率、降低营销成本,实现从“粗放式流量经营”到“精准化流量经营”的华丽转变。

      关键词:

大数据、流量经营、数据挖掘、精准营销

 

ABSTRACT

In view of the current extensive traffic management existence the high cost of marketing and marketing of low efficiency and failed to fully tap the potential value of users, X operators actively explore large data analysis applications, mining model is introduced to build the target user data, establish the information platform to support efficient marketing support, improve marketing efficiency, reduce marketing costs, from "extensive traffic management" to "precise traffic management" of the magnificent transformation.

KEY WORDS:

Big data, Traffic management, Data mining, Precision marketing

0 引言

根据权威机构预测,2020年全球移动互联网数据业务流量将较2015年增长100倍,呈现爆炸式发展态势,流量收入已成为电信运营商的主要收入来源之一。然而,传统的流量经营是提供同质化的、以MB为价值衡量单位的流量产品的模式,而不考虑谁在用网络、为何用网络、何时用网络、何处用网络、感知如何。随着移动互联网业务的快速发展,这种粗放的经营模式,由于不了解用户需求,无法针对不同业务应用的客户量身定制营销方案,因此缺乏准确的目标用户导向,往往采取普遍撒网的方式,导致营销效率低,营销成本高,用户价值也未得到充分挖掘。

“扩大流量规模、提升流量层次、丰富流量内涵”是电信运营商突破流量经营困境、释放流量价值的三大法宝。而三大法宝的实现则依赖于以智能管道和聚合平台为基础的大数据分析应用。相比第三方移动互联网公司,电信运营商占据了天然的壁垒、护城河,拥有丰富的网络运营数据和用户业务数据,数据信息更全面、更准确。因此,运营商在大数据应用领域具有得天独厚的优势,通过大数据分析,可以更快捷、更高效的获取价值信息,助力营销策略制定,实现从“粗放式流量经营”到“精准化流量经营”的华丽转变。

运营商大数据包含丰富的用户行为信息,具有全面性、多维性、客观性的特点。运用大数据技术,通过分析建模、机器学习等操作,构建用户标签体系,对用户行为特征及偏好画像。运营商能够结合自身产品服务的特点和用户画像信息,精确筛选目标客户进行营销,从而降低推广成本,提高转化效率,这就是基于运营商大数据的精准营销。

1       基于数据挖掘的市场营销支撑思路

1.1      构建以数据仓库为载体的分析支撑平台

数据仓库是一个面向主题的、集成的、相对稳定的反应历史变化的数据集合,用于支持管理决策。对此可以从两个层次进行理解:首先,数据仓库用于支持决策面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构数据源的有效集成,集成后按照主题进行重组并包含历史数据,而且存放在数据仓库中的数据一般不再修改。

本次研究主要是通过聚合基站数据库、无线网、核心网、BSS系统、BCS系统、终端管理系统等海量数据,实现用户终端、套餐、业务量、ARPU值、用户主要活动区域、用户上网偏好、业务类型、业务感知指标等多元数据的关联分析,形成具有高价值信息的数据仓库。再以数据仓库为载体,运用OLAP方法,建设用户画像、热点透视、领域分层等核心能力组件,拓展数据服务范围,打造灵活、开放的数据服务平台,提升流量经营支撑能力。

1.2      运用数据挖掘算法构建用户模型,支撑营销策略定制

常用的算法主要包括决策树、神经网络、贝叶斯分类、关联规则等。算法不是专门为解决某个问题而特制的,各种算法之间也并不互相排斥。

决策树又称为判定树,其每个内部结点( internal node )代表对某个属性的一次测试,每条边代表一个测试结果,叶结点( leaf )代表某个类( class )或者类的分布( class distribution ),最上面的结点是根结点。决策树算法的优点是计算量相对较小,且容易转化成分类规则,挖掘出的分类规则准确性高,便于理解。缺点是缺乏伸缩性,由于进行深度优先搜索,所以算法受内存大小限制,难于处理大训练集;而且大数据集会降低分类的准确性。

人工神经网络(Artificial Neural Network)又称连接机模型,是在现代神经学、生物学、心理学等学科研究的基础上产生的,它反映了生物神经系统处理外界事物的基本过程,是在模拟人脑神经组织的基础上发展起来的计算系统。神经网络有很强的非线性拟合能力,可映射任意复杂的非线性关系,而且学习规则简单,便于计算机实现。具有很强的鲁棒性、记忆能力、非线性映射能力以及强大的自学习能力,因此有很大的应用市场。而缺点是最严重的问题是没能力来解释自己的推理过程和推理依据,不能向用户提出必要的询问,而且当数据不充分的时候,神经网络就无法进行工作。

关联规则分析是指若两个或多个数据项的取值之间重复出现概率很高时,它们就存在某种关联,可以建立起这些数据项的关联规则。关联规则可直观的表达数据中项集间的联系,这种联系并不是基于某种特定的分布、依靠数据在特定模型中的多次迭代拟合而来,而是根据项集在数据资料中出现的概率来构建。因而,这种方法有异于传统的统计学方法,其优势在于结果明确,容易解释。

1.3      引入数据挖掘模型,实现市场营销全流程监控

数据挖掘涉及的模型很多,比较权威的有SPSS5A法,即访问(Access)、分析(Analyze)、评估(Assess)、行动(Action)、自动化(Automate)。SASSEMMA法,即抽样(Sample)、探索(Explore)、建模(Model)、修正(Modify)、评估(Assess)。

二十世纪末,NCR Systems Engineering Copenhagen(丹麦)、Daimler-Benz AG(德国)、SPSS/Internal Solutions Ltd.(英国)和OHRA Verzekeringen en Bank Grep B.V(荷兰)等行业协会建立了数据挖掘的过程模型CRISP-DM,该模型强调完整的数据挖掘过程,不仅只针对数据整理、数据呈现、数据分析以及构建模型,还包括对企业需求的了解,以及后期对模型进行评价和延伸应用,也是一个完整的数据挖掘过程不可或缺的。CRISP-DM从方法学的角度强调实施数据挖掘的方法和步骤,并独立于每种具体数据挖掘算法和数据挖掘系统。

相比其他方法,CRISP-DM更适用于运营商以用户、市场为导向的经营模式。本课题研究基于CRISP-DM模型进行市场营销支撑数据挖掘,通过大数据分析,可以更快捷、更高效的获取价值信息,助力营销策略制定,实现从“粗放式流量经营”到“精准化流量经营”的华丽转变。

2       基于机器学习的市场营销支撑应用

2.1      打造高效的信息支撑平台,提高经营决策支撑效率

采集多维度海量数据是丰富平台内涵的基础,构建数据仓库是利用平台开展大数据分析的依据。某省运营商通过建立“机器自学习”决策中心,将分析支撑经验沉淀形成决策库,并固化于信息支撑平台。该平台集成了多个部门的数据信息,结合数据仓库技术和快速决策中心的应用,为制定流量经营策略提供快速的信息支撑。应用分析决策中心支撑系统结构如图1所示。

Picture1.png

1  应用分析决策中心支撑系统结构图

以建立“流量包”产品的营销方案为例,通过提取连续4个月用户的手机号码、总流量、套外流量(收入)、当前流量包办理情况、流量包包含流量、网络质量等数据,依托信息支撑平台快速整合数据。

其中,用户常驻小区的网络质量直接影响到用户的上网感知,根据MR数据,将用户常驻小区网络质量分为好、中、差三类((RSCP>= -90 dBm& Ec/Io>= -10dB的周期性MR点数) / (RSCP >= -90dBm的周期性MR点数)大于等于80%,定义为好;大于等于60%,小于80%定义为中;低于60%为差)。决策中心同时根据植入的聚类算法对每个月录入的流量数据进行聚类整理自动调整分类门限。信息支撑平台输出部分数据字段如表1所示。

1  信息支撑平台输出分析所需数据

Picture1.png

2.2      实现场景化触点分析,支撑营销“准实时”化

结合市场部门的营销策略,对时域、地域、网络、用户、终端、业务等多维度数据开展深入分析,建立数据挖掘模型,将关联分析算法模型固化至基于智能管道的场景化触点营销支撑工具中,精准定位目标用户特征,快速输出匹配不同场景营销策略的目标用户清单,根据用户模型的变化,及时调整支撑方案,实现用户需求的及时响应和准实时触点营销支撑,抢占营销先机。

Picture1.png

图 2  场景触点营销工具设置示意图

依据关联分析算法建模,输出的“流量包”的营销规则如表2所示:

表 2  “流量包”营销规则

规则

结果

是否开通流量包

总流量级别

是否超套

2-4月有无开通流量包

话务量

网络质量

2-5月累计超套次数

符合用户数

营销优先级

中等流量用户以上

超套

话务量>0

 or 中

4

2326

一级优先级

3

3973

二级优先级

2

6123

三级优先级

1

10342

四级优先级

由于“流量包”的产品特性是以月为单位进行流量结算的,用户在靠近月底的时候办理“流量包”的意愿会降低,故越早开始营销,营销成功概率越高。通过将营销规则植入到触点营销工具中,实现了营销方案的快速输出,较旧工作模式输出时间节省了4倍,营销方案得以在中旬前完成输出,加快了提交给市场部开展营销工作的速度,提高营销成功率。

2.3      构建“知识”(Learning)策略系统,实现流量经营全过程闭环支撑

通过在营销前策略分析、营销中精准执行、营销后效能评估,进而完善策略,形成基于“知识”的流量经营闭环支撑体系。流量经营闭环营销体系示意图如图3所示。

Picture1.png

图 3  流量经营闭环营销体系示意图

1)营销前策略分析:营销开展前,数据分析团队根据商业背景确认分析目标,通过针对时域、地域、网络、用户、终端、业务六大维度数据挖掘模型的构建,最终实现目标用户的输出。

2)营销中精准推送:营销开展中,数据监控团队通过锁定目标用户,紧密跟踪其流量消耗、业务使用等上网行为变化情况,时时掌握营销信息。

3)营销后策略完善:营销开展后,数据评估团队根据营销反馈结果,营销接触总人数、成功营销接触人数、营销成功人数、接触人数转化率等指标评估营销前策略,并开展针对性调整,实现基于“知识”的流量经营闭环支撑体系。

3       基于机器学习的市场营销支撑效果

3.1      基于信息支撑平台触点营销支撑效果

5S市分公司依据流量经营支撑平台输出结果,对部分目标用户开展“流量包”电话营销,其中外呼量2070户,成功接通821户,电话接通率39.66%,有意向订购用户105户,最终55个用户成功订购“10元流量包”产品,有意向订购比例为12.79%,实际“流量包开通成功率6.7%,流量经营市场营销支撑获得了初步的成效。

Picture1.png

图 4 营销后策略完善思路

3.2      基于“知识”策略系统的闭环支撑效果

针对5月份“流量王”营销情况,市场部门在认同营销效果的同时也提出了不足:如外呼接通率低,有意向订购用户实际开通的转化率不高等。通过分析未接通电话的用户及同意订购“流量包”产品,最终无法开通业务用户的数据,制定了营销策略改善方案:统一用10010号码外呼,避免用户不接听陌生电话号码营销,同时增加用户话务量字段,不对无话务量用户进行电话营销,提高电话接通率;优化算法规则,调整标签门限,更早输出方案开展营销,提高用户接受业务办理的意愿;增加用户套餐字段,挖掘因套餐冲突导致不能开通“流量包”产品的套餐类别,提高最终业务营销的开通率。营销策略完善思路如图5所示。

Picture1.png

5 营销策略完善思路

通过完善营销策略,6S市分公司“流量包”电话营销效果显著:外呼用户8207户,其中电话接通用户4910户,电话接通率高达59.83%,环比提升0.51倍;有意向订购用户1650户,实际开通业务用户1480户,有意向订购比例为33.60%,环比提升1.63倍;实际开通成功率跃升到30.14%,环比提升3.5倍,较传统电话营销成功率提升约6PP

Picture1.png

 6 S市分公司“流量包”营销提升效果

4       结束语

某省运营商积极探索机器学习的大数据挖掘应用,通过构建以数据仓库为载体的流量经营支撑平台,实现多维数据的关联分析,建立用户模型,精确定位用户需求。同时形成基于“知识”的流量经营闭环支撑体系,通过机器学习不断完善营销支撑方案,“流量王”产品电话营销成功率高达30.14%,高于传统电话营销6pp,效果显著。通过技术创新实现市场精准营销,以大数据挖掘与机器学习技术支撑市场仍有较高的研究意义和较大的实践空间,值得深入研究和推广。

 

5参考文献

1Pete ChapmanJulian Clinton等著.CRISP-DMstep-by-step data mining guide

2J. Han and M. Kamber等著.《数据挖掘:概念与技术.机械工业出版社

3黄国贤叶世青,《基于网络侧大数据挖掘助力市场精准营销的应用探索广东通信青年论坛2015年

 

 

 


上一篇: 基于POLQA算法的移动网语音质量MOS测试原理及VOLTE应用
下一篇: LTE网络PCI冲突优化策略及实践
返回列表页

全国统一热线

-

返回顶部