满意度类电大毕业论文范文 和基于数据建模的家宽用户满意度预测方法相关论文写作资料范文

本论文是一篇免费优秀的关于满意度论文范文资料,可用于相关论文写作参考。

基于数据建模的家宽用户满意度预测方法

一、背景

NPS 是指客户的净推荐值,在通信领域它反映客户对网络的满意程度.本文提出一种基于数据建模的方法,将用户的NPS 推荐值与用户标签建立联系,从而应用模型来预测用户的满意度.NPS 满意度相关的自变量具有非线性、不独立同分布等特点,本文采用xgboost 模型进行建模,其在CRT中的应用相当广泛,提升算法理论上可以无限拟合,在保证数据质量的前提下可以获得比较好的效果.

二、特征工程

建模数据来源于宽带信令XDR 以及宽带用户标签,主要影响用户NPS 评分的三块特征区域包括宽带用户感知评分、宽带用户上网质量和宽带用户经分数据.

1)宽带用户感知评分特征明细

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\28.jpg┃

2)宽带用户上网感知特征明细

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\29.jpg┃

3)宽带用户经分特征明细

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\30.jpg┃

对客户NPS 值划分出满意用户和不满意用户的直观性定义:NPS >等于 8 or NPS<等于6, 其中NPS等于7 进行剔除,原因在于NPS等于7 处于分离界面的两侧,其训练数据较为敏感,可能会存在很大波动性,对模型构建不利.

从三块特征区域中选定各个特征区域相对应的特征指标进行连接操作,并对各个特征指标进行评估和筛选:

(1)有意义数据特征大概有60 个,凭借对家宽业务流程的经验进行判定,筛选剔除无用特征.

(2)某些特征具有很强的相似性,剔除缺失项较多的指标,减少对训练模型的影响.

(3)通过统计分析,筛选出满意和不满意用户特征分布差距较大的特征,该类特征具有明显区分度,属于显性特征.

三、模型训练

建模前对选取的特征参数进行相关性分析和数据预处理,改善数据效果,关键步骤如下:

1、相关性分析:评估两个特征之间的相关性,如果相关性很大,只选取其中一个属性参与训练模型;

2、缺失指标填充:分类离散指标用0 替代,连续数值指标采用均值插入,原因如下:

A、因为1 相对权重太高会对训练结果产生较大影响,导致模型出现难以预测的偏移;

B、对于连续的值,如果我们根据NPS 值来给属性赋予值,那么就是用已知结果在预测属性数据,容易产生过拟合,相当于训练数据误差减小,预测误差增大.

3、有效性及标准化处理,对数据做归一化处理.

完成数据预处理后对模型进行训练,xgboost 模型输出的是取值范围在0-1 之间的小数值,选取一个合适的门限,当取值> 门限值时,取正类,否则取负类;我们通过选取不同的门限值,使得正确率最大化,既为最优门限.Xgboost 模型公式如下:

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\32.jpg┃

四、模型准确性分析

对整个数据集,采用随机采样方法,按一定比例划分两块数据集(0.7 :0.3)得到training 和testing 数据集.从训练结果可以看threshold 最优取值0.55 时最大准确率约为0.51.

本次建模总共使用60 个特征指标,通过R 语言输出Xgboost 模型top20 个特征指标权重因子,如表所示.

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\33.jpg┃

通过模型对testing 样本进行预测,预测结果如下:

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\34.jpg┃

┃C:\Users\bookan\Desktop\ぉ早ぅ,クマさん~\35.jpg┃

五、小结

网络大数据作为运营商大数据的重要组成部分,除了在网络隐患挖掘和质量提升方面有成熟应用之外,在用户NPS推荐值及满意度预测中也具有较高应用价值.一方面随着网络与社会行为的高度融合,另一方面数据挖掘及机器学习算法的不断深入应用,网络数据在预测社会行为的研究中仍将发挥重要作用.

满意度论文范文结:

关于本文可作为相关专业满意度论文写作研究的大学硕士与本科毕业论文满意度论文开题报告范文和职称论文参考文献资料。

1、客户满意度论文