Python熊猫RFM模型应用实例详解

  

本文实例讲述了Python熊猫RFM模型应用。分享给大家供大家参考,具体如下:

  

什么是RFM模型

  

根据美国数据库营销研究所阿瑟·休斯的研究,客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:

  
      <李> <>强最近一次消费(近因):客户最近一次交易时间的间隔r值越大,表示客户交易距今越久,反之则越近,李   <李> <>强消费频率(频率):客户在最近一段时间内交易的次数.F值越大,表示客户交易越频繁,反之则不够活跃,李   <李> <>强消费金额(货币):客户在最近一段时间内交易的金额。m值越大,表示客户价值越高,反之则越低。   
  

RFM实践应用

  

1,前提假设验证

  

RFM模型的应用是有前提假设的,即R F M值越大价值越大,客户未来的为企业带来的价值越大。这个前提假

  

设其实已经经过大量的研究和实证、假设是成立的。不过为了更加严谨,确保RFM模型对于特殊案例是有效的,

  

本文还进行了前提假设验证:

  

ps:频率、货币均为近6个月内的数据,即1 - 6月数据;

  

利用相关性检验,验证假设:

  
      <李>最近购买产品的用户更容易产生下一次消费行为李   <李>消费频次高的用户,用户满意度高,忠诚度高,更容易产生下一次消费行为李   <李>消费金额高的用户更容易带来高消费行为李   
  

2, RFM分级

  

简单的做法,RFM三个指标以均值来划分,高于均值的为高价值,低于均值的为低价值,如此可以将客户划分为八大类:

  

 Python熊猫RFM模型应用实例详解

  

本文采取的方法是将三个指标进行标准化,然后按照分为数划分为5个等级,数值越大代表价值越高,当然最终划分的规则还是要结合业务来定。划分为5个等级后,客户可以细分为125种。

        #读取数据   rfm<-read.csv(~/桌面/rfm1_7.csv,头=TRUE)   总结(rfm)   #数据分布   票面价值(mfrow=c (1、3))   箱线图(rfm rankR1美元)   箱线图(rfm rankF1美元)   箱线图(rfm rankM1美元)   # rfm分级   美元breaks1<分位数(rfm近因,聚合氯化铝=seq(0、1、0.2),名称=FALSE)   breaks1<- c(1, 14日,30日,57111181)#以流失用户的定义来设置分级30天以上为流失用户   美元breaks2<分位数(rfm频率、聚合氯化铝=seq(0、1、0.2),名称=FALSE)   breaks2<- c (1、2、3、6, 14164)   breaks3<分位数(rfm货币美元,聚合氯化铝=seq(0、1、0.2),名称=FALSE)   rfm rankR1<美元;削减(rfm近因美元breaks1 5、标签=F)   rfm rankR1<美元;——6-rfm rankR1美元   rfm rankF1<美元;削减(美元rfm频率,breaks2 5标签=F)   rfm rankM1<美元;削减(rfm货币美元breaks3 5、标签=F)      之前      

3,客户分类

  

本文采用k - means聚类进行分类,聚类结果结合业务划分为4大类:

  
      <李> Cluster1:价值用户R F M三项指标均较高,李   <李> Cluster2, 3:用户贡献值最低,且用户近度(小于2)和频度较低,为无价值客户;李   <李> Cluster4:发展用户,用户频度和值度较低,但用户近度较高,可做起来营销;李   <李> Cluster5:挽留客户,用户近度较低,但频度和值度较高,需采用挽留手段李   
  

k值选择:

  

 Python熊猫RFM模型应用实例详解

  

聚类结果:

  

 Python熊猫RFM模型应用实例详解

        #聚类   df<-rfm [c (6、7、8))   p1<-fviz_nbclust (df、kmeans方法=皐ss”)   p2      

4, RFM打分

  

步骤3,我们将客户划分为四大类,其实如果一类客户中还有大量的客户,此时为了精细化营销,可以根据RFM进行加权打分,给出一个综合价值的分。这里,运用AHP层次分析法确定RFM各指标权重:

Python熊猫RFM模型应用实例详解