专业的短链接生成工具
链接域名
短网址有效期
数据分析方法:RFM模型
更新时间:2025-6-1 11:16:17 作者:爱短链
上一篇文章讲了【用户画像高大,但90%的人都失败了】之后,很多同学说想看RFM,它今天来了。
一、RFM基本原理 RFM缩写三个单词: 最后一次消费时间(Recency),在计数时,最后一次消费通常记录到当前时间间隔,如7天、30天、90天;直观地说,用户在商店消费时间太长,一定有问题,必须做一些事情,许多公司的用户觉醒机制是基于此。
消费频率在一定时间内(Frequency),在计数时,用户通常会在一段时间内获得消费频率。
例如,一年内消费多少个月,一个月内到达商店多少天,等等;直观地说,用户消费频率越高,忠诚度越高;许多公司的用户激励机制都是基于这一点,他们想让买一次,第二次。
在一定时间内累计消费金额(Monetary),取数时,一般取一段时间内用户消费金额,如一年内消费金额;直观地说,用户购买的越多,价值就越大;许多公司VIP该机制以此为基础,满1万银卡,满2万金卡。
因此,单独看这三个维度是有意义的。
当然也有三个维度交叉看(如下图): 因为RFM与时间有关,所以很多学生会纠结于如何划分时间;严格来说,生活必需品越多,业务消费频率越高,时间越短。
最典型的是新鲜的,人们每天吃,7天不吃可能有问题;普通的快速消费品零售可能需要30天,类似的服装百货公司零售可能需要90天;当然,更多的做法是按月,如R,F、M计算过去一年的值——这只是因为它更容易理解。
RFM本质上是一种用三个分类维度来判断标准的方法;用户的质量可以通过三个维度的组合来判断,然后采取相应的措施。
RFM真正的意义在于,这是一种从交易数据中反推用户价值的方法,所以可行性很高! 要知道,数据分析的最大瓶颈是数据采集,只要是正常企业,就必须有交易数据;因此,只要企业建立用户ID统一认证机制可以使用户ID与交易数据相关,可以使用RFM对用户进行分析;即使没有埋点,没有网站,没有基本信息也能做到,简直就是方便好用的神器。
当然,所有方便易用的工具都有自己的缺点,RFM模型也是如此。
二、RFM的最大短板 RFM最大的缺点是用户ID统一认证;不要低估这些词,在相当多的企业中很难实现。
例如,当你去超市、连锁店和商店购物时,收银员经常机械地问:你有会员卡吗?如果答案没有,她会让你去的;结果是线下商店的订单。
一般来说,70%-90%与用户无关ID;然后整个用户数据严重缺失,直接设置RFM很容易误判用户的行为。
至于用户一人多张会员卡轮流拉羊毛,多个用户一起拉羊毛VIP卡拿最大折扣,店员用亲戚的卡没有ID羊毛的订单等等,更是层出不穷;而且在实体企业、互联网企业中很常见。
所以做RFM当模型时,如果你真的看到111类用户,不要太。
十有八九有问题;如今,企业经常同时在天猫、JD.COM、自己的微商城、有赞等平台运营,这使得统一认证更加困难;没有好的规划,很容易陷入无尽的补贴坑。
三、RFM的深层问题 即使用户做得很好ID统一认证,RFM还有一个更深层次的问题。
让我们回顾一下,RFM模型的三个基本假设: R:用户离开的时间越长,损失的风险就越大 F:用户频率越高,越忠诚 M:用户买的越多越有价值 问一句:这三个假设成立了吗? 如果不结合特定的行业、特定的产品、特定的活动,它似乎是建立起来的;但一旦具体讨论发现许多场景不满足这三个假设;所以:简单地说RFM,不结合产品和活动,很容易生产BUG的。
R:用户离开的时间越长,损失的风险就越大 如果是季节性服装消费,用户间隔2-3个月是正常的; 假如是手机、平板等新产品驱动产品,间隔时间基本跟随产品更新周期; 假如是家居、住房、汽车等大型耐用品,R没有意义,用户一生买两次; 假如是预付费,后刷卡模式,R不存在,需要用验证数据代替。
因此,R并不一定意味着用户有损失的风险,特别是在埋藏数据后,用户的互动行为可以更好地解释问题。
F:用户频率越高,越忠诚 如果用户消费是由活动、节假日、生日、周末等事件驱动的; 假如用户消费是由活动驱动的,比如什么时候有折扣,什么时候买; 假如用户消费是固定模式,比如买药的量是30天。
上述情况会导致F值不固定,可能是随机或人为操作。
许多企业执行僵硬RFM模型,通常设置一个固定的F值,比如鼓励用户购买4次,因为数据购买4次以上的用户非常忠诚;结果导致用户人工拆除订单,最终F值上升,利润下降。
M: 用户买的越多越有价值 如果用户想便宜,有折扣的时候囤货呢? 假如用户买了一堆,吃腻了,用够了? 假如用户买了耐用品,买了这个单子就等十几二十年了? 假如用户消费本身就有生命周期,比如母婴,游戏,已经到了生命周期的尽头? 在很多情况下,用户过去买的更多并不意味着他们将来买的更多。
这两者并不等同;因此,如果你真的看到011、001和101的客人,不要急于发送优惠券。
关键是要了解出了什么问题。
除了单独维度的问题外,三个维度也容易出现问题;因为许多公司的用户结构不是金字塔形的,而是埃菲尔铁塔底部聚集了太多的非活跃用户,大多数非活跃用户只有一个订单,或者只有几次登录;因此RFM如果真的按八类分类,000用户的比例可能会特别大。
这意味着现有的生存用户可能是幸存者偏差的结果,现有的111不是000的未来;为了解决问题,我们应该更深入地分析为什么会沉淀大量不活跃的用户,甚至从根本上改变过程;RFM生搬硬套。
可能会把生意带到死胡同。
四、RFM的典型乱用 RFM在缺乏数据(尤其是缺乏埋点数据)的情况下使用并没有错。
RFM比不用RFM好太多了。
RFM三个维度,每一个都很好用;RFM整体架构也适用于评价用户运营的整体质量。
生搬硬套错了RFM,不做深入分析;错的是看到买大订单叫爸爸,看到用户不买急于发行优惠券;盲目发行优惠券不仅严重透支营销成本,而且培养更多的羊毛用户,破坏正常运营,只是为了RFM数值好看。
尤其是网上文章和网课最喜欢教的:按RFM,每个分为5段,分为5段*5*5=125类,然后用K值聚类聚成5-8类,更是大错特错。
K均值聚类后RFM原意清晰的优点都没有了,到底这八类怎么解读,很混乱。
不考虑数据滚动更新,一周或一个月后,RFM指标都变了!你还每天把所有的用户都拿出来聚类吗? k均值聚类不是一种稳定的分类方法,无监督分类更适合探索性分析;一周后,用户被分为两类,这将使营销、运营规划和执行政策非常疯狂:一天,推什么! 本质上,因为在线课程和在线文本给出了一个完美的静态数据表:一个不需要与其他部门合作,另一个不需要考虑连续场景,所以选择了一个模型 算法的做法。
嗯,能不能用并不重要,看起来你是最关键的! 五、如何让RFM更有用 综合RFM失败的场景可以看出,季节性、商品特征、促销活动、节假日事件和用户生命周期都会影响用户的行为;因此,它不局限于RFM,对用户场景的深入研究至关重要。
请注意,研究这五个要素并不像预期的那么困难。
例如,许多商品都有内在的相关性,只要熟悉业务就能理解;例如,季节性和假日事件本质上与时间有关;因此,可以分析用户登录和消费时间(如下图所示)。
促销活动也是如此。
促销活动可以直接从订单中识别出来,很容易给用户贴上敏感的促销标签。
用户生命周期需要数据采集,最关键的数据可以采集。
最典型的用户生命周期是母婴行业的做法。
企业将收集最关键的数据:怀孕多少周;父母不一定知道这个数据,母亲一定知道;如果你知道起点,你可以在后续计算。
类似地,药店连锁做慢性病管理,K12教育等等。
六、小结 任何模型都有其历史背景、数据基础和应用范围;并非所有模型的目的都是准确的;简单、易于使用、省事是更常见的考虑因素。
因此,再次强烈建议学生不要沉迷于成为知识收集者,试图找到宇宙中唯一的真理模型,然后死记硬背,崇拜。
研究自己工作的行业特点,改造方法为我所用,是让数据发挥更大作用的方法。
说到死记硬背,然后乱用的模型,除了RFM还有很多;比如关联分析,快2021年了,其实还有人相信啤酒和尿布,乱用也是一塌糊涂。
如果您感兴趣,请关注脚踏实地的陈先生。
请期待下一篇文章的分享。
特别说明:本网站的主要目的是收集与互联网运营相关的干货知识,为运营伙伴提供便利。
本网站收集的公共内容来自互联网或用户的贡献,这并不意味着本网站同意其观点,也不对网站内容的真实性负责。
如有侵权行为,请联系网站管理员删除,。