如何构建RFM+品类偏好组合特征?

解读

面试官问“RFM+品类偏好组合特征”,并不是想听你把 R、F、M 公式背一遍,而是考察三件事:

  1. 你能否把用户价值分层品类经营场景打通;
  2. 你能否用国内可落地的数据口径(阿里、京东、抖音、微信小程序)做特征工程;
  3. 你能否让这组特征直接服务于运营策略(选品、发券、Push、直播间排品),而不是停留在“跑数”层面。

因此,回答必须体现“业务可解释 + 工程可复用 + 策略可闭环”。

知识点

  1. RFM 中国化口径

    • R:最近一次有效支付距今天数,剔除退款订单;
    • F:最近365 天支付订单数,国内平台多按“天”而非“周”计算;
    • M:最近 365 天实付金额(含红包抵扣后),不含邮费与退款。
  2. 品类偏好权重

    • 一级品类下用**“单量权重 0.6 + 金额权重 0.4”**计算偏好得分,防止高客单低频品类被淹没;
    • 加入时间衰减系数 λ=0.92^t(t 为订单距今天数),让最近行为更高;
    • 对“母婴、宠物、酒水”等政策敏感品类单独打标,方便后续合规过滤。
  3. 特征组合方法

    • 先对 R、F、M 做五等分(国内电商常用 5×5×5=125 群),再与Top2 品类偏好交叉,得到“125×2=250 维”稀疏特征;
    • 为降低稀疏性,用**“RFM 分层编码 + 品类偏好 One-hot”**双通道输入,Tree 模型可直接消化;
    • 对营销响应模型,再衍生**“品类偏好集中度(Gini)× RFM 得分”**交互特征,提升 AUC 2~3 个百分点。
  4. 策略落地闭环

    • 高 RFM + 奶粉偏好→ 京东/天猫站内:推“新品一段试用装”,站外抖音投“孕妈痛点短视频”;
    • 低 RFM + 休闲零食偏好→ 微信小程序发“第二件半价”限时券,48h 内未核销自动再推 5 元无门槛;
    • 中 RFM + 白酒偏好→ 节日前 7 天 Push“礼盒预售”,并给 88VIP 叠加 95 折,ROI 低于 1 即停投。

答案

步骤 1:数据准备

  • 取数范围:最近 365 天已完成订单,剔除退货、刷单、内部测试订单;
  • 金额口径:以用户实付+平台优惠分摊为准,保证 M 与财务 GAAP 对齐。

步骤 2:RFM 分位切割

  • 月度动态分位(每月 1 日重算),解决大促后值域漂移;
  • 对 R 采用**“自然日”维度,F、M 用“订单粒度”**,防止合并支付失真。

步骤 3:品类偏好得分

  • 品类映射到国内统一类目 ID(天猫 5000+、京东 6000+),先做类目归并到 50 个一级品类;
  • 计算衰减后订单量权重 0.6 + 衰减后实付金额权重 0.4,取 Top2 品类作为用户标签;
  • 对**跨品类占比<5%**的长尾订单,归入“其它”,避免噪音。

步骤 4:组合特征工程

  • 基础层:R、F、M 五分位(1~5)直接拼接,如“512”;
  • 交叉层:RFM 编码 + Top1 品类 ID,生成“512-奶粉”复合键;
  • 统计层:再算**“品类集中度×RFM得分”“品类客单价/平台客单价”**等 10 个比率特征;
  • 输出:给营销自动化平台(如京东通天塔、阿里达摩盘)做人群圈选,延迟<30min。

步骤 5:策略验证

  • A/B 维度:同一 RFM+品类群,随机 10% 不发券做对照;
  • 核心指标:支付转化率、ROI、品类复购率
  • 迭代周期:两周一次,低于行业基准 90% 即下线。

拓展思考

  1. 多品类共存场景:当用户 Top2 品类占比接近(差值<5%),可引入**“品类组合包”**策略,如“奶粉+尿裤”联合券,测试交叉客单价提升。
  2. 直播电商增量:把 RFM 中的 F 拆成**“直播订单占比”,M 拆成“直播客单价”**,再看品类偏好,能精准识别“直播易感高价值人群”,用于抖音 Feed 流投流。
  3. 隐私合规:2024 年《个人信息出境标准合同办法》生效,若特征需出境训练模型,必须对用户 ID 做哈希加盐,且品类标签需脱敏到统计层级,避免单用户可逆。