如何设计A/B实验验证补贴ROI≥1.5?
解读
面试官想考察三件事:
- 能否把“补贴ROI≥1.5”这一业务目标拆解为可实验、可量化、可复现的统计指标;
- 是否熟悉国内主流补贴场景(如电商满减、外卖红包、出行券包)的成本回收周期与归因逻辑;
- 能否在资源受限、用户异质、政策合规的中国互联网环境下,给出最小可行且具备统计功效的实验方案。
一句话:让候选人证明“花出去的每一块钱补贴,能在实验周期内带回≥1.5元的增量收入”,且结论经得起财务、法务、算法三道关口挑战。
知识点
- ROI定义:实验视角下ROI =(实验组增量收入 – 对照组收入)÷ 实验组增量补贴成本。
- 最小可检测效应(MDE):ROI≥1.5等价于“每百元补贴需带来≥150元增量收入”,需据此反推样本量。
- 国内补贴合规:必须排除“薅羊毛”与“洗钱”风险,实验组券包需设置实名+限领+订单核销三重门槛。
- 周期选择:国内平台普遍采用7天短期回收+30天长期回收双周期,实验至少跑满两个完整自然月以覆盖账单周期。
- 多层分流:需用户层唯一分流,防止设备ID、手机号、支付宝账号多重映射导致的SUTVA违背。
- 显著性标准:因补贴金额大,须采用95%置信度+10% FDR控制,并向财务方提供单侧检验结果防保守。
- 协变量方差缩减:利用CUPED(Control Using Pre-Experiment Data)把历史30天GMV作为协变量,可将样本量降低25%以上。
- 国内数据工具:字节、阿里、腾讯均要求实验指标回写至内部数仓,并通过Aplus/Apollo/Borg等系统做实时熔断,候选人需提及。
答案
【步骤1:目标量化】
将“补贴ROI≥1.5”转译为可实验指标:
核心指标 =(实验组GMV – 对照组GMV)÷ 实验组补贴成本 ≥1.5
必须同时监测:① 补贴成本率≤8%;② 退款率相对提升<1个百分点;③ 负向舆情工单=0。
【步骤2:样本量与MDE】
假设对照组人均GMV 300元、σ=180元;期望检测到人均增量GMV≥45元(即ROI=1.5时,补贴成本30元)。
用CUPED缩减方差20%,得每组最少需14万用户(α=0.05,power=0.8,单侧)。考虑10%溢出与5%流失,最终入组32万用户。
【步骤3:分流与分层】
采用阿里DID分层+字节哈希uid末位截断混合方案,确保:
- 同一用户仅能被分到一组;
- 历史高活跃用户(近30天下单≥3次)单独stratum,防止补贴被高价值用户稀释;
- 新用户(注册<7天)独立实验,避免与老用户互相干扰。
【步骤4:实验设计】
- 实验组:领取“满60减30”券包,限实名+限1次+7天内核销;
- 对照组:不弹券,但保留常规运营活动(防止“黑暗效应”);
- 灰度节奏:先10%流量跑48小时,核心指标无**-5%以上波动**即全量;
- 实时熔断:若当日ROI<1.0且样本量>30%,自动停发券并推送告警至企业微信。
【步骤5:数据回收与检验】
- 收入归因窗口:券核销后7天+30天双口径,财务以30天为准;
- 统计方法:Welch’s t检验+CUPED修正,置信区间下限≥1.5方可判胜;
- 敏感性分析:做断点回归(RDD)验证券使用门槛附近用户的ROI是否依然≥1.5,排除“天花板用户”拉高效应。
【步骤6:结论与汇报】
只有同时满足:
- 30天口径ROI点估计≥1.5且95%CI下限≥1.32;
- 核心指标显著,防护指标不劣化;
- 财务、法务、内审三方签字;
实验方可全量上线,否则回滚并输出补贴阈值下调方案。
拓展思考
- 长期ROI与品牌资产:若实验周期拉长到180天,需用LTV预测模型(Gamma-Gamma+BG/NBD)把未来利润折现,避免低估品牌复购价值。
- 补贴 wear-out:国内用户存在“券疲劳”,可引入间隔给药设计(Intermittent Reward),用强化学习动态调券面额,持续验证边际ROI≥1.5。
- 政策变量:2025年起部分城市对大额优惠券需向央行报备,实验设计需预留合规缓冲池,确保突然政策收紧仍可48小时内零成本停券。