如何验证敏感度与历史用券行为一致性?
解读
面试官想知道三件事:
- 你能否把“敏感度”拆解成可量化指标;
- 你能否用历史用券行为反向验证这些指标;
- 你能否用国内主流数据工具(如阿里云MaxCompute、字节DataWind、腾讯TEG)在合规(《个人信息保护法》《数据安全法》)前提下完成闭环。
一句话:让“感性标签”变成“可证伪数据”。
知识点
- 敏感度定义:价格敏感度=∆订单转化率/∆优惠力度,通常用价格弹性系数表示。
- 历史用券行为核心字段:券批次、券面额、门槛、订单实付、SKU客单价、券后毛利率、用券间隔、退款标记。
- 一致性检验方法:
- 皮尔逊相关系数(连续变量)
- 卡方检验(分箱后类别变量)
- PSM+双重差分(剔除人群混杂)
- 数据合规:必须走脱敏沙箱,用户ID要哈希化,优惠券金额做分桶离散,避免直接暴露个人资产信息。
- 业务阈值:国内电商普遍把| r |≥0.35视为“显著相关”,小于0.2则判断为“标签失效”,需回炉重训。
答案
第一步,定义敏感度。用近180天订单数据,计算每个用户在不同券梯度(5元、10元、满100-20等)下的转化率弹性,弹性越高则价格敏感度越高,把用户分到高敏、中敏、低敏三档。
第二步,抽取历史用券行为。筛选同期同一批券的核销订单,汇总每人用券次数、用券金额占比、券后复购间隔三大指标。
第三步,一致性验证。
- 连续变量打法:把“弹性系数”与“用券金额占比”做皮尔逊相关,若|r|≥0.35且p<0.01,说明标签与行为一致;
- 类别变量打法:把敏感度三档与“是否高频用券(≥3次/30天)”做卡方检验,若χ²显著且Cramer’s V≥0.3,通过;
- 因果打法:用PSM按性别、城市、历史客单价1:1匹配高敏/低敏人群,再跑DID看券核销率差异,若高敏组提升幅度显著高于低敏组(Δ≥8%,t≥2.58),一致性得证。
第四步,工程落地。把以上脚本封装成Airflow每日任务,输出一致性监控表:日期、人群包、相关系数、p值、是否通过阈值。连续7天未通过则触发标签重训告警,并@用户运营与数据治理团队。
第五步,合规留痕。所有原始日志存入脱敏Hive表,操作记录写入数据门户审计库,确保可追溯、可删除、可举证。
拓展思考
- 如果业务侧把“敏感度”泛化成“优惠偏好”,你还要加入非价格优惠(积分、会员日特权)行为,用多分类逻辑回归重新校准。
- 当优惠券与直播红包叠加时,存在“优惠来源混淆”,需引入Shapley值分解计算各优惠渠道的边际贡献,再检验敏感度。
- 在私域社群场景,用户可能“囤券不用”,导致行为滞后,建议把观察窗口从30天延长到滚动90天,并用生存分析中的Cox比例风险模型处理右删失数据。