如何验证评分与30日GMV的单调性?
解读
面试官想知道三件事:
- 你是否理解“单调性”在业务里的真实含义——评分越高,30日GMV是否统计意义上也越高,而不是简单线性;
- 你是否能把“评分”拆解成可落地的指标(店铺评分、商品评分、服务评分、DSR、NPS等),并匹配到国内主流电商平台可拉取的数据表;
- 你能否用最小可行代价完成验证,兼顾数据埋点现状与实验伦理(不伤害低评分用户)。
一句话:让业务方在1~2天内拿到“评分↑是否带来GMV↑”的可行动结论。
知识点
-
单调性检验
- 非参:Spearman ρ、Kendall τ
- 参:序数回归(Ordinal Logit)+ 边际效应
- 业务:分段 bucket 检验(≥4.8、4.6–4.8、<4.6)
-
国内可落地的评分口径
- 天猫/淘宝:DSR 三项(描述、服务、物流)
- 京东:店铺星级(含售后、物流、客服)
- 抖音:带货口碑分(商品、物流、服务)
-
30日GMV 定义
- 用户维度:近30天支付成功且未退款的订单实付金额汇总
- 风控剔除:刷单、平台判责退款、羊毛党标识
-
因果识别
- 若仅做相关性可直接回归;若谈策略必须做断点回归(RDD) 或工具变量(IV)——例如利用平台评分四舍五入规则作为外生冲击
-
显著性 & 效应量
- 在千万级样本下,p 值极易显著,必须汇报cohen’s d 或每0.1分带来的GMV弹性
-
A/B 伦理
- 国内《个人信息保护法》要求数据脱敏;低评分组不能人为降权,可用**“评分彩蛋”**策略反向加权
答案
步骤一:明确假设
H0:评分与30日GMV不存在单调递增关系;H1:存在
步骤二:取数
从阿里odps或京东JDQ拉取最近90天活跃买家样本,字段:
user_id、dsr_avg、30日GMV、城市等级、会员等级、近30天访问频次、品类偏好
步骤三:清洗
- 剔除刷单标识=1、**退款率>80%**的用户
- 对DSR做截尾处理(0.5%–99.5%),减少恶意差评与刷满分噪音
步骤四:单调性检验
- Spearman 检验:若ρ>0 且 p<0.001,通过;
- 分段检验:
- 将dsr_avg按0.2分一段分成k组,计算每组的**log(GMV+1)**均值
- 用Jonckheere-Terpstra检验是否存在有序备择
- 经济显著性:评分每提高0.1,GMV弹性=(ΔGMV/GMV)/(Δscore/Score),若>1%即认为可行动
步骤五:因果加固(可选)
利用DSR四舍五入断点:当店铺得分=4.749→展示4.7,4.750→展示4.8,用Sharp RDD看展示分跳变对30日GMV的影响,验证**“评分感知”而非真实体验**的单调性
步骤六:结论输出
“在95%置信水平下,评分与30日GMV存在统计单调递增;评分每提升0.1,GMV平均上涨2.3%,弹性显著;RDD 结果进一步证明评分展示对GMV 存在因果型单调。”
拓展思考
- 非线性拐点:当评分>4.9 时,GMV 边际增益骤降,提示**“满分疲惫”——后续策略应把4.7→4.8作为核心区间**而非盲目冲5.0
- 负向单调:部分高客单3C品类出现评分↑、GMV↓——原因可能是极客用户打分严苛,但购买力强;需品类*评分交互项再建模
- 策略落地:
- 对4.6以下用户推**“服务补救券”(48小时内赔付),目标0.2分提升**
- 对4.8以上用户推**“晒单激励”,维持正向单调同时降低满分成本**
- 长期指标:把30日GMV 换成CLV或复购周期,检验单调性是否衰减,避免短视刷分伤害品牌忠诚