如何设置实时召回源以提升点击-转化路径?
解读
面试官问“实时召回源”,核心想看三件事:
- 你能否把用户行为数据与业务目标实时打通;
- 你能否在毫秒级响应里把“对的内容”推给“对的人”;
- 你能否用可量化指标验证召回源对点击-转化路径的真实增益。
在国内主流场景里,实时召回源=实时特征+召回策略+通道触达三件套,必须兼顾数据合规(个人信息保护法)、通道限额(微信模板消息、短信频控)、成本(短信0.035元/条、Push免费但到达率仅30%左右)。
知识点
-
实时特征层:
- 用户侧:最近30分钟事件序列(浏览、加购、领券、滑动深度)、实时意图分(TF-IDF向量化+轻量级LR或DSSM在线预估)。
- 商品侧:库存、价格、优惠券剩余张数、实时CTR、实时CVR、人群渗透率。
- 场景侧:时间段、渠道、设备、网络环境(5G/Wi-Fi)、地理位置(LBS围栏)。
-
召回策略:
- 行为触发召回:浏览未购买30分钟内推“同款低价”或“限时券”;加购30分钟未支付推“库存紧张+包邮”。
- 序列召回:用Transformer4Rec或MindSpore轻量模型,把用户最近50次点击序列编码,实时Top50召回。
- Look-alike召回:把高转化人群包(T+1离线)做成Redis Bitmap,实时计算Jaccard相似度,取Top200扩展。
- 优惠券敏感召回:实时判断用户是否属于“券敏感”分群(历史核销率>60%),优先推满减券而非直降。
-
通道与排序:
- 多通道并发:Push+短信+微信服务号,按疲劳度规则(同一用户24小时内最多2条)做通道去重。
- 实时排序层:用FTRL-Proximal在线学习,特征维度控制在200维以内,pCTR×pCVR×客单价×渠道权重打分,取Top1下发。
-
效果评估:
- 实时指标:下发10分钟后看点击-转化率、召回转化率、增量GMV(对照组为随机流量10%)。
- 长期指标:7日LTV、次月留存、渠道ROI≥1.5才全量。
答案
“我会分四步搭建实时召回源:
第一步,埋点补全。与产研对齐,把埋点延迟从15分钟压缩到1分钟内,用Kafka+Flink实时流,确保用户行为事件落库即可用。
第二步,特征快照。把用户最近30分钟行为写成Redis String+Hash结构,设置5分钟过期,商品维度的实时CTR、CVR用Flink窗口函数每30秒更新一次。
第三步,召回策略组合。先跑行为触发(浏览-加购-支付流失)占60%流量,再跑序列召回占30%,Look-alike占10%。所有策略输出商品ID列表后,再走统一实时排序模型,把pCTR×pCVR×客单价×渠道权重最高的1个商品+1张优惠券推给用户。
第四步,闭环验证。上线当天切10%随机对照组,核心看点击-转化率绝对值提升≥3个百分点,且单客召回成本≤客单价×毛利率×20%,连续3天达标后全量。上线两周后复盘,把低转化策略(如Look-alike)流量降到5%,把券敏感人群流量提升到25%,最终让整体点击-转化路径缩短0.8步,召回订单占比从6%提到11%。”
拓展思考
- 如果公司没有Flink集群,能否用阿里云实时计算Flink版或腾讯云Oceanus快速落地?预算怎么谈?
- 当iOS隐私政策导致设备号缺失,如何用服务端用户ID+私域UnionID做冷启动召回?
- 实时召回一旦过度,可能引发用户疲劳与渠道投诉,如何设置全局频控与负反馈(点“不感兴趣”立即降权)?
- 在大促峰值(如双11零点)QPS暴涨10倍,如何做降级预案:策略降级(只跑行为触发)、通道降级(只走Push)、模型降级(用静态分数)?