如何引入天气、节假日等外部特征?

解读

面试官问“如何引入天气、节假日等外部特征”,并不是想听“把天气字段写进 Excel”这种表层回答,而是考察候选人能否把外部宏观变量转化为可落地的用户运营策略,并解决三大痛点:

  1. 数据怎么来——国内合规渠道与实时性;
  2. 特征怎么用——与业务指标建立可验证的因果链;
  3. 策略怎么闭环——通过 A/B 测试、人群包、自动化触达实现可量化的业务增量
    回答时要体现“数据驱动+场景化运营+合规意识”,同时给出可复用的工程化思路,让面试官相信你不是拍脑袋,而是能直接上手干。

知识点

  1. 外部数据合规获取:国内主流渠道包括中国气象局商业授权接口阿里云市场天气 API国家公共节假日办发布的官方日历,以及高德/百度地图 LBS 天气服务;必须签署数据使用协议,避免爬虫带来的 GDPR/《个人信息保护法》风险。
  2. 特征分层模型:把原始变量加工成业务可解释特征——天气侧生成“当日气温分位等级”“降水概率等级”“体感温度突变”等;节假日侧生成“假期长度”“调休类型”“节日品类关联度”等;再与订单、活跃、召回等核心指标做皮尔逊/斯皮尔曼相关性检验,筛出 P<0.05 的高相关特征。
  3. 场景化策略矩阵:用决策树或贝叶斯结构将特征组合成场景,例如“高温橙色预警+暑假首日”→ 即时推送“空调清洗服务券”;“小雪+周五下班高峰”→ 推送“火锅外卖 30 元红包”;并提前 24h 把人群包写入Kafka 消息队列,保证零延迟触达
  4. 增量衡量:采用时间片轮转分层实验(time-based split),把全国 337 个地级市按天气/节假日强度分为实验组与对照组,核心指标看订单转化率 upliftpush 到达后 1 小时 GMV7 日留存提升,并用双重差分法剔除自然增长。
  5. 自动化闭环:把特征工程脚本封装成Airflow DAG,每日 6:30 自动跑批;模型输出写入Redis 特征库,供CDP 实时圈人;同时配置灰度熔断机制,若当日实验组 CTR 低于对照组 90% 置信下限,自动降级到默认策略,防止负向体验

答案

“引入天气、节假日等外部特征,我会分四步落地:
第一步合规取数,通过阿里云市场购买中国气象局商业授权接口,获取未来 72 小时分小时级天气国家节假日办官方日历,写入MaxCompute 外部表,每日 5:30 完成增量更新;
第二步特征加工,用 SQL+Python 把原始字段抽象成业务可解释特征,例如把 35℃以上且湿度>80% 标记为闷热高温标签,把中秋、国庆标记为长假期高出行标签,再与用户近 30 日活跃、消费做相关性检验,保留 uplift>1% 的特征;
第三步场景策略,在 CDP 里搭建天气×节假日决策矩阵,例如“暴雨红色预警+工作日早高峰”自动触发网约车延时券推送,人群圈选“过去 7 日有打车且未充值会员”的用户,券面额按RFM 模型动态计算,确保 ROI>1.5;
第四步实验与迭代,采用城市级分层实验,实验组推送天气策略,对照组保持原策略,核心指标看当日 GMV uplift7 日留存,并用双重差分法剔除节假日自然增长;所有脚本封装成Airflow DAG,实现T+1 自动复盘,若连续 3 天 uplift 为负,自动回滚。
通过这套闭环,我们曾在 2023 年暑期把高温场景下的冰饮订单转化率提升 18.7%,同时把push 退订率控制在 0.3% 以内。”

拓展思考

  1. 更细粒度特征:未来可引入空气质量指数(AQI)花粉浓度,对母婴、美妆、医药类目做过敏人群定向,预计高敏人群客单价 uplift可达 25% 以上。
  2. LBS 实时融合:把分钟级降水雷达图用户实时位置结合,做**“下雨前 5 分钟”推送外卖雨具套餐,需解决GPS 漂移电池消耗问题,可尝试地理围栏+基站辅助定位**。
  3. 长期品牌资产:把天气/节假日策略沉淀为**“气候关怀”品牌 IP,例如“暴雪补贴日”,既提升转化,又强化品牌温度**,实现业务增长与品牌忠诚的双重目标