如何设计一个'解释开关',让用户自主选择查看解释的深度?

解读

  1. 场景定位:国内C端或B端AI产品(如信贷风控、医疗辅助诊断、智能客服)需在“算法可解释性”与“用户体验”之间做权衡。
  2. 政策红线:《互联网信息服务算法推荐管理规定》第12条要求“以显著方式告知用户算法基本原理”。若完全隐藏解释,合规风险高;若一次性抛出技术细节,90%用户会流失。
  3. 用户分层:
    • 路人型:只想知道“结果靠不靠谱”。
    • 理性型:想知道“为什么给我这个结论”。
    • 专家型:需要“证据链、特征权重、置信区间”去审计或二次开发。
  4. 技术约束:
    • 树模型可输出局部路径,深度模型需SHAP/LIME,计算耗时100~300 ms,高并发下成本×n。
    • 解释文本若超过60字,手机端一屏展示不下;若用图表,需考虑低端机WebView兼容性。
  5. 商业目标:降低客诉率、提升模型透明度得分(监管评分)、同时不牺牲转化率。

知识点

  1. 解释深度分级框架
    L0:仅置信度+一句结论。
    L1:关键正向/负向特征标签(≤3个)。
    L2:特征权重Top5+可视化条形图。
    L3:原始证据、对比案例、公式、SHAP热力图。
  2. 交互模式
    • 开关+滑动条:一次操作完成“开/关+深度”选择,符合国内用户“少点一下是一下”的习惯。
    • 分层折叠:L0默认展开,L1/L2/L3逐级异步加载,首屏渲染<300 ms。
    • 场景记忆:用localStorage记录用户上次选择,下次自动恢复,减少重复教育成本。
  3. 合规文案模板
    • 固定前缀:“系统基于XX模型您的历史行为数据综合计算得出”。
    • 变量后缀:根据深度插入“详细说明请见《算法说明页》”。
  4. 性能优化
    • 解释结果缓存:Key=用户ID+特征哈希,TTL=1 h,缓存命中率>70%。
    • 边缘渲染:把SHAP值提前算好,放在CDN,前端仅做可视化拼装,节省90%算力。
  5. 风险对冲
    • 敏感特征脱敏:收入、疾病等特征用“**”代替具体值,只保留方向。
    • 免责声明:在L3底部加“本解释仅用于帮助理解,不构成最终决策依据”,字体不小于11 px,防止用户截图断章取义。

答案

“解释开关”采用三级递进方案,兼顾合规、性能与体验:

  1. 入口设计
    在结果卡片右上角放“ⓘ”图标,点击后底部弹出半屏浮层,首行即“解释深度”滑动条(0~3档),默认停在1档;旁边有“记住选择”CheckBox,符合国内App隐私设置习惯。
  2. 深度内容映射
    0档:仅显示“系统置信度92%”。
    1档:增加3个高权重特征标签,如“近30天还款及时”“信用卡使用率<30%”。
    2档:横向条形图展示Top5特征权重,可左右滑动查看。
    3档:提供“查看完整报告”按钮,跳转至H5《算法说明页》,内含SHAP热力图、混淆矩阵、训练数据时间窗、模型版本号,满足审计需求。
  3. 性能与成本
    01档解释结果随主接口一并返回,增加<0.5 KB流量;23档走独立接口,仅当用户滑动到对应档位才触发,QPS压测目标:2档<100 ms、3档<600 ms;缓存策略如上。
  4. 合规与文案
    所有档位均在首行注明“算法名称+数据范围”,并在3档页面底部固定展示“模型更新日期+备案编号”,确保与网信办备案信息一致。
  5. 数据回收
    埋点:记录用户首次进入档位、停留时长、是否点击“完整报告”。目标指标:
    • 解释开关点击率≥25%;
    • 客诉率下降≥10%;
    • 3档解释页停留>30 s的用户占比<5%,防止过度纠结带来的负面体验。
  6. 迭代机制
    上线后跑4周A/B,实验组保持默认1档,对照组默认0档;若实验组客诉率显著下降且转化率无负向,则全量;若转化率下降>0.3%,则回退并调优文案,减少“还款及时”等敏感词暴露。

拓展思考

  1. 多模态场景:若输入为语音+图像,解释开关需同步给出“文本+高亮区域+时间轴”,此时L2档可引入“可播放的注意力热区”短视频,前端需预加载首帧,防止蜂窝网络下白屏。
  2. 企业级SaaS:B端客户要求白盒交付,解释开关可升级为“API参数”,客户可调depth=0~3,按调用量计费;同时提供“解释结果签名”字段,供客户内部审计系统验真,防止伪造。
  3. 生成式模型:对于GPT类对话产品,解释开关可演变为“思考过程”折叠区,采用<think>标签包裹,用户展开后看到的是模型生成的链式思考文本,而非传统特征权重;此时需额外过滤政治、违法内容,避免二次风险。
  4. 个性化推荐:未来可结合用户认知画像(教育程度、职业)动态调整默认深度,例如对“法律从业者”自动起档2,对“银发人群”强制0档且加大字号,实现“千人千面”的透明化体验。