请设计一个基于Agent的个人助理产品,描述其规划、记忆和行动循环。
解读
面试官想验证三件事:
- 能否把“Agent”这一技术概念拆解成可落地的中国用户场景,而不是炫技;
- 能否把“规划-记忆-行动”闭环做成数据-模型-产品闭环,兼顾算法指标与商业指标;
- 是否具备合规、隐私、算力成本意识,能一句话讲清监管红线。
因此,答案必须给出:
- 一个高频、付费意愿强、数据可闭环的细分场景;
- 可量化的算法目标(召回、准确率、拒识率)与业务目标(DAU、付费转化、节省时长);
- 记忆分层方案(上下文、用户画像、世界知识)及国产化存储选型;
- 行动层对API、RPA、小程序、App推送的调度策略;
- 数据回流与模型迭代节奏,以及《个人信息保护法》下的匿名化机制。
知识点
- Agent三元组:规划(Planning)、记忆(Memory)、行动(Action)。
- 记忆分层:短期上下文(Session)、中期用户画像(Profile)、长期世界知识(Knowledge)。
- 规划算法:意图识别+槽位填充→DAG任务分解→强化学习重排序。
- 行动通道:本地API、H5小程序、RPA、IoT指令、App推送、短信、微信客服消息。
- 数据闭环:用户反馈→埋点→标注平台→模型微调→A/B→灰度→全量。
- 合规:PIPL、数据出境评估、深度合成备案、算法备案、双清单(个人信息收集清单、权限调用清单)。
- 算力成本:7B以内端侧小模型+云端MoE混合推理,按Token阶梯计费,峰值用阿里云spot实例。
答案
场景定义
“职场妈妈晨间分身”:工作日7:00-9:00,帮用户完成“叫娃起床+早餐菜谱+路况导航+公司会议纪要预习+请假/出差OA审批”五件事,目标把出门准备时间从60分钟降到45分钟,付费点订阅制18元/月。
角色设定
Agent名称“小晨”,人设“靠谱同事”,音色用中文女声合成,需通过深度合成备案。
规划循环(Planning Loop)
- 触发:闹钟响→用户语音“我醒了”。
- 意图识别:多标签分类模型(6类意图,Macro-F1≥0.92),拒识阈值0.85,低于阈值转人工客服。
- 任务分解:用有限状态机把“五件事”拆成17个子任务,生成DAG;关键路径用A*重排,优化目标=min(时间+用户焦虑指数)。
- 资源校验:检查本地冰箱摄像头、车载导航API、OA系统Token是否可用,任一失败走降级文案。
记忆循环(Memory Loop)
- 短期:会话级上下文,32k Token,存在本地SQLite+加密,30分钟自动销毁。
- 中期:用户画像,包括娃的口味禁忌、常走路线、会议偏好,用阿里云Tablestore主键UserId,字段做AES-256加密,支持可撤销Token,满足PIPL“可携带+可删除”。
- 长期:世界知识,菜谱、路况、公司组织架构,用向量数据库Milvus(国产化版本),每月增量训练一次BERT-whitening,召回率≥95%。
行动循环(Action Loop)
- 本地:HarmonyOS Next接口调起智能烤箱预热、车载导航投屏。
- 云端:
- 钉钉OA审批流,用RPA脚本模拟点击,成功率≥99%,失败转人工代办并推微信模板消息。
- 会议纪要预习,调用自研7B模型生成3行摘要,首句命中率≥85%,用户可一键“展开”或“换一批”。
- 反馈:每一子任务结束弹3秒Toast+震动,用户可语音“不对”立即回滚;负样本实时写入Kafka,30分钟内进入标注队列,24小时内完成微调,T+1早高峰灰度。
关键指标
- 算法:意图识别F1≥0.92,任务完成率≥96%,拒识率≤3%。
- 业务:次留≥55%,月付费转化≥12%,人均节省时长≥15分钟。
- 合规:数据出境评估报告编号在隐私政策可查询,算法备案号在设置页常驻。
拓展思考
- 多Agent协同:若家庭里已有“小度”“小爱”,如何用小晨做统一调度而不被生态封杀?答案:用微信硬件平台做中性入口,协议层封装“小晨技能卡”,厂商只需实现HTTPS接口,降低对接阻力。
- 记忆压缩:连续使用90天后,中期记忆膨胀到200MB,端侧存储吃紧。可引入“记忆重要性打分”+LoRA增量蒸馏,只保留TOP 20%高权重向量,压缩率80%,用户可手动“找回遗忘”。
- 商业模式升级:把“节省15分钟”换算成“每月多睡7小时”,与保险公司合作推出“好睡眠保费折扣”,Agent数据经用户授权后成为可核保数字资产,开辟第二收入曲线。