如何在不收集生物特征前提下判断用户未成年?

解读

面试官想考察的是:在**中国《个人信息保护法》《未成年人保护法》及《生成式人工智能服务管理暂行办法》三重红线之下,Agent 系统如何“零生物特征、零敏感个人信息”**地实时推断未成年身份,并据此触发适龄化策略(内容过滤、时长限制、消费拦截)。
核心矛盾有三点:

  1. 可用信号极稀疏:不能碰人脸、声纹、指纹、虹膜、DNA,甚至连实名身份证号的完整位都不能留。
  2. 误杀代价高:把成年人误判为未成年会触发严苛的“青少年模式”,导致留存与付费断崖。
  3. 对抗性强:未成年用户会故意伪装成成年人,Agent 必须持续演化。

知识点

  1. 合规底座

    • 最小必要原则:只采集“网络行为日志”这类非敏感数据,不碰任何可直接识别个人的字段
    • 未成年人身份推断≠实名认证:推断结果仅用于内部风控,不对外提供法律意义上的年龄证明,从而避开《个人信息保护法》第 28 条对“敏感个人信息”的明示同意要求。
  2. 特征工程

    • 会话级微观行为:触屏压力、加速度计抖动间隔、两击间隔熵、横竖屏切换频率;未成年手指长度短、点击轨迹曲率大。
    • 宏观行为图:24h 内 App 启动序列的 Markov 转移矩阵,未成年高频出现“短视频→游戏→教育”三元组。
    • 内容语义指纹:用户主动输入的弹幕、评论、搜索 Query 的TF-IDF 未成年关键词密度(“原神”“蛋仔派对”“老六”),经本地分词后只上传 128 维哈希向量,原始文本不出端
    • 社交子图结构:在公会/战队/好友网络中的三角闭合系数、出度年龄标签熵(若好友多数被系统标记为未成年,则中心节点概率提升)。
  3. 模型架构

    • 端侧微型模型:<500 KB 的 Temporal Convolution Network + 注意力池化,每秒输出未成年概率 p,p 值只保留 15 分钟 TTL 缓存,不落地硬盘。
    • 云端联邦校准:每日用 FedAvg 聚合千万设备的梯度,更新全局模型,服务端看不到原始行为明文;校准后用 knowledge distillation 把宏观规律回灌到端侧。
    • 对抗鲁棒层:引入 GAN 式 mimicry 训练,让 Generator 模拟未成年伪装行为,Discriminator 持续强化,A/B 测试显示伪装逃逸率从 12% 降到 2.3%
  4. 安全对齐机制

    • 双阈值策略
      – 高置信度(p≥0.92)直接触发青少年模式;
      – 中置信度(0.6≤p<0.92)进入 “主动对话验证”:Agent 发起多轮闲聊,用大模型隐式探针(如“你怎么看待高考选科?”)再跑一轮语义分类,全程不询问生日、学校等隐私
    • 可解释日志:每次触发记录 SHAP 值 Top5 特征,供合规审计,日志脱敏后保存 180 天自动销毁
  5. 规模化部署

    • 特征 SDK 与业务解耦:以 sidecar 进程形式注入,主 App 只通过 gRPC 接口获取未成年标签,失败时默认 adult 模式,确保可回退。
    • 灰度与漂移监控
      – 实时看板跟踪小时级未成年率漂移,超过 3σ 自动回滚模型;
      – 每周抽样 1% 用户做人工电话复核,持续更新 Ground Truth。

答案

“我们会构建一个端云协同、零生物特征、可解释、可回滚的未成年识别 Agent。

  1. 端侧采集非敏感行为信号(触屏节奏、App 序列、内容哈希向量),在本地跑轻量 TCN 模型,得到未成年概率 p;
  2. 每日用联邦学习聚合百万设备梯度,更新全局模型,再蒸馏回端侧,原始数据不出域
  3. 对 0.6≤p<0.92 的用户,Agent 启动多轮语义探针,用大模型隐式提问,进一步校准;
  4. 最终触发青少年模式的决策会记录Top5 SHAP 特征,支持合规审计,全程不碰人脸、声纹、身份证号
  5. 灰度发布+小时级漂移监控,异常 3σ 自动回滚,保证亿级并发下的稳定性与合规性。”

拓展思考

  1. 如果监管未来要求“可申诉”怎么办?
    可引入零知识年龄证明(zk-SNARK):用户在本地上传经过公安接口签名的“年龄>18”证明,Agent 只验证证明有效性,不保存任何身份明文,实现“既验证又匿名”。

  2. 如何防止成年人被永久误杀?
    设计遗忘机制:用户可在 App 内连续完成 3 道动态生成的生活常识题(题库每日更新 10%),Agent 将题目难度与答题时间作为新特征,实时下调未成年概率24 小时内自动解除青少年模式

  3. 多 Agent 博弈场景
    当未成年用户改用“家长代刷脸”绕过生物特征时,可启动跨设备 Agent 联盟:同一家庭 Wi-Fi 下多设备行为图谱出现**“异常时空互斥”(家长手机凌晨 3 点出现《蛋仔派对》日志),触发家庭级风险提示**,引导家长开启亲子平台守护,把技术问题转化为家庭教育问题