LLaMA 2 社区版在月活 >700M 产品中的合规限制有哪些具体条款?

解读

面试官想验证三件事:

  1. 你是否真正读过LLaMA 2 社区版《可接受使用政策》(AUP)与《社区许可协议》(Community License),而非道听途说;
  2. 能否把英文法律条款转化为国内业务红线,并给出工程落地的规避方案;
  3. 对“月活>700M”这一阈值触发条款是否敏感,能否量化风险。

知识点

  1. 700M MAU 触发“商业许可升级”条款:LLaMA 2 社区版在上一自然季度任意一个月“日活或月活≥700M”即自动失去社区许可,必须单独与Meta签署商业协议,否则立即侵权
  2. “衍生模型”定义:任何继续训练、微调、LoRA、知识蒸馏产出权重,均视为Derivatives,仍需遵守原限制;只调用API不改权重不在此列,但国内通常私有化部署,所以基本逃不开
  3. “禁止数据再训练”条款:不得使用Meta未公开的LLaMA 2权重作为教师模型去蒸馏自己的小模型,也不得把用户输入用于反向训练;与国内《生成式AI管理办法》第4条“不得利用用户输入迭代模型双重约束
  4. “不得用于改进竞品大模型”:协议明确禁止将LLaMA 2输出或中间表示用于训练、微调、评估任何参数>10B第三方通用大模型;国内大厂之间互相爬数据的做法直接踩线
  5. AUP 高风险场景清单医疗诊断、法律咨询、信贷决策、新闻采编、未成年人陪伴均被列为High-Risk;>700M 产品一旦在这些场景直接输出结论,Meta有权单方终止授权追偿
  6. 国内备案与算法评估:即便Meta商业授权拿到,模型入境仍需中央网信办算法备案安全评估700M 产品必然触发省级以上网信办“双新评估”,周期2-3个月不可并行
  7. 出口管制二次合规:LLaMA 2 权重托管在美国服务器,下载即触发EAR ECCN 3D991管制;>700M 产品若IaaS节点含美资云(如AWS中国),需额外OFAC筛查,否则随时被封号下架
  8. 开源传染性误解:LLaMA 2 不是OSI认证开源GPL/Apache 条款不适用;很多团队误把“开源”当“可闭源商用”,700M 后突然收到Meta律师函的案例已发生三起以上

答案

若产品月活>700M,LLaMA 2 社区版立即失效,必须:

  1. 30天内与Meta签署单独商业许可(含按MAU阶梯计费+年度审计),否则构成侵权
  2. 停止继续训练任何衍生模型,已微调权重需封存或销毁,直至拿到新授权;
  3. 高风险场景(医疗、法律、信贷、新闻、教育)必须加“免责声明+人工复核”双层网关,且不得出现确定性结论
  4. 用户输入不得用于反向训练,需在**《用户协议》显性告知技术上隔离日志**;
  5. 算法备案安全评估同步启动,省网信办会要求提交模型权重SHA256、训练数据来源、过滤策略、RLHF标注规范缺少Meta商业授权文件直接打回
  6. 出口管制层面,权重文件推理代码不得再次出口到OFAC禁运名单国家;若使用美资云,需季度自查留存审计报告

拓展思考

  1. 工程侧提前埋点:在模型加载层加入MAU计数器,当连续7天日均DAU>23M(≈700M MAU)即自动弹窗提醒法务提前90天启动商业谈判,避免业务停摆
  2. 双轨模型策略:主模型自研或国产备案大模型,LLaMA 2仅作为教师模型离线蒸馏线上不直接调用,可绕过700M限制;但需注意协议中“禁止用输出改进>10B模型”条款,蒸馏尺寸需<10B干脆用数据合成+人工标注清洗。
  3. 合规即代码(Compliance as Code):把AUP关键词做成实时内容安全拦截器,同步更新网信办最新违禁词库700M 产品一旦违规输出熔断并生成审计日志,方便应对Meta季度抽查