LLaMA 2 社区版在月活 >700M 产品中的合规限制有哪些具体条款?
解读
面试官想验证三件事:
- 你是否真正读过LLaMA 2 社区版《可接受使用政策》(AUP)与《社区许可协议》(Community License),而非道听途说;
- 能否把英文法律条款转化为国内业务红线,并给出工程落地的规避方案;
- 对“月活>700M”这一阈值触发条款是否敏感,能否量化风险。
知识点
- 700M MAU 触发“商业许可升级”条款:LLaMA 2 社区版在上一自然季度任意一个月“日活或月活≥700M”即自动失去社区许可,必须单独与Meta签署商业协议,否则立即侵权。
- “衍生模型”定义:任何继续训练、微调、LoRA、知识蒸馏产出权重,均视为Derivatives,仍需遵守原限制;只调用API不改权重不在此列,但国内通常私有化部署,所以基本逃不开。
- “禁止数据再训练”条款:不得使用Meta未公开的LLaMA 2权重作为教师模型去蒸馏自己的小模型,也不得把用户输入用于反向训练;与国内《生成式AI管理办法》第4条“不得利用用户输入迭代模型”双重约束。
- “不得用于改进竞品大模型”:协议明确禁止将LLaMA 2输出或中间表示用于训练、微调、评估任何参数>10B的第三方通用大模型;国内大厂之间互相爬数据的做法直接踩线。
- AUP 高风险场景清单:医疗诊断、法律咨询、信贷决策、新闻采编、未成年人陪伴均被列为High-Risk;>700M 产品一旦在这些场景直接输出结论,Meta有权单方终止授权并追偿。
- 国内备案与算法评估:即便Meta商业授权拿到,模型入境仍需中央网信办算法备案与安全评估;700M 产品必然触发省级以上网信办“双新评估”,周期2-3个月,不可并行。
- 出口管制二次合规:LLaMA 2 权重托管在美国服务器,下载即触发EAR ECCN 3D991管制;>700M 产品若IaaS节点含美资云(如AWS中国),需额外OFAC筛查,否则随时被封号下架。
- 开源传染性误解:LLaMA 2 不是OSI认证开源,GPL/Apache 条款不适用;很多团队误把“开源”当“可闭源商用”,700M 后突然收到Meta律师函的案例已发生三起以上。
答案
若产品月活>700M,LLaMA 2 社区版立即失效,必须:
- 30天内与Meta签署单独商业许可(含按MAU阶梯计费+年度审计),否则构成侵权;
- 停止继续训练任何衍生模型,已微调权重需封存或销毁,直至拿到新授权;
- 高风险场景(医疗、法律、信贷、新闻、教育)必须加“免责声明+人工复核”双层网关,且不得出现确定性结论;
- 用户输入不得用于反向训练,需在**《用户协议》中显性告知并技术上隔离日志**;
- 算法备案与安全评估同步启动,省网信办会要求提交模型权重SHA256、训练数据来源、过滤策略、RLHF标注规范,缺少Meta商业授权文件直接打回;
- 出口管制层面,权重文件与推理代码不得再次出口到OFAC禁运名单国家;若使用美资云,需季度自查并留存审计报告。
拓展思考
- 工程侧提前埋点:在模型加载层加入MAU计数器,当连续7天日均DAU>23M(≈700M MAU)即自动弹窗提醒法务,提前90天启动商业谈判,避免业务停摆。
- 双轨模型策略:主模型自研或国产备案大模型,LLaMA 2仅作为教师模型做离线蒸馏,线上不直接调用,可绕过700M限制;但需注意协议中“禁止用输出改进>10B模型”条款,蒸馏尺寸需<10B或干脆用数据合成+人工标注清洗。
- 合规即代码(Compliance as Code):把AUP关键词做成实时内容安全拦截器,同步更新网信办最新违禁词库,700M 产品一旦违规输出即熔断并生成审计日志,方便应对Meta季度抽查。