在传统行业(如制造业)中,AI产品应如何与ERP、MES等系统集成?
解读
面试官问“如何集成”,不是在考接口协议,而是在验证候选人是否具备“把算法能力嵌入到既有生产系统”的端到端产品视角。制造业的ERP/MES是稳态核心,任何AI模块都必须“无感”接入、可回滚、可审计,且不能拖慢产线节拍。回答要体现三层能力:①对制造业OT/IT混合架构的敬畏;②对数据-模型-服务闭环的工程化拆解;③对合规、成本、灰度、ROI的量化管理。
知识点
- 制造业三层系统架构:L1设备层(PLC/SCADA)、L2执行层(MES)、L3计划层(ERP),AI产品通常落在L1.5-L2.5之间,需通过统一 namespace 的“制造数据对象”与上下层对话。
- 集成模式:
A. 旁路增强(推荐):通过 OPC UA/MQTT 把实时数据镜像到 AI 推理服务,结果以“建议”字段写回 MES 非关键表,人工确认后生效;
B. 嵌入式:AI 模型容器化后作为微服务注册到 MES 的 Java 容器(如 SpringBoot),通过 REST 供 MES 调用,需做熔断;
C. RPA 外挂:对老旧的封闭 ERP,用 RPA 机器人读写界面字段,适合低频场景,但审计链不完整。 - 数据一致性:采用“双写日志”机制,AI 服务先写本地时序库,再异步批量回写 MES,失败时触发补偿任务,保证账实一致。
- 灰度与回滚:利用 MES 的“工艺版本号”做开关,AI 推荐只在“测试版工艺路径”生效,24h 内可无感回滚到原路径。
- 安全合规:满足《工业互联网数据安全分类分级管理办法》三级要求,敏感字段(工人绩效、供应商价格)走国密 SM4 加密通道,模型输出留痕 6 个月以备溯源。
- 成本模型:按产线节拍 10s 测算,单次推理≤300ms,GPU 云边协同方案单条产线月租成本≤1.2 万元,ROI 以“缺陷率下降 0.8%”作为保底指标写进合同 SLA。
答案
以“AI 视觉质检”项目为例,分五步落地集成:
- 业务对焦:与生产部共创,明确质检工位在 MES 中的“过站”事件为触发点,AI 需在 8s 内返回 OK/NG 结果,并支持人工复判入口。
- 数据通道:在车间 5G 边缘盒部署 OPC UA Client,订阅 PLC 的拍照完成信号,同时拉取 3 张 2K 图像,通过 gRPC 传到本地 NVIDIA T4 推理容器;推理结果写回边缘盒的 Kafka topic,MES 通过统一 API Gateway 消费。
- 服务注册:将 AI 微服务注册到集团微服务中心(Nacos),配置 200ms 熔断、3 次重试;同时把“AI 置信度”字段写入 MES 的 QC_RESULT 表,原表结构零改动。
- 灰度发布:利用 MES 的“工单-工艺路径”维度,先在夜班 A 产线试点,设置开关参数 ai_qc_enable=1;若连续 3 个班缺陷漏检率<50ppm,则扩大到白班。
- 验收与计费:以 ERP 的“返工成本”科目作为收益锚点,上线 30 天对比,返工成本下降 12.6 万元,扣除 3.8 万元云边租赁费,净收益 8.8 万元,双方签字确认进入正式运维期,后续模型迭代走月度 MR 流程,无需再开新项目。
拓展思考
- 老系统无 API:若 MES 为 10 年前的 C/S 架构,可先在工控机上做“软网关”,用 Win32 消息钩子捕获窗体数据,再转 MQTT,但需评估 Windows 补丁重启对连续生产的影响。
- 多工厂模型漂移:集团 5 个基地数据分布差异大,可在边缘做一层“个性化微调”——每工厂 1 万张本地样本,用迁移学习更新最后一层,权重文件≤30MB,通过 Git LFS 下发,实现周级迭代。
- 商业模型创新:把 AI 节省的返工成本按 3:7 与 MES 供应商分成,绑定对方 KPI,可换取其主动开放数据库字典,降低后续集成阻力。