当前位置：首页 > news >正文

FactoryBERT：面向制造业的垂直领域语言模型

news 2026/6/8 20:56:40

1. 项目概述：为什么工厂需要自己的“母语”AI

你有没有在车间里站过十分钟？不是隔着玻璃窗看，而是真正站在CNC加工中心旁边，听主轴高速旋转的嗡鸣，闻冷却液混着金属碎屑的微腥，看操作工一边盯着HMI屏幕上的OEE实时曲线，一边对着对讲机喊：“三号线停机了，查PLC报警代码27-F04，快调维修组！”——那一刻，你意识到，制造业有一套自成体系的语言系统。它不靠修辞，靠精度；不讲比喻，讲参数；不谈情绪，只谈公差、节拍、MTBF、SPC控制图上下限。这套语言，是老师傅带徒弟时手把手教出来的，是设备手册里密密麻麻的英文缩写堆出来的，更是无数个夜班抢修、无数次工艺调试、无数次质量复盘沉淀下来的集体经验。

可问题是，当这套语言撞上当前主流的大语言模型，几乎就是一场单向失语。你让ChatGPT解释“什么是刀具磨损补偿值”，它能给你一段教科书式的定义，但如果你问“昨天三号车床加工Φ25.4±0.01轴时，表面粗糙度Ra从0.8突然跳到3.2，结合振动频谱在8.2kHz出现峰值，可能的根因是什么？”，它大概率会开始泛泛而谈“可能是润滑不足或夹具松动”，然后贴心地建议你“联系专业工程师”。这不是AI不行，是它根本没听过“8.2kHz”这个频率在轴承外圈故障中的特征意义，也没见过“Ra 0.8”和“Ra 3.2”在同一个工序中意味着什么——它缺的不是算力，是行业语境。

FactoryBERT要解决的，正是这个“语境断层”。它不是另一个通用聊天机器人，而是一个被“浸染”在制造数据里的语言理解引擎。它的训练语料不是维基百科词条，而是真实的设备点检表、维修工单、FMEA分析报告、SOP作业指导书、SPC过程能力报告、甚至老工程师手写的故障排查笔记扫描件。它学的不是“root cause analysis”这个词的字面意思，而是学会把“报警代码27-F04”、“主轴振动加速度RMS值超阈值120%”、“最近三次换刀后首件尺寸偏负0.015mm”这三组看似孤立的数据点，自动关联成一条逻辑链：“主轴轴承预紧力衰减 → 高速旋转下径向跳动增大 → 刀具切削力波动加剧 → 加工表面微观形貌恶化 → Ra值超标”。这才是制造业真正需要的AI：一个能听懂车间黑话、能看懂图纸符号、能推理工艺逻辑、能帮工程师把“感觉不对”翻译成“数据异常”的技术搭档。它不替代人做决策，但它能把人从海量碎片信息中解放出来，把注意力精准锚定在真正该发力的那个环节上。对一线班组长，它是随叫随到的“数字老师傅”；对工艺工程师，它是永不疲倦的“数据协作者”；对质量总监，它是穿透层层报表直达现场真相的“透视眼”。

2. 核心设计思路：从通用大模型到垂直领域专家的蜕变路径

把一个通用大语言模型（LLM）改造成制造业专家，绝不是简单地给它喂几本《机械制造工艺学》PDF就完事。这背后是一整套精密的“领域化手术”，涉及数据、架构、训练策略三个层面的深度重构。FactoryBERT的设计思路，本质上是在回答三个关键问题：用什么数据喂养它？怎么让它记住制造业的“语法”？以及，如何确保它学到的不是死知识，而是活推理？

2.1 数据层：构建真实、多源、带“毛边”的制造语料库

通用模型的语料是“干净”的互联网文本，而FactoryBERT的语料必须是“带毛边”的真实世界数据。我们团队在构建初始语料库时，刻意避开了教科书式、理想化的材料，转而聚焦于四类高价值、高噪声的真实数据源：

结构化生产日志（占比约35%）：来自MES/SCADA系统的原始数据流，包含设备状态码（如“RUN”、“IDLE”、“ALARM”）、传感器读数（温度、振动、电流、压力）、OEE分项计算（可用率、性能率、合格率）的原始时间序列。关键在于保留其“毛边”——比如某次主轴温度突升，日志里同时记录了“冷却泵压力骤降”和“操作员手动关闭冷却液阀门”的操作事件。这种因果并存的原始记录，比任何清洗后的“标准数据集”都更能教会模型识别异常模式。
半结构化工单与报告（占比约40%）：维修工单（含故障现象描述、初步判断、更换备件、最终确认）、质量异常报告（NCR）、工艺变更通知（ECN）、FMEA风险分析表。这类文本最大的特点是术语密集、缩写泛滥（如“TIR”代表Total Indicated Runout，“Cpk”代表过程能力指数），且常夹杂口语化表达（如“主轴哼哼响，像拖拉机”）。我们没有做标准化替换，而是将这些“不规范”本身作为学习信号——模型必须学会理解“拖拉机”在这里指代的是特定频段的异响，而非农业机械。
非结构化技术文档（占比约20%）：设备制造商提供的英文版维修手册（含大量电路图、液压原理图说明文字）、内部编写的SOP视频脚本、工程师在企业微信里的技术讨论截图（经脱敏）。这类材料的价值在于其上下文丰富性。例如，一份关于“伺服电机编码器校准”的SOP，不仅有步骤，还附有“若校准后定位误差仍大于±0.02mm，需检查联轴器同心度”的条件分支。模型通过学习这种“if-then-else”的隐含逻辑，才能建立真正的工艺推理能力。
专家知识注入（占比约5%）：由12位资深制造工程师（覆盖机加、装配、热处理、质量）口述录制的“故障诊断思维导图”音频，并同步整理成文字稿。内容如：“看到注塑件飞边，我第一反应不是调保压，而是先看模具排气槽是否堵塞，因为……”。这部分是模型的“元认知”训练，教会它模仿人类专家的排查优先级和思维路径，而非仅仅记忆结论。

提示：语料清洗的核心原则是“去隐私，不去噪声”。我们删除所有客户名称、具体订单号、员工ID，但刻意保留设备编号（如“CNC-307”）、报警代码（如“27-F04”）、公差带（如“H7/g6”）等真实标识。因为对模型而言，这些才是它未来要打交道的“实体”。

2.2 架构层：BERT的“制造业适配器”设计

FactoryBERT基于BERT-base架构（12层Transformer，768维隐藏层），但做了三项关键改造，使其从“通用词义理解者”蜕变为“制造语义解析器”：

领域词嵌入初始化（Domain-Specific Word Embedding Initialization）：我们没有使用BERT原生的WordPiece分词器，而是构建了一个包含2.3万个制造业专属词汇的子词表。这个子词表不仅收录了“spindle”、“tolerance”、“gauge”等基础词，更包含了“ball-screw-backlash”、“thermal-growth-compensation”、“die-casting-porosity”等复合技术术语。更重要的是，我们用一个小型的、在百万级设备日志上预训练的“制造词向量模型”来初始化这些词嵌入。这意味着模型在训练伊始，就已经对“backlash”（间隙）和“compensation”（补偿）这两个词在机械领域的语义距离有了基本认知，大幅缩短了收敛时间。
任务感知的多头注意力机制（Task-Aware Multi-Head Attention）：标准BERT的注意力头是通用的。我们在FactoryBERT中引入了“任务门控”机制。当模型被用于“根因分析”任务时，特定的注意力头会被激活，专门关注日志中的“报警代码+时间戳+操作员备注”三元组；当用于“工艺参数推荐”时，另一组头则聚焦于“材料牌号+加工类型+目标表面粗糙度”之间的关联。这相当于给模型装上了可切换的“专业滤镜”，让它能根据下游任务动态调整其“观察视角”。
工艺约束解码器（Process-Constrained Decoder）：这是最体现制造业特性的设计。在生成式任务（如自动生成维修建议）中，我们没有使用标准的Softmax输出层，而是设计了一个“工艺规则引擎”作为解码器的后处理模块。该引擎内置了数百条硬性规则，例如：“若输入中提及‘淬火’，则输出中禁止出现‘退火’一词”；“若检测到‘铝合金’材料，则推荐的切削速度上限为800m/min”。这确保了模型的输出永远在工程可行域内，杜绝了“理论上正确，实践中致命”的AI幻觉。

2.3 训练策略：从“背诵”到“推理”的跃迁

FactoryBERT的训练分为三个阶段，层层递进，目标明确：

阶段一：领域掩码语言建模（Domain MLM, 2周）：这是基础。我们用前述的制造语料库，进行标准的MLM（Masked Language Modeling）训练。但掩码策略做了优化：不是随机掩码，而是按概率掩码专业术语（如“Cpk”、“TIR”、“H7/g6”）和数值（如“0.015mm”、“8.2kHz”）。这迫使模型必须深入理解这些核心概念的上下文关系，而不是靠猜词频蒙混过关。
阶段二：工艺逻辑对比学习（Process Logic Contrastive Learning, 3周）：这是关键跃迁。我们构造了数万对“正例-负例”样本。正例是逻辑连贯的工艺描述，如：“材料：45#钢；工序：粗车→半精车→精车；目标：Ra≤0.8μm；措施：精车时降低进给量至0.08mm/rev，提高主轴转速至1200rpm”。负例则是人为打乱逻辑的版本，如将“45#钢”换成“铝合金”，或将“Ra≤0.8μm”与“进给量0.08mm/rev”强行配对。模型的任务是区分正负例。这个过程，本质上是在训练模型的“工艺常识”——它必须内化“不同材料对应不同切削参数”、“表面粗糙度与进给量呈强相关”等底层物理规律。
阶段三：任务微调（Task-Specific Fine-tuning, 1周）：针对具体应用场景（如OEE根因分析、维修工单摘要生成、SOP步骤问答），用标注好的小规模数据集进行监督微调。这里的关键是“少样本提示工程（Few-shot Prompt Engineering）”。我们发现，给模型提供3-5个高质量的“输入-期望输出”示例，比用1000条标注数据微调效果更好。例如，在根因分析任务中，我们给出的提示是：“[输入] 设备：CNC-307；报警：27-F04；振动：X轴RMS=1.8g（阈值1.2g）；尺寸：首件直径-0.015mm；[输出] 根因：主轴轴承预紧力不足导致径向刚度下降，切削中产生让刀，引起尺寸超差及高频振动。” 这种方式，让模型学会了如何将离散数据点编织成一条严谨的因果链。

3. 核心能力解析：FactoryBERT如何在真实场景中“干活”

FactoryBERT的价值，不在于它有多大的参数量，而在于它能在哪些具体、高频、痛点十足的制造场景中，把抽象的AI能力转化为可触摸的效率提升。我们不谈虚的“赋能”“驱动”，只说它在产线上真实干了什么、怎么干的、效果如何。以下四个核心能力，全部来自我们与三家合作工厂（一家汽车零部件厂、一家精密模具厂、一家半导体封装厂）为期六个月的实测验证。

3.1 OEE根因穿透：从“哪里坏了”到“为什么坏”

OEE（整体设备效率）是制造业的“血压计”，但传统OEE分析往往止步于“可用率低”、“性能率低”这类宽泛结论。FactoryBERT的突破在于，它能自动穿透三层数据，给出指向性极强的根因假设，并按置信度排序。

实操过程：
以汽车零部件厂的缸体加工线为例。某日OEE从92%骤降至78%，系统自动抓取了过去2小时的所有相关数据：

MES日志：记录了3次短暂停机（<5分钟），报警代码均为“27-F04”；
振动传感器：CNC-307主轴X轴振动RMS值在停机前15分钟内从0.9g稳步爬升至1.8g；
质量抽检：最后5件缸体的“缸孔圆度”指标，从0.008mm恶化至0.015mm（超差）。

FactoryBERT接收到这些结构化数据后，执行以下步骤：

术语映射与上下文加载：将“27-F04”映射到设备手册中的定义：“主轴驱动器过载保护触发”，并自动关联到同型号设备的历史维修记录（显示该代码80%的案例与轴承问题相关）。
多模态特征对齐：将振动RMS值的时间序列与停机事件时间戳对齐，确认振动爬升是停机的前置条件，而非结果。
工艺逻辑推理：调用内置的“机加工-几何精度”知识图谱，推理出“主轴径向刚度下降”会导致“切削让刀”，进而直接恶化“圆度”这一形位公差指标。这与质量数据完全吻合。
生成根因报告：输出：“最高置信度（92%）根因：CNC-307主轴轴承预紧力衰减，导致径向刚度不足。次要根因（65%）：冷却液流量不足（振动频谱中12kHz谐波增强，指示润滑不良）。建议：立即停机检查轴承游隙，并清洗冷却液过滤器。”

效果实录：
维修组按此报告检查，发现轴承游隙已超手册允许值3倍，冷却液滤网堵塞70%。修复后，OEE在2小时内回升至90%以上。整个过程耗时18分钟，远低于以往平均3.5小时的排查时间。关键是，报告直接锁定了“轴承游隙”这个具体可测量、可调整的物理量，避免了工程师在“电气故障”、“程序错误”、“夹具问题”等方向上无谓试错。

3.2 维修工单智能摘要：让“天书”变“说明书”

一线维修工程师每天要处理数十份工单，内容长短不一、详略各异、术语混杂。FactoryBERT的摘要功能，不是简单删减，而是进行“意图-实体-动作”三重提炼。

实操过程：
输入一份典型的长工单（原文约850字）：

“2023-10-25 09:15，三号装配线，AGV小车A-07在转运变速箱壳体（料号：TR-2023-ASM-001）至拧紧工位时，于RFID读卡区（位置Z3-07）突然停止，HMI显示‘通讯超时’。操作员重启小车控制器无效。后尝试手动推离读卡区，小车恢复运行，但10分钟后在同一位置再次停机。维修组初步检查：A-07小车本体通讯模块指示灯正常，Z3-07读卡器电源电压24.1V（正常），但用万用表测得读卡器RS485 A/B线间电阻为∞（开路）。拆下读卡器外壳，发现内部PCB板上RS485收发芯片U5（型号：SN65HVD72）引脚有明显烧蚀痕迹。更换U5芯片后，小车在Z3-07区域连续运行2小时无异常。另，该读卡器为2022年采购批次，同批次共安装12台，建议全面排查。”

FactoryBERT的摘要输出（仅120字）：

【故障】AGV小车A-07在RFID读卡区Z3-07反复通讯中断。
【根因】读卡器Z3-07内部RS485收发芯片（SN65HVD72）烧毁，导致通讯开路。
【措施】已更换U5芯片，运行正常。
【行动项】对同批次12台读卡器进行预防性检测（重点：U5芯片温升、供电纹波）。

效果实录：
这份摘要被直接嵌入工厂的CMMS（计算机化维护管理系统）中。新来的维修技师只需看这120字，就能立刻抓住核心：问题在哪（Z3-07读卡器）、病灶在哪（U5芯片）、怎么治（换芯片）、还要防什么（查同批）。它把一份需要工程师花10分钟精读的技术报告，压缩成一份30秒就能掌握的“作战指令”。在后续的月度设备健康分析会上，管理层也首次能快速从海量工单中，一眼识别出“SN65HVD72芯片”这个潜在的批次性风险点。

3.3 SOP智能问答：把纸质手册变成“活”的导师

工厂的SOP（标准作业程序）往往是厚厚一摞PDF，查找困难，更新滞后。FactoryBERT将其变成了一个可对话的“数字导师”。

实操过程：
一位新上岗的热处理操作工，在操作真空渗碳炉时遇到问题，他在平板电脑上打开FactoryBERT的SOP问答界面，输入自然语言提问：“今天要处理一批20CrMnTi齿轮，要求表面硬度58-62HRC，心部硬度≥35HRC，但炉内实际温度比设定值低了15℃，我该调哪个参数？调多少？”

FactoryBERT的响应流程：

实体识别：精准提取“20CrMnTi”（材料）、“真空渗碳炉”（设备）、“表面硬度58-62HRC”（目标）、“温度低15℃”（偏差）。
SOP检索与匹配：在知识库中定位到《20CrMnTi齿轮真空渗碳工艺规程》第4.2条：“温度偏差±10℃以内，可通过延长保温时间补偿；偏差>10℃，需重新校准热电偶并检查炉膛密封性。”
工艺规则应用：调用内置规则：“真空炉温度偏差>10℃，首要动作是停炉校准，严禁仅靠延长时间补偿，以防碳势失控。”
生成可执行指令：输出：“警告：当前温度偏差（-15℃）超出安全范围。请立即执行：1. 暂停当前渗碳周期；2. 按《热电偶校准SOP》校准炉内3支热电偶；3. 用氦质谱检漏仪检查炉门密封圈。完成校准后，重新启动工艺。切勿通过延长保温时间补偿！”

效果实录：
这位操作工没有凭经验“赌一把”去调时间，而是严格按指令停炉校准，发现一支热电偶漂移已达22℃。如果强行继续，可能导致整炉齿轮碳浓度不均，报废率飙升。FactoryBERT在这里扮演的，不是答案提供者，而是“安全守门员”，它用硬性规则阻止了人为经验主义可能带来的重大质量事故。

3.4 六西格玛项目支持：从“找问题”到“建模型”

六西格玛项目（如DMAIC）的核心是数据驱动，但前期“定义（Define）”和“测量（Measure）”阶段，工程师常陷于数据整理泥潭。FactoryBERT能自动完成从原始数据到统计模型的桥梁搭建。

实操过程：
某模具厂启动一个“降低注塑件飞边（Flash）缺陷率”的六西格玛项目。项目组收集了过去三个月的2000条生产记录，字段包括：模具编号、材料批次、熔体温度、模具温度、保压压力、保压时间、环境湿度、飞边尺寸（mm）。

传统做法：工程师用Excel手工筛选、用Minitab做相关性分析、再尝试拟合回归模型，耗时约3天。

FactoryBERT介入：

数据探查与清洗：自动识别出12条记录中“飞边尺寸”字段为空，标记为待人工确认；发现“环境湿度”字段存在单位不一致（%与RH混用），自动统一为%。
关键因子识别：运行内置的“制造过程敏感性分析”算法，输出各因子对飞边尺寸的贡献度排序：保压压力（42%）> 熔体温度（28%）> 模具温度（18%）> 环境湿度（12%）。这与工程师的直觉（他们一直认为温度是主因）相悖，引发了深度复盘。
交互式模型构建：工程师在界面上勾选“保压压力”和“熔体温度”为X轴，系统自动生成一个3D响应曲面图，并标出当前工艺窗口（绿色安全区）和最优操作点（红色星号）。更关键的是，它生成了可直接导入Minitab的、格式完美的回归方程代码（飞边 = 0.023 + 0.0012*保压压力 - 0.0008*熔体温度 + 0.00005*保压压力²）。

效果实录：
项目周期从预期的12周缩短至8周。最关键的是，模型揭示了“保压压力”与“飞边”之间存在显著的二次效应——即压力并非越高越好，存在一个最佳值。这直接指导了DOE（试验设计）的方案制定，使后续的验证试验次数减少了40%。FactoryBERT在这里的价值，是把工程师从繁琐的数据搬运工，解放为专注业务逻辑和决策的“数据策展人”。

4. 实操部署与落地要点：避开那些“纸上谈兵”踩过的坑

把FactoryBERT从实验室的Demo，变成产线上稳定运行的生产力工具，中间隔着无数个看似微小、实则致命的细节。我们和合作工厂一起，用半年时间趟平了这些坑。以下是最关键的五条实战心得，每一条都来自血泪教训。

4.1 数据接入：别迷信“API万能论”，拥抱“脏数据友好型”管道

很多团队一上来就想对接MES的官方API，结果卡在权限审批、接口文档缺失、数据加密协议不兼容上，耗时两个月毫无进展。我们的破局点，是彻底放弃“一步到位”的幻想，采用“三级数据管道”策略：

一级：文件快照（File Snapshot）：这是最快启动的方式。工厂IT每周一凌晨自动将MES数据库中关键表（设备状态、报警日志、质量检验）导出为CSV，上传至指定FTP服务器。FactoryBERT的ETL（抽取-转换-加载）服务每15分钟轮询一次，发现新文件即刻处理。虽然数据有15分钟延迟，但对于OEE根因分析这类场景，完全够用。实测心得：我们用Python的pandas和schedule库，1天就搭好了这个管道。它最大的优势是“零权限依赖”，只要能拿到文件，就能跑起来。
二级：数据库直连（DB Direct Connect）：当一级管道验证有效后，再与IT部门合作，申请一个只读数据库账号。我们不连接核心生产库，而是连接其每日凌晨生成的“数据仓库只读副本”。这样既满足了实时性（秒级延迟），又规避了生产库的安全顾虑。关键技巧：在SQL查询中，我们强制添加WHERE timestamp > NOW() - INTERVAL '2 HOUR'，防止因网络抖动导致全表扫描，拖垮数据库。
三级：边缘计算节点（Edge Node）：对于振动、声发射等高频传感器数据（采样率>1kHz），我们放弃了上传云端的思路。在每台关键设备旁部署一个树莓派4B（加装工业级SSD），运行轻量级FactoryBERT边缘版。它只做一件事：实时分析原始波形，一旦检测到特征频谱异常（如轴承故障特征频率幅值突增300%），立刻生成一条结构化告警（含设备ID、时间戳、特征频率、幅值变化率），通过MQTT协议发往中心平台。避坑提醒：边缘节点的固件必须支持“断网续传”。我们测试过，当网络中断4小时后恢复，所有积压的告警都能完整、有序地补发，毫秒级时间戳无一错乱。

注意：无论哪种管道，我们都坚持一个铁律——所有进入FactoryBERT的数据，必须携带完整的“溯源标签”。例如，一条振动数据，除了数值，还必须包含：{source: "edge_node_CNC307_vib", firmware_version: "v2.1.3", calibration_date: "2023-10-01"}。这在后期模型迭代时，能帮你快速定位是数据问题还是模型问题。

4.2 模型更新：拒绝“月更”，拥抱“事件驱动”的增量学习

制造业的工艺、设备、材料都在变。一个“冻结”在发布日的模型，三个月后就会变得陈旧。但我们发现，每月固定更新一次模型，效果很差——因为更新窗口期长，新问题积累太多，一次更新无法覆盖所有变化，反而引入新bug。

我们的解决方案是“事件驱动的增量学习（Event-Driven Incremental Learning）”：

触发事件：当系统检测到以下任一情况，自动触发模型微调：
- 新设备上线（如新增一台进口五轴加工中心），其报警代码体系与现有模型不兼容；
- 关键工艺变更（如客户要求将某零件的表面粗糙度从Ra1.6提升至Ra0.8），导致原有参数推荐失效；
- 某类故障的误报率连续3天超过15%（如将正常的“主轴预热”误判为“轴承故障”）。
增量数据包：系统不会重训整个模型。它会自动从历史数据湖中，抓取与该事件最相关的1000条样本（如所有含新设备报警代码的日志、所有Ra0.8工艺的SOP、所有被人工修正的误报案例），打包成一个“增量数据包”。
轻量微调：使用LoRA（Low-Rank Adaptation）技术，只更新模型中不到0.1%的参数（主要是最后两层Transformer的权重），耗时通常在15分钟内。更新完成后，新模型自动灰度发布，先服务5%的用户，监控24小时无异常后，全量切换。

实操心得：这套机制让我们实现了“模型越用越聪明”。例如，当某模具厂引入一种新型耐高温塑料后，FactoryBERT在第一次识别其注塑缺陷时犯了错，但工程师在系统里点击“标记为误判”并补充了正确原因（“材料流动性差，需提高熔体温度”），这个反馈瞬间生成了一个增量数据包，15分钟后，全厂所有同类设备的缺陷识别准确率就提升了。

4.3 人机协同界面：工程师不需要“懂AI”，只需要“懂业务”

我们曾设计过一个炫酷的3D可视化界面，能展示设备内部温度场、应力云图。结果工程师们抱怨：“我只想知道哪个螺丝该紧了，你给我看云图有啥用？”——这让我们彻底反思：AI工具的终极目标，是降低专业门槛，而不是增加一层新的技术门槛。

因此，FactoryBERT的所有人机交互，都遵循“三屏原则”：

第一屏：问题屏（Problem Screen）：这是工程师打开系统看到的第一个界面。它极度简洁，只有三样东西：一个巨大的、颜色醒目的问题状态（如“⚠️ CNC-307 主轴异常（高置信度）”）、一个“一键查看根因”的按钮、一个“一键生成维修工单”的按钮。没有图表，没有参数，没有术语解释。设计哲学：把工程师的注意力，100%聚焦在“现在要做什么”上。
第二屏：证据屏（Evidence Screen）：当点击“查看根因”后，才进入第二屏。这里用清晰的卡片式布局，陈列所有支撑结论的证据：
- 卡片1（数据）：振动RMS值趋势图（标注阈值线）、报警代码时间轴；
- 卡片2（文档）：设备手册中关于“27-F04”的原文截图、同型号设备历史维修记录摘要；
- 卡片3（推理）：用箭头图展示“报警→振动↑→尺寸↓→圆度↑”的因果链，并标注每个环节的置信度（如“振动↑→尺寸↓”置信度85%）。
- 关键设计：每张卡片右下角都有一个“？”图标，鼠标悬停即显示通俗解释，如：“RMS值：衡量振动剧烈程度的综合指标，就像汽车仪表盘上的‘发动机转速’，数值越高，机器‘喘得越厉害’。”
第三屏：行动屏（Action Screen）：这是最终的执行界面。它不提供“建议”，而是提供“可执行的步骤清单”：
1. [ ] 停止CNC-307运行（点击此处发送停机指令）
2. [ ] 使用扭矩扳手，按SOP-307-B检查主轴轴承预紧力（点击查看SOP）
3. [ ] 若预紧力超差，更换轴承（点击查看备件清单与领用二维码）
4. [ ] 完成后，点击“验证”按钮，系统将自动比对修复前后数据。

实操心得：这个界面让一位只有高中学历、干了20年钳工的老师傅，第一次使用FactoryBERT就在10分钟内独立完成了一次复杂故障的闭环处理。他事后说：“它没教我新东西，只是把我脑子里想的那几步，清清楚楚地写在了屏幕上，还帮我点了停机按钮。”

4.4 权限与审计：让AI的每一次“思考”都可追溯、可问责

在制造业，尤其是涉及质量、安全的场景，AI的决策必须透明、可审计。我们为FactoryBERT设计了一套“全链路审计追踪”机制：

决策水印（Decision Watermark）：每一个由FactoryBERT生成的结论（无论是根因、摘要还是建议），其JSON输出中都嵌入一个不可篡改的“水印”字段：

"audit_trail": { "model_version": "FactoryBERT-v3.2.1", "input_hash": "a1b2c3d4e5f6...", // 输入数据的SHA256哈希 "training_data_window": "2023-09-01_to_2023-10-25", "confidence_score": 0.92, "reasoning_steps": ["Step1: Mapped code 27-F04 to bearing issue...", "Step2: Correlated vibration rise with downtime..."] }

这个水印，确保了结论的来源、依据、时效性全部固化，无法被事后修改。

双人复核工作流（Dual-Approval Workflow）：对于所有影响重大的决策（如判定某批产品需全检、建议停用某台关键设备），系统强制启动双人复核。第一步，由FactoryBERT生成初版报告；第二步，报告自动推送至两位不同资历的工程师（如一位资深工艺师+一位年轻质量工程师）的待办列表；第三步，两人必须分别输入自己的判断（同意/不同意/需补充信息），并签名。只有双方都点击“同意”，报告才能生效。效果：这既利用了AI的效率，又保留了人的最终裁决权，完美符合GMP等质量管理体系的要求。
沙盒回放（Sandbox Replay）：系统后台持续录制所有输入数据和模型推理过程。当发生争议时（如“为什么当时没发现这个问题？”），管理员可以输入任意时间点，系统会瞬间重建当时的全部数据环境，并“回放”FactoryBERT的完整推理链条，精确到每一行代码的执行结果。这不仅是技术保障，更是管理信任的基石。

5. 常见问题与排查技巧实录：来自产线的“真问题”速查表

在六个月的实测中，我们收集了超过200个真实问题。以下是高频、典型、且容易被忽略的10个问题，附带我们摸索出的独家排查技巧。这些问题，没有一个出现在任何学术论文里，但每一个都曾在产线上让工程师焦头烂额。

问题现象	可能原因	排查技巧	解决方案
FactoryBERT对同一份数据，两次分析结果不一致	模型启用了“温度采样”（Temperature Sampling）进行生成式任务，导致随机性。	检查输出JSON中的`"is_deterministic"`字段。若为`false`，说明本次是生成式任务（如SOP问答），结果天然有随机性。	对于需要确定性的任务（如根因分析、工单摘要），强制设置`temperature=0`，关闭随机性。
OEE根因分析报告中，提到了一个工厂从未用过的报警代码（如“99-ZZZ”）	模型在预训练时，从某份公开的设备手册PDF中“学”到了这个代码，但该手册并非本厂所用设备。	查看报告中的`"source_document"`字段，它会明确指出该代码出自哪份文档（如`"source_document": "Fanuc_Oi-MD_Manual_v2021.pdf"`）。	将该文档从语料库中移除，并在模型配置中加入“设备白名单”，只允许学习本厂实际使用的设备型号的手册。
振动分析模块对新安装的传感器数据，始终报“信号无效”	新传感器的