山东工业AI的“最后一公里“:一家实验室试图解决什么问题?
最近看到一条消息:山东省信息技术产业发展研究院(中国赛宝(山东)实验室)和两家山东本土AI企业共建了一个"数据治理和智能体应用实验室"。作为关注AI产业化的从业者,我觉得这件事挺值得聊聊的。
---
先说一个反直觉的事实
大家可能觉得,AI现在这么火,工业企业应该早就用上了吧?实际情况恰恰相反。我接触过不少山东的制造企业,他们的现状是这样的:
- 车间里的设备数据、ERP里的采购数据、质检系统里的检验数据,都是"各管各的",互不相通
- 不是说数据不存在,而是数据之间没有"语义关联"——设备A的温度异常和物料B的批次问题可能有因果关系,但在系统里它们只是两个孤立的记录
- 偶尔试点个AI项目,多半是做个问答机器人,放在展厅里演示还行,真放到生产线上就"歇菜"了
这不是山东独有的问题,全国都一样。工业AI最大的瓶颈不是模型不够强,而是数据"不好用"、应用"不接地气"。
这个实验室在做什么?
回到正题。根据合作协议公告,三方分工是这样的:
山东省信研院——省工信厅直属事业单位,干了五十多年产业研究,手里有政策解读、标准制定、行业推广的"话语权"。合作协议中明确提到,信研院将提供"权威背书、政策指引与产业顶层规划"。简单说,他们负责"定方向、定标准"。
宸宇智联——一家扎根制造业和能源行业的企业,做工业数智化很多年了。合作协议中的定位是"场景挖掘、企业需求对接、项目落地实施与成果产业化推广"。他们的角色是提供真实的工业场景和需求,负责"找痛点、对接企业"。
向量空间——技术提供方。合作协议中提到,向量空间将提供"核心技术底座、智能体研发能力、技术迭代升级与常态化技术支撑"。他们做的JBoltAI企业级AI应用开发平台(Java技术栈),已经跑了500多家政企客户。负责"做技术、建系统"。
三方组合起来,就是一个完整的链路:政策定方向 → 场景找痛点 → 技术做落地
两个核心方向,解决两个核心问题
合作协议中明确,实验室聚焦两大核心方向。我结合协议内容和向量空间JBoltAI平台的技术资料,分别聊聊。
问题一:工业数据"有数量无质量"
"企业本体+语义治理"——让数据之间能"互相理解"
合作协议的原文表述是:围绕工业企业业务架构、组织架构、生产架构搭建企业本体知识体系,统一设备、工序、物料、工单、供应链、质检等核心工业要素的语义标准。
传统的数据治理,主要做的是清洗和规整——把格式统一、把缺失值补上。但这对AI来说远远不够。AI需要的是语义层面的治理——让数据之间能够被理解、关联和推理。
实验室的思路是构建"企业本体"。打个比方:在一家化工厂里,"反应釜R-201"、"二次蒸馏工序"、"2024年Q3批次X原料"——这三个东西在系统里可能分别存在于设备台账、工艺手册和采购系统中。传统方式下,它们没有任何关联。但如果建立了企业本体,AI就能理解"R-201在二次蒸馏工序中使用,而该工序在2024年Q3使用了批次X原料"——这就建立了语义层面的关联。
从技术角度看,根据对JBoltAI平台技术资料的分析,向量空间的实现方案有几个值得注意的细节:
- 知识图谱底座:基于Neo4j图数据库+Apache Jena RDF框架构建企业本体模型
- Text2Cypher:自然语言转图查询语言,温度参数锁定0.2确保输出确定性,以Graph Schema作为背景知识辅助生成
- 多子图隔离:同一个Neo4j实例可以跑多个企业的图谱,通过graphId做逻辑隔离,节省资源
- Schema自动推断:如果企业还没建立本体模型,系统可以从已有数据中自动推断出节点和关系类型
- RDF/Turtle格式导入:已有行业标准数据的企业,可以直接导入,不用从零开始建
问题二:AI应用"能演示不能干活"
"数字员工"——从问答机器人到流程自治
合作协议中明确提到,实验室将以"AI大脑+工具手脚+业务SOP+数据知识"为核心架构,打造适配生产、运维、质检、供应链、办公、风控多场景的工业智能体。
现在很多企业部署的AI,说白了就是一个"智能搜索框"——你问它答。但工业场景中真正需要的是能自主完成工作的智能体,不是一个只会回答问题的聊天框。
根据对向量空间JBoltAI平台技术架构的分析,其底层的ReAct(推理-行动)智能体设计比较有意思。简单解释一下它和普通AI问答的区别:
| 维度 | 普通AI问答 | ReAct智能体 ||------|-----------|------------|| 工作模式 | 一次推理,一次回答 | 推理→行动→观察→再推理,循环迭代 || 工具使用 | 不使用外部工具 | 可自主选择调用知识库/数据库/Excel等工具 || 容错能力 | 检索不到就"不知道" | 一条路不通会自动换一条路 || 学习能力 | 无 | 内置经验库,高频问题可复用历史路径 |
举个具体的例子。假设一位车间主管问:"上个月3号线的设备故障率和去年同期相比怎么样?"普通AI问答可能只能告诉你"我没有实时数据",或者需要你预先把数据喂给它。
ReAct智能体的处理流程是这样的:
- 查询分析:识别这是一个对比分析类问题
- 执行计划:分别检索"今年上个月3号线故障数据"和"去年同期3号线故障数据"
- 工具调用:通过Text2SQL从设备管理系统查询结构化数据,同时从知识库检索相关报告
- 结果评估:检查检索结果的相关性和完整性
- 答案生成:汇总数据,生成对比分析结论,并附上图表
如果第一步的SQL查询失败了(比如表结构变了),它会自动调整查询策略,而不是直接放弃。这就是为什么叫"数字员工"而不是"数字问答"——它能自主完成一个完整的工作流程,而不仅仅是回答一个问题。
一个值得讨论的问题:为什么是山东?
有人可能会问:这种事为什么不是在北上广深发生?答案其实很简单:北上广深有最强的AI技术,但山东有最丰富的工业场景。
山东是全国工业门类最齐全的省份,制造业产值长期位居全国前三。化工、钢铁、机械、食品、纺织——几乎你能想到的工业门类,山东都有。这意味着海量的工业数据和丰富的转型场景。但也正因如此,山东工业AI面临的挑战更大——场景太多样、企业太分散、标准化程度太低。
这也是为什么需要一个"实验室"来做这件事。单靠某一家AI公司,很难理解所有工业场景;单靠政策推动,又容易流于口号。只有技术、场景、政策三方拧在一起,才有可能跑出真正可复制的模式。
我的看法
说几点个人判断,欢迎讨论:
1. 数据治理比大模型更重要。现在行业里有一种过度关注模型能力的倾向。但工业AI的瓶颈不在模型端,而在数据端。没有好的数据治理,再强的模型也只能产出"看起来有道理但不敢用"的结果。合作协议中把数据治理放在和智能体同等重要的位置,这个判断是对的。
2. 智能体是工业AI的正确落地方向。从问答到智能体,是从"工具"到"员工"的质变。工业场景中大量的重复性工作——报表、工单、巡检记录、异常报告——本质上是适合智能体来做的。关键是要解决可靠性问题,这需要在真实场景中持续打磨。向量空间JBoltAI平台在500+企业中的实战积累,至少为这个方向提供了一个成熟的技术起点。
3. 能否跑通取决于第一批试点企业的效果。实验室的模式再好,最终还是要用结果说话。如果首批试点的工业企业能实实在在感受到降本增效的效果,后续推广就会顺利得多。反之,如果还是"演示很漂亮、落地很骨感",那就会陷入和以往AI项目一样的困境。
4. 本土化是优势。山东的AI企业做山东的工业AI,这不是劣势而是优势。向量空间团队理解本地企业的运作方式、理解山东工业的特点、理解政策环境。这些"隐性知识"是外地技术公司很难复制的。
---
你们觉得工业AI最大的障碍是什么?是技术问题、数据问题、还是场景匹配问题?欢迎在评论区聊聊。
---本文基于合作协议公告及对向量空间JBoltAI平台公开技术资料的分析撰写,旨在探讨工业AI产业化的技术路径,不构成任何投资或采购建议。
