当前位置: 首页 > news >正文

为什么我越来越警惕“直接用大模型做决策” 一个偏系统工程视角的反思

写这篇文章,并不是为了否定大模型的能力。
恰恰相反,是因为我越来越确信:
AI 已经强到,如果我们还用“工具思维”去使用它,一定会出问题。

如果你只是用 AI:

  • 写代码
  • 改 Bug
  • 生成文档
  • 查资料

那很多风险暂时与你无关。

但如果你开始思考:

  • AI 能不能参与判断?
  • AI 能不能进风控、交易、医疗、调度?
  • AI 能不能成为长期协作系统的一部分?

那下面这些问题,其实已经绕不开了。


一、一个不太讨喜的判断

现在很多 AI 应用,其实是在“裸用大模型”

我先说结论:

现在相当一部分 AI 应用,本质上是在“裸用 LLM”。

这里的“裸用”,不是说不安全、不合规,而是说:

  • 把一个高自由度、强推理能力的系统
  • 直接放进需要稳定判断的场景
  • 却没有一层真正意义上的系统级约束

很多人会反驳:

Prompt 写好了
RAG 接上了
规则也加了

但站在系统工程角度,这些更多是:

功能增强,而不是决策治理。


二、为什么说大模型更像“发动机”,而不是“整套系统”

这是理解后面所有问题的关键。

从工程视角看,大模型的特性非常接近:

一台性能极强、但高度自由的发动机。

它的特点是:

  • 推理能力很强

  • 表达能力很强

  • 可以在不完整信息下给出“像样的答案”

  • 但它并不天然负责:

    • 行为稳定
    • 权限边界
    • 风险控制
    • 状态一致性

如果你把一台 1000 马力的发动机:

  • 没有变速箱
  • 没有底盘
  • 没有刹车系统

你不会说它“潜力无限”,
你只会说:这东西不能上路


三、风险并不来自“偶尔出错”,而来自“不可预期”

很多程序员的第一反应是:

AI 会不会偶尔答错?

但真正的系统风险,不在“错一次”,而在于:


1️⃣ 同样条件下,行为不稳定

  • 同样的问题
  • 同样的数据
  • 不同时间调用

结果可能明显不同。

在内容生成里,这是“多样性”;
在系统决策里,这是不确定性


2️⃣ 强解释能力,会掩盖系统缺陷

大模型有一个很强的特性:

几乎任何结果,它都能解释得通。

但在工程里我们都知道:

“跑得顺”不等于“跑得对”。

一个系统如果:

  • 每次都能给理由
  • 但行为不可复现

那它在工程上依然是不合格的。


3️⃣ 出问题后,无法复盘

这是底线问题。

如果系统出问题,你至少要知道:

  • 哪个条件触发了判断
  • 哪条路径被采信
  • 是否可以复现

如果这些都做不到:

这个系统就是不可维护的。


四、问题不在于 AI 不够强,而在于“没人接管它”

这里有一个非常反直觉的结论:

AI 的问题不是不够聪明,
而是聪明得超过了现有系统的承载能力。

没有系统级接管的高能力组件,在工程里一定会导致:

  • 行为漂移
  • 风险累积
  • 调试困难
  • 责任模糊

这不是 AI 的锅,而是:

系统工程缺位。


五、为什么我开始认真思考“AI 的操作系统”

如果你写过系统软件,或者做过复杂系统架构,你一定知道:

  • CPU 出现 ≠ 系统可用

  • 必须有 OS:

    • 管调度
    • 管权限
    • 管状态
    • 管异常

现在,大模型正在经历类似阶段。

只不过这一次,操作系统要管理的不是算力,而是:

判断权与决策路径。


六、什么是“决策模型”(不是 ML 模型)

这里说的“决策模型”,并不是指机器学习模型,而是一层系统逻辑:

  • 不负责预测
  • 不负责生成
  • 不负责创意

它只做一件事:

判断:在当前条件下,这个行为是否被允许。

工程上,它的目标非常朴素:

同样的输入 → 同样的判断结果。

也就是我们常说的:

同题同答。


七、为什么运行环境本身非常重要

很多讨论容易陷入“模型谁更强”。

但从系统角度,更重要的是:

模型运行在什么样的环境里。

如果运行环境:

  • 状态不稳定
  • 行为不可预期
  • 边界靠约定

那在其之上谈“可控决策”,基本都是空谈。


八、量化、医疗、科研,其实是同一个系统问题

你会发现:

  • AI 量化的问题是决策漂移
  • AI 医疗的问题是越权判断
  • AI 科研的问题是把检索当思考

它们本质上都在回答同一个问题:

谁,在什么条件下,有资格做判断?


九、关于“伴生模型”:必须极其克制

长期运行的系统需要:

  • 连续状态
  • 个体差异
  • 行为习惯

这催生了“伴生模型”的概念。

但系统工程上必须非常清楚:

伴生模型只能提供状态信息,
不能拥有裁决权。

否则:

  • 长期偏好会反向影响系统
  • 风险会随时间积累
  • 行为将不可预测

十、写在最后:这是一个系统工程问题

如果用一句话总结这篇文章:

AI 时代真正的风险,不是模型不够强,
而是我们还在用“工具思维”使用系统级智能。

真正重要的不是:

  • AI 能做什么

而是:

AI 在什么条件下,被允许做什么。


作者说明

本文整理自一次长时间的人机协作与系统架构讨论,
讨论核心集中于 AI 决策稳定性、系统工程边界与可托付性问题
相关探索基于 EDCA OS(Expression-Driven Cognitive Architecture) 的研究框架,
目前仍处于持续验证与演化阶段。。

http://www.zskr.cn/news/142238.html

相关文章:

  • 企业建站必看:什么是网站模板?为什么是最佳性价比方案?
  • 【Open-AutoGLM 高阶应用秘籍】:如何让AI自主完成复杂电脑任务?
  • 【AutoGLM插件应用秘籍】:掌握这7个技巧,轻松驾驭智谱清言AI生态
  • 从DeepSeek看AI产业跃迁:大模型时代的技术变革与实战应用
  • 【Open-AutoGLM本地部署终极指南】:手把手教你从零搭建AI推理环境
  • 开源AI神器Open-AutoGLM发布(AutoGLM技术内幕首次公开)
  • Open-AutoGLM评分全网最高(三大核心指标领先第二名30%)
  • 智能测试用例生成:是效率革命,还是维护噩梦?
  • Spring 事务失效
  • 测试数据生成的“智变”:利用AIGC快速构建复杂、合规的测试数据。
  • 产品经理转AI产品经理:5步转行指南+2万学习资源免费送_如何从传统产品经理转行成为顶尖的AI产品经理?
  • 基于单片机的智能窗帘控制系统设计
  • 从零到运行:Open-AutoGLM本地部署全流程拆解(附完整配置脚本)
  • 错过将后悔!Open-AutoGLM插件内部技术文档首次公开解读
  • 2025年外贸建站行业指南:精选十大技术型服务商深度解析 - 资讯焦点
  • 2025年评价高的祭祖香炉厂家推荐榜:水晶文昌塔、熏香炉、玉石文昌塔、电子熏香炉、祭祖香炉、金属文昌塔、铜质文昌塔、陶瓷文昌塔 - 优质品牌商家
  • 2025年口碑好的三维调节阻尼托底轨/同步阻尼托底轨厂家最新热销排行 - 品牌宣传支持者
  • 2025年比较好的饮用水不锈钢管件厂家推荐及选择指南 - 品牌宣传支持者
  • JVM-垃圾回收
  • 【Open-AutoGLM开源深度解析】:揭秘国产大模型自动化推理引擎核心技术
  • Strands Agents速成班来了,带你从“调用API”进阶到“构建智能体”
  • 2025年济南比较好的消防排烟风机设计排行榜,消防排烟风机/新风换气机/直膨式空调机组/卧式暗装风机盘管消防排烟风机门店推荐排行榜 - 品牌推荐师
  • Open-AutoGLM入门到精通:3步实现本地LLM自动化推理部署
  • 2025年湖南长沙羽毛球馆木地板工厂、安装施工及打磨翻新公司排名 - 工业推荐榜
  • # 真术相成AI培训入学全指南:从咨询到入学,一步到位踩准节奏
  • 【最新盘点】国内主流商标交易平台排行榜,选对平台是关键第一步 - 资讯焦点
  • 项目经理什么水平,就看这一点!
  • 2025年土工材料厂家推荐榜:短丝土工布/长丝土工布/防渗膜土工膜实力企业精选 - 品牌推荐官
  • 计算机Java毕设实战-基于springboot的健身服务管理系统基于Spring Boot的健身房信息管理系统健身卡管理系统【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • 实战SRC支付购买挖掘案例