这篇文章解决什么问题上一篇文章讲到早期 AI 研究者相信智能可以被拆解为符号表示、规则推理和搜索过程。这个信念在 1950 到 1960 年代带来了许多漂亮演示机器可以证明定理可以玩游戏可以在积木世界里理解语言也可以用对话制造“理解”的感觉。但 AI 很快遇到一个残酷问题演示系统离真实世界太远。它们在封闭环境里表现不错一旦面对开放语言、真实知识、嘈杂输入和复杂任务能力就会迅速下降。早期承诺过高、实际交付不足导致资助机构和产业界逐渐失望这就是后来被称为 “AI winter” 的寒冬。这篇文章会解释两个问题为什么 AI 会经历寒冬为什么专家系统又曾经让 AI 短暂回暖并最终再次降温核心观点AI 寒冬不是某一个事件造成的而是乐观预期、技术瓶颈、资金压力和应用落差共同作用的结果。1960 到 1970 年代的早期寒冬主要来自机器翻译、通用推理、机器人和感知系统的承诺落空。1970 到 1980 年代的专家系统证明了“窄领域知识 规则推理”可以产生商业价值。专家系统的瓶颈在于知识获取困难、维护成本高、泛化能力弱系统越大越脆弱。AI 寒冬的真正教训不是“AI 不可能”而是“不能把小环境里的演示直接等同于开放世界里的可靠智能”。历史背景1956 年达特茅斯会议之后AI 进入第一段黄金年代。研究者非常乐观认为只要继续发展搜索、逻辑、语言处理和知识表示机器很快就能达到甚至超过人类智能的一部分能力。这种乐观有其合理基础。当时的计算机刚刚出现不久AI 系统已经能完成一些以前只有人类能做的事情。Logic Theorist 可以证明逻辑定理General Problem Solver 试图用通用方法解决问题早期程序可以下棋、解谜、处理有限自然语言。这些成果让人很容易相信既然机器已经能完成一些“需要智力”的任务那么更通用的机器智能也许就在不远处。但问题在于早期系统大多依赖受控环境。它们面对的是形式化定理、棋盘、积木世界、固定句式和小规模状态空间。真实世界的问题更复杂语言有歧义常识难以穷尽感知输入充满噪声任务环境不断变化计算资源也十分有限。这个落差在机器翻译上表现得尤其明显。冷战时期美国对俄英机器翻译抱有很高期待希望计算机能快速翻译大量俄文科技资料。但早期机器翻译主要依赖词典、语法规则和简单替换遇到歧义、上下文和专业语义时效果很差。1966 年美国自动语言处理咨询委员会发布 ALPAC 报告对机器翻译投入的实际成效提出批评随后相关资助明显收缩。1973 年英国的 Lighthill 报告又对 AI 研究提出批评认为许多 AI 工作没有兑现承诺在现实规模问题上进展有限。这进一步影响了英国 AI 研究的资助方向。美国、英国等地对 AI 的热情开始降温第一次 AI 寒冬逐渐形成。不过AI 并没有消失。1970 年代后期到 1980 年代专家系统重新点燃了产业界兴趣。与早期追求“通用智能”不同专家系统不再试图解决所有问题而是把目标缩小到特定领域医学诊断、化学分析、矿物勘探、计算机配置、金融风控等。它们的核心思想是把专家经验写成规则让机器在窄领域里模拟专家判断。这一策略在一段时间内非常有效。DENDRAL 用于化学结构推断MYCIN 用于细菌感染诊断和抗生素建议XCON/R1 帮助 Digital Equipment Corporation 配置计算机系统。专家系统让 AI 第一次显得不只是实验室演示而是能进入企业流程、节省成本、产生商业价值。但专家系统的繁荣也带来了新的泡沫。到 1980 年代后期许多系统维护困难、成本高昂、适应性差专用 LISP 机器市场崩溃企业发现专家系统并不像宣传中那样容易复制。第二次 AI 寒冬随之到来。关键事件时间线1956达特茅斯会议后 AI成为独立研究领域1958Rosenblatt提出感知机1966ALPAC报告批评机器翻译成效1969Minsky 和 Papert出版 Perceptrons1972MYCIN 项目在Stanford 启动1973Lighthill报告批评英国 AI研究进展1970sDENDRAL、MYCIN等专家系统成熟1980XCON/R1 在 DEC展示商业价值1982日本第五代计算机项目启动1984AI winter说法开始流行1987LISP机器市场崩溃专家系统热潮降温1990s统计机器学习逐渐成为新主线AI 黄金年代、专家系统与寒冬技术解释1. 为什么早期 AI 看起来很成功理解 AI 寒冬不能只看失败。早期 AI 之所以能获得大量关注是因为它确实做出了一些令人惊讶的系统。如果一台机器能证明定理、玩棋类游戏、解决代数题、回答有限范围的自然语言问题在 1950 到 1960 年代已经非常震撼。那时计算机还远不是日常工具能让机器表现出任何“类似思考”的行为都足以支持研究者继续扩大想象。早期 AI 的成功通常有三个共同点任务边界清楚定理证明、棋类、积木世界都有明确规则。输入相对干净系统不需要理解真实世界的嘈杂语音、图像和开放文本。目标可以形式化证明是否成立、棋局是否获胜、积木是否移动成功都容易判断。这类任务非常适合符号主义 AI。只要能把问题写成状态、规则和目标机器就可以用搜索和推理去找答案。问题在于研究者和资助者很容易从“小任务成功”推导出“通用智能很快到来”。这一步推断过于乐观。2. 组合爆炸搜索为什么会失控早期 AI 经常把问题建模为搜索当前状态是什么可以采取哪些动作动作之后会到达哪些新状态最终怎样到达目标。这个方法在小问题上有效但状态空间会迅速膨胀。假设每一步有 10 个选择只规划 6 步就可能有 1,000,000 条路径。真实任务的选择数量和步骤远不止这些。计算资源有限时系统很快就会卡住。这就是组合爆炸。它不是简单的“电脑不够快”而是问题规模随步骤增加呈指数增长。即使今天计算能力远超 20 世纪中期组合爆炸仍然是规划、搜索和自动推理的重要难题。当前状态动作 1动作 2动作 3更多后续状态更多后续状态更多后续状态更多后续状态更多后续状态更多后续状态状态空间快速膨胀AI 研究者当然知道不能穷举于是引入启发式规则来缩小搜索范围。但启发式依赖经验换一个领域就可能失效。早期 AI 的很多系统本质上是在非常聪明地缩小问题一旦问题变得开放缩小策略就很难维持。3. 机器翻译第一个大型落差机器翻译是早期 AI 受挫的典型案例。从表面看翻译似乎可以用词典和语法规则解决。把源语言单词查出来按目标语言语序重排再处理一些语法变化就能得到译文。这种想法对简单句子有一定效果但很快会遇到歧义。例如一个词可能有多个意思一个句子可能有多种结构一个代词可能指向前文不同对象。翻译还需要大量背景知识医学文本、军事文本、文学文本和日常对话的翻译策略完全不同。只靠词典和规则很难在真实语料上稳定工作。1966 年 ALPAC 报告认为当时机器翻译没有达到预期实用效果人工翻译和计算机辅助方式在许多场景下更现实。这个结论直接打击了机器翻译资助也成为第一次 AI 寒冬的重要标志之一。机器翻译的挫折很有代表性早期 AI 不是完全做不到而是做不到宣传中那种大规模、可靠、通用的效果。4. 感知机争议神经网络路线的低潮1958 年Frank Rosenblatt 提出感知机。感知机是早期神经网络模型之一它可以从样本中学习线性分类边界。这个方向一度很受关注因为它似乎提供了一条不同于符号主义的道路不用手写全部规则让机器通过数据调整参数。但早期感知机能力有限尤其无法表示一些非线性可分问题。1969 年Marvin Minsky 和 Seymour Papert 出版Perceptrons系统分析了单层感知机的限制。后来很多叙述会把这本书说成“杀死神经网络”的原因这种说法有些简化。神经网络低潮还和计算资源不足、训练方法不成熟、数据规模有限有关。不过它确实让许多研究者和资助者对早期神经网络路线失去信心。直到 1980 年代反向传播重新受到重视再到 2000 年代后期深度学习崛起神经网络才真正成为 AI 主线。这里的教训是一个方向在某个时期失败不一定代表它本质上错误有时只是缺少算法、数据、算力和工程生态。5. 专家系统从通用智能转向窄领域专家经历早期挫折后AI 研究者逐渐意识到直接追求通用智能太难。专家系统选择了一条更务实的路线不让机器理解整个世界只让它在一个专业领域里模拟专家决策。专家系统通常由三部分组成组成部分作用例子知识库存放领域事实和规则如果感染类型是 X则考虑抗生素 Y推理机根据规则进行推理前向推理、后向推理、规则匹配解释模块说明系统为什么给出结论展示触发了哪些规则一个非常简化的专家系统规则可能长这样如果 患者有细菌感染 并且 感染类型可能是革兰氏阳性菌 并且 患者对青霉素不过敏 那么 可以考虑某类抗生素当然真实医学系统会复杂得多也必须由专业人员验证。这里的例子只是为了说明规则系统的形式。专家系统的关键变化是知识不再被看作通用逻辑而是来自领域专家的经验。系统开发者要做的事也不只是写程序而是把专家脑中的判断规则提取出来变成机器可以执行的知识库。这种工作被称为知识工程。6. DENDRAL、MYCIN 与 XCON专家系统为什么曾经成功DENDRAL 是最早成功的专家系统之一用于根据质谱数据推断有机分子结构。它的成功说明专业知识如果能被清楚编码机器可以在狭窄领域里达到很强的辅助能力。MYCIN 则面向医学诊断特别是细菌感染和抗生素建议。MYCIN 的重要性不仅在于规则推理还在于它尝试处理不确定性并能解释自己的推理过程。对医学场景来说解释性非常重要医生不能只看到一个结论还需要知道系统为什么这样建议。XCON又叫 R1是专家系统商业化的代表。它帮助 DEC 配置 VAX 计算机系统。计算机配置涉及大量组件、约束和兼容关系非常适合规则系统。XCON 能减少人工配置错误带来实际经济价值因此成为专家系统热潮的重要样板。这些系统之所以成功是因为它们选对了问题领域边界相对清楚。专家知识可以被规则化。输入输出比较结构化。错误成本可以通过人类专家审核控制。系统价值容易量化例如节省时间、减少配置错误。这和早期通用 AI 的大目标很不一样。专家系统不是要成为“会思考的机器”而是成为“能做某类专家判断的工具”。7. 专家系统为什么又降温专家系统的问题也来自同一个地方知识。首先是知识获取瓶颈。专家往往很难把自己的经验完整说出来。很多判断来自多年实践带有直觉、例外和上下文。知识工程师把这些经验写成规则时容易遗漏细节。其次是维护困难。现实业务不断变化规则也要更新。一个系统有几十条规则时还好几百条、几千条规则之后规则之间可能冲突、重复或产生意外连锁反应。修改一条规则可能影响许多结论。第三是泛化能力弱。一个医学专家系统不能自然变成金融专家系统一个计算机配置系统也不能自然理解法律合同。每换一个领域都要重新构建知识库。第四是成本问题。专家系统需要专门工具、专门人才和昂贵硬件。1980 年代许多 AI 公司和 LISP 机器厂商围绕专家系统形成产业泡沫。但当通用工作站变强、企业发现投入产出不稳定时这个市场迅速收缩。可以把专家系统的生命周期概括为否是专家经验知识工程师访谈整理规则和知识库推理机给出建议业务场景验证环境是否变化维护和更新规则真正困难的地方在于最后一环现实环境总是在变化而规则系统的更新成本会越来越高。8. “AI winter” 到底是什么意思AI winter 字面意思是 AI 的冬天指研究资金、产业投资、媒体热情和社会预期显著下降的时期。它不是说 AI 研究完全停止而是说 AI 从热门领域变成了谨慎甚至被怀疑的领域。AI 寒冬通常有几个特征资助机构削减预算。企业减少 AI 项目投入。媒体和公众从兴奋转向怀疑。研究者避免使用 “AI” 这个标签转而使用更具体的术语。产业公司倒闭或转型。这个词在 1980 年代开始流行带有对“核冬天”的类比之前热度越高降温时越明显。需要注意的是寒冬并不意味着技术毫无进展。很多重要研究反而在低热度时期继续发展。例如统计学习、概率模型、强化学习、神经网络训练方法、机器人学和模式识别都在不同社区里继续前进。只是它们不一定总是挂着“AI”这块招牌。为什么它重要AI 寒冬是理解 AI 发展史的关键因为它告诉我们AI 的进步不仅取决于算法也取决于预期管理、工程可行性、数据、算力、商业场景和评估方法。第一寒冬纠正了早期 AI 的过度乐观。机器能在小任务上表现出智能不代表它能在开放世界里可靠工作。今天的大模型同样需要这个提醒模型能通过某些 benchmark不等于能在所有真实业务中稳定落地。第二专家系统证明了窄领域 AI 的价值。AI 不一定要先拥有通用智能才能产生实际影响。只要问题边界清楚、知识可表达、价值可衡量AI 就能成为有用工具。今天很多成功的 AI 应用仍然遵循这个原则。第三专家系统暴露了知识工程的难题。人类知识很难完整写成规则真实业务也不会永远停留在规则设计时的样子。这个教训直接连接到后来的机器学习与其手工写规则不如让模型从数据中学习模式。第四寒冬推动 AI 社区变得更务实。研究者开始更重视可评估任务、真实数据、统计方法和工程落地。下一篇文章要讲的机器学习兴起正是在这种背景下逐渐成为主线。局限与争议讨论 AI 寒冬时最常见的误解是把它归因于某个单一事件。例如有人会说 ALPAC 报告导致了机器翻译寒冬Lighthill 报告导致了英国 AI 受挫或者Perceptrons导致神经网络停滞。这些说法都有部分事实但都过于简单。真正的问题是多因素叠加硬件不够强数据不够多算法不成熟任务定义不清商业承诺过高评估方法不完善。报告和批评往往只是把这些问题集中表达出来而不是凭空制造问题。另一个争议是专家系统到底算成功还是失败。答案取决于标准。如果标准是“实现通用智能”它当然失败了如果标准是“在特定领域提供可解释的自动化决策支持”它曾经非常成功。它失败的不是窄领域应用价值而是被过度扩展成通用 AI 解决方案的想象。还有一个容易忽略的问题寒冬并不是均匀发生在所有国家、机构和方向上。某些研究方向在主流 AI 叙事中降温却在控制、统计、运筹学、模式识别、信息检索等领域继续发展。AI 的历史更像多条支流交错而不是一条河突然结冰又突然解冻。和今天 AI 的关系AI 寒冬和专家系统对今天的大模型时代有非常直接的警示意义。今天我们再次处在 AI 高热度时期。大模型能写文章、写代码、回答问题、分析图片、调用工具这些能力确实重要。但历史提醒我们演示效果、单次体验和真实生产环境之间有距离。系统是否可靠取决于它能否处理异常、边界条件、业务变化、安全约束和长期维护。专家系统的知识获取瓶颈在今天以新的形式出现。过去的问题是“专家知识很难写成规则”今天的问题是“怎样把正确上下文、外部知识、工具能力和业务规则稳定提供给模型”。这就是 RAG、上下文工程、工具调用、MCP 和 AI Workflow 变得重要的原因。可以这样对照历史问题专家系统时代的做法大模型时代的对应做法知识从哪里来专家访谈后手写规则RAG、知识库、联网检索、企业文档如何执行动作固定规则触发固定动作Function Calling、Tool Use、MCP如何解释结果展示触发了哪些规则引用来源、推理摘要、日志和可观测性如何适应变化人工维护规则库数据更新、提示词/上下文工程、工作流迭代如何控制风险人类专家审核Guardrails、权限控制、人机协同审批今天的大模型比专家系统更灵活因为它不需要把所有知识都写成显式规则。但它也更难完全解释和控制。历史不是让我们悲观而是提醒我们AI 应用真正成熟往往不是靠一个模型单点突破而是靠模型、数据、工具、流程、评估和人类反馈共同组成系统。小结早期 AI 的黄金年代建立在一批令人惊讶的演示系统之上但这些系统多运行在边界清晰的小世界中。第一次 AI 寒冬主要来自承诺和现实之间的落差机器翻译、通用推理、感知和机器人都遇到规模化难题。ALPAC 报告和 Lighthill 报告不是寒冬的唯一原因但它们集中表达了资助方对 AI 实际成效的失望。感知机和早期神经网络的低潮既有理论限制也有算力、数据和训练方法不足的原因。专家系统把 AI 从通用智能理想拉回窄领域应用并在 1970 到 1980 年代产生实际商业价值。DENDRAL、MYCIN、XCON 说明在边界清楚、知识可规则化的领域AI 可以成为有用工具。专家系统最终受限于知识获取、规则维护、泛化能力和成本问题。AI 寒冬的真正教训是不要把演示等同于可靠产品不要把窄领域成功直接推广成通用能力。今天的大模型应用仍然需要吸取这些教训用 RAG、工具调用、工作流、评估和人机协同来弥补单个模型的不足。参考资料National Research Council,Language and Machines: Computers in Translation and Linguistics, ALPAC Report, 1966: https://nap.nationalacademies.org/catalog/9547/language-and-machines-computers-in-translation-and-linguisticsJames Lighthill,Artificial Intelligence: A General Survey, 1973: https://www.chilton-computing.org.uk/inf/literature/reports/lighthill_report/contents.htmMarvin Minsky and Seymour Papert,Perceptrons, MIT Press, 1969: https://mitpress.mit.edu/9780262631112/perceptrons/Edward A. Feigenbaum, Bruce G. Buchanan, Joshua Lederberg,On Generality and Problem Solving: A Case Study Using the DENDRAL Program, 1971: https://apps.dtic.mil/sti/citations/AD0727905Bruce G. Buchanan and Edward H. Shortliffe,Rule-Based Expert Systems: The MYCIN Experiments of the Stanford Heuristic Programming Project, 1984: https://people.dbmi.columbia.edu/~ehs7001/Buchanan-Shortliffe-1984/MYCIN%20Book.htmJohn McDermott,R1: A Rule-Based Configurer of Computer Systems, Artificial Intelligence, 1982: https://www.sciencedirect.com/science/article/pii/0004370282900212Computer History Museum,AI Robotics Timeline: https://www.computerhistory.org/timeline/ai-robotics/IPSJ Computer Museum,Start of the 5th Generation Computer Project for Knowledge-Based Information Processing: https://museum.ipsj.or.jp/en/computer/other/0002.htmlStanford Encyclopedia of Philosophy,The Frame Problem: https://plato.stanford.edu/entries/frame-problem/下一篇从机器学习到统计学习方法