当前位置：首页 > news >正文

硬件勒索软件：从PUF与ECDH原理到ASIC实现的硬件木马攻击剖析

news 2026/5/26 15:30:07

1. 项目概述当勒索软件从软件“下沉”到硬件在网络安全领域勒索软件Ransomware早已不是什么新鲜词汇。从WannaCry到Locky这些恶意软件通过加密用户文件并索要赎金造成了巨大的经济损失。然而当这种攻击模式从软件层“下沉”到物理硬件层事情就变得截然不同了。想象一下你购买了一块全新的固态硬盘、一个加密U盘甚至是一台服务器主板其内部的专用集成电路ASIC芯片在出厂时就已经被植入了恶意逻辑。这块芯片会像一个沉默的定时炸弹在特定条件下启动加密你存储在设备上的所有数据并且由于密钥与芯片的物理特性深度绑定你几乎无法通过软件手段恢复。这就是硬件勒索软件Hardware Ransomware所描绘的恐怖图景。我最初接触到这个概念时也感到有些天方夜谭。硬件攻击的门槛不是远高于软件吗攻击者如何确保植入的恶意电路不被发现又如何与受害者沟通并收取赎金但随着对一项发表在IEEE Access上的开创性研究《Ransomware Attack as Hardware Trojan: A Feasibility and Demonstration Study》的深入剖析我发现这不仅在理论上是可行的而且研究团队已经成功在65纳米CMOS工艺上流片制造出了功能完整的硬件勒索软件芯片。这标志着一种全新的、更底层、更隐蔽的攻击形态已经从学术构想走向了工程实践。这项研究的技术核心在于将两个看似不相关的硬件安全概念巧妙地结合在了一起硬件木马和物理不可克隆函数。硬件木马负责提供隐蔽的植入和触发机制而PUF则为每颗芯片生成独一无二的“指纹”作为加密密钥的种子。这样一来攻击者无需在每颗芯片中预置相同的密钥而是利用制造过程中无法避免的物理差异来产生密钥极大地增强了攻击的隐蔽性和唯一性。本文将深入拆解这项研究从攻击可行性分析、核心架构设计、ASIC/FPGA实现细节到在复杂SoC中的隐蔽植入案例为你完整呈现硬件勒索软件的攻击链条、技术细节以及其带来的深远启示。2. 硬件勒索软件的攻击可行性剖析在深入技术细节之前我们必须先回答一个根本问题为什么攻击者要费尽周折在硬件层面实现勒索软件而不是继续使用更“方便”的软件攻击理解这一点是理解整个攻击逻辑和价值的前提。2.1 硬件攻击的独特优势与严苛限制与软件勒索软件相比硬件勒索软件的优势和劣势都极为鲜明。其核心优势在于持久性与隐蔽性软件恶意程序可以被杀毒软件查杀、被系统更新覆盖甚至被格式化硬盘清除。但硬件木马是物理电路的一部分一旦芯片出厂它就永久存在。只要设备通电恶意逻辑就潜伏其中。常规的软件安全扫描、网络防火墙对它完全无效。绕过软件安全机制现代操作系统和应用程序拥有层层软件安全防护如权限控制、代码签名、沙箱。硬件勒索软件运行在更底层的硬件层面这些软件防护机制形同虚设。它可以直接访问内存总线、存储控制器进行数据加密。攻击面难以预测软件漏洞通常存在于特定的操作系统或应用程序中。而硬件勒索软件的攻击面是物理设备本身。任何包含存储功能且使用可能被篡改芯片的设备从个人硬盘到云服务器的存储阵列从物联网传感器到工业控制器都可能成为目标。然而其面临的挑战也空前巨大极高的攻击成本与门槛攻击者需要渗透到芯片设计、制造或供应链的某个环节。这需要专业的知识、内部权限以及资金支持远非编写一个脚本病毒可比。通信与交互难题软件勒索弹窗可以轻松展示付款信息。硬件勒索软件如何告知受害者“你被黑了请支付比特币到XXX地址”研究论文中也承认这是硬件勒索软件面临的最大难题之一。可能的方案包括在加密数据后向存储设备写入一个包含勒索信息的文本文件或者更极端地攻击者根本不与受害者直接沟通而是选择在特定时间如某公司财报发布日同时触发大量设备通过造成公开的、大规模的服务瘫痪来达成其他目的如做空股票。目标选择的经济性攻击者必须精心选择目标。为一款销量仅几千台的设备定制硬件木马显然不划算。目标必须是海量出货、存储有价值数据且用户有强烈恢复意愿的设备例如消费级SSD、NAS设备或企业级存储芯片。2.2 威胁模型攻击者可能在哪个环节下手论文中清晰地定义了三种可能的攻击者角色对应芯片设计生产流程的不同阶段他们的能力和限制各不相同攻击者代号角色定位所处阶段能力与可见性攻击难度A1模块级设计工程师设计阶段RTL级负责某个功能模块如USB控制器无芯片顶层视野无法控制整体布局布线。较高。只能在自己负责的模块代码中插入恶意逻辑需确保该模块功能正常且不引入明显异常。A2系统集成工程师设计阶段系统集成/网表级负责将各个模块整合成完整芯片网表拥有芯片级视野能控制顶层布局除引脚外。最低最危险。可以将勒索软件逻辑作为一个独立的“黑盒”模块直接添加到顶层设计中并为其分配布局空间和连线资源。A3晶圆厂工程师制造阶段物理版图后拥有芯片最终版图GDSII文件的访问权限但无法修改已确定的模块布局。中等。需利用工程变更指令流程在现有标准单元之间的缝隙中“见缝插针”地植入恶意逻辑单元并重新布线。实操心得从防御角度看A2系统集成者是风险最高的内部威胁。在芯片设计公司必须对系统级网表和最终提交流片的GDSII文件进行严格的、独立的安全审计包括与原始RTL代码的功能等价性检查、未声明的额外模块检测以及功耗/时序异常分析。2.3 与传统硬件木马的异同硬件勒索软件是硬件木马的一个特殊子类。传统硬件木马的“有效载荷”可能是窃取密钥、造成计算错误或直接物理损坏。而硬件勒索软件的有效载荷是一个完整的加密引擎其目的不是永久破坏而是有条件地破坏加密并后续恢复解密。这种“可逆性”带来了新的设计挑战密钥管理加密密钥必须由攻击者可控且对受害者保密。但密钥又不能简单地硬编码在芯片里否则一旦被逆向工程提取所有受感染设备都能被免费解密。触发机制需要在特定条件下激活且激活后能独立完成加密操作。触发条件既要隐蔽避免在测试阶段被发现又要可靠确保能在预设场景下激活。解密流程受害者支付赎金后攻击者需能提供一个有效的解密密钥且芯片内的逻辑能验证并使用该密钥进行解密。3. 核心架构设计PUF与ECC的致命组合研究团队提出的硬件勒索软件架构其精妙之处在于巧妙地解决了上述挑战特别是密钥管理问题。整个架构可以看作一个精简的、自动化的“加密勒索系统-on-Chip”。3.1 系统级框图与工作流程整个硬件的核心由三个单元构成其交互关系如下图所示概念框图----------------------------------- | 硬件勒索软件核心 | | | 外部触发信号 -------| ---------------------------- | | | 控制单元 (CU) | | | | 有限状态机 | | | ---------------------------- | | ^ | | | | v | | --------------- ------------------ | | PUF单元 | | ECDH加密单元 | | | (产生PRK_V) | | (生成PBK_V, SS) | | --------------- ------------------ | | ^ | | v | | | ----------------------------------- | | 存储系统接口 | | | (连接地址/数据总线) | | ----------------------------------- ----------------------------------- | | v v 地址总线(Addr) 数据总线(Data)核心工作流程分为加密和解密两个阶段1. 加密阶段攻击执行触发外部或内部触发信号激活控制单元。密钥生成PUF单元利用芯片制造过程中的物理差异生成一个芯片唯一的私钥PRK_V。控制单元将PRK_V和攻击者预设的公钥PBK_A输入ECDH单元。计算共享密钥ECDH单元执行椭圆曲线迪菲-赫尔曼密钥交换算法计算出只有攻击者拥有私钥PRK_A和当前芯片拥有PRK_V才能得到的共享密钥SS。同时ECDH单元还会生成一个该芯片独有的公钥PBK_V。数据加密控制单元接管存储系统总线逐地址读取用户数据使用共享密钥SS进行加密再将密文写回原地址。至此用户数据被锁定。2. 解密阶段支付赎金后密钥传递受害者将芯片生成的公钥PBK_V发送给攻击者作为“设备指纹”。攻击者计算攻击者使用自己持有的私钥PRK_A和收到的PBK_V通过相同的ECDH算法计算出相同的共享密钥SS。密钥输入与验证受害者将收到的SS输入芯片。控制单元验证输入的SS是否与内部计算的SS匹配。数据解密验证通过后控制单元再次接管总线使用SS对加密数据进行解密并写回恢复数据。技术细节为什么选择PUFECDHPUF物理不可克隆函数解决了密钥的“唯一性”和“非存储性”问题。密钥不是存储在闪存中容易被提取的比特流而是由芯片的物理特征“涌现”出来的。即使攻击者使用相同的GDSII文件制造一百万颗芯片每颗芯片PUF产生的PRK_V都不同。这意味着攻击者需要为每台设备单独计算赎金密钥实现了攻击的“个性化”。ECDH椭圆曲线迪菲-赫尔曼解决了密钥的“可传递性”和“安全性”问题。攻击者无需知道每颗芯片的PRK_V只需持有自己的PRK_A。芯片公开传递的PBK_V不会泄露PRK_V。双方能独立计算出相同的共享密钥SS且该过程基于椭圆曲线离散对数难题在计算上是安全的。3.2 核心模块深度解析3.2.1 PUF单元芯片的“指纹”生成器论文中探讨了两种适用于此场景的PUFSRAM PUF利用SRAM上电时由于晶体管阈值电压微小差异导致的单元初始值随机性。这是ASIC实现中采用的方式因为SRAM是标准IP易于集成。但其稳定性需要辅助纠错电路。环形振荡器PUF利用一对环形振荡器因制造差异产生的频率微小差别来生成比特。这在FPGA实现中更常用因为FPGA的SRAM单元在上电配置后会被覆盖无法稳定保持PUF响应。在ASIC实测中研究团队使用了32x6位的SRAM作为PUF源生成了163位密钥。对20颗芯片的测量发现平均每颗芯片有22个比特位在多次上电时不稳定 Intra-PUF variation。因此在实际攻击中攻击者必须引入纠错码和辅助数据算法以确保每次上电都能生成稳定一致的PRK_V。这虽然增加了电路开销但对于确保攻击可靠性是必要的。3.2.2 ECDH加密单元性能与面积的权衡这是整个设计的算力核心。论文提出了两种实现体现了硬件设计经典的面积-性能折衷低延迟ECDH核心采用高度流水线化和并行化设计仅需3426个时钟周期即可完成一次完整的密钥生成计算PBK_V和SS。但代价是面积较大。低面积ECDH核心采用更节省面积的串行或迭代架构完成相同操作需要162,512个时钟周期是前者的47倍多。但其面积大幅减小。选择策略攻击者A2系统集成者拥有布局控制权可能选择低面积版本以最大化隐蔽性。而如果攻击者更看重加密速度例如针对高速存储设备则可能选择低延迟版本。论文后续在SoC中植入的案例使用的就是低面积版本。3.2.3 控制单元与触发机制控制单元是一个简单的有限状态机负责协调PUF、ECDH和存储接口。其设计关键在于触发机制。外部触发在实验芯片中为了方便测试使用了一个外部引脚信号作为触发。这在实际攻击中不现实。内部触发论文设计了一个基于地址访问计数器的内部触发。例如恶意逻辑监控存储总线当某个特定地址如一个很少被访问的系统保留地址被连续访问达到预设次数如10次时触发加密流程。攻击者可以编写一个特殊的驱动或软件在特定时间故意访问该地址序列来激活木马。对于正常软件几乎不可能碰巧满足这个精确的触发条件。注意事项设计内部触发是硬件木马的艺术。过于复杂的触发条件如一个128位的特定指令序列虽然隐蔽但可能因概率太低而永远无法激活。过于简单的触发如上电后固定时间则容易在测试阶段被发现。基于特定、罕见但可预测的系统行为的触发是更优的选择。4. 从设计到流片ASIC实现与实测验证理论研究能否经得起实践的检验研究团队用一块实实在在的芯片给出了答案。他们基于65纳米CMOS工艺设计并制造了一颗演示用的硬件勒索软件ASIC。4.1 芯片设计与实现细节这颗芯片不仅仅包含勒索逻辑为了测试验证还集成了几个辅助模块勒索软件核心采用低延迟ECDH核心和SRAM PUF。存储系统用一个64位地址、32位数据宽度的SRAM来模拟受害者的存储设备如硬盘。调试模块这不是攻击的一部分而是为了方便研究人员观察内部状态、读出密钥和存储数据在真实攻击中不会存在。芯片布局如下图所示示意图芯片中央是勒索软件核心标准单元海洋右上角是SRAM PUF左下角是模拟存储的SRAM右下角是调试模块。勒索逻辑的实际面积仅为0.14 mm²总芯片面积1 mm²。这个数字非常关键它意味着恶意逻辑可以做得非常小。设计流程团队使用Verilog编写代码用Cadence Genus进行逻辑综合用Innovus进行物理布局布线最后用Mentor Calibre进行物理验证DRC/LVS。整个流程与工业级ASIC设计完全一致证明了攻击的工程可行性。4.2 实测结果与隐蔽性分析芯片测试验证了完整的功能触发后数据被加密输入正确的共享密钥SS后数据被解密。更值得关注的是其对芯片特性的影响这直接关系到是否会被检测出来面积开销在后续的复杂SoC案例研究中将一个低面积版本的勒索软件植入一个包含AES、SHA-256、RSA等多个加密核心的SoC中仅使芯片的面积利用率从59.97%增加到60.70%增幅仅为0.73%。在数千万门级的现代SoC中这点面积增加完全淹没在工艺偏差和设计余量中。功耗开销静态功耗勒索软件核心本身的静态功耗极低在典型工艺角下仅为0.5µW左右。植入SoC后使整个SoC的静态功耗增加了约2%。论文对20颗测试芯片的静态功耗进行了测量其分布符合正态分布勒索软件引入的功耗增量完全落在工艺波动范围内无法被区分。动态功耗仅在触发和执行加密/解密操作时产生。由于触发事件极其罕见在芯片生命周期中其带来的额外动态功耗可忽略不计。时序影响对植入木马后的SoC进行时序分析未发现任何时序违例。恶意逻辑的插入没有影响原设计的工作频率。结论是震撼的从面积、功耗、性能这些可测试的物理指标来看一个精心设计的硬件勒索软件几乎无法被检测。它不会导致芯片过热、不会让芯片变慢、也不会显著增大芯片面积。它就像一颗完美的“休眠细胞”静待激活。5. 实战推演将勒索软件植入复杂SoC为了模拟最真实的攻击场景研究团队选择了一个开源的复杂SoC平台——通用评估平台CEP。该平台基于RISC-V内核集成了AES、3DES、SHA-256、RSA等多种加密模块以及DSP核心是一个功能丰富的系统级芯片。5.1 攻击者A2的场景系统集成时植入在这个场景中攻击者是拥有系统集成权限的工程师A2。他的操作步骤如下获取网表在集成阶段他拥有整个SoC的网表文件。添加模块他将硬件勒索软件的HDL代码或已综合好的网表作为一个独立的顶层模块添加到SoC的顶层设计中。连接接口他将勒索软件模块的地址/数据总线连接到SoC的系统总线上例如AXI或AHB总线并将其触发信号连接到某个内部节点如特定寄存器的值。布局布线在物理设计阶段他可以为这个“新增模块”在版图上分配一块区域。如下图所示布局对比图攻击者将勒索逻辑紫色区域放置在版图右上角。这导致附近的RSA模块位置略有下移但整个布局依然合法布线拥堵程度没有显著恶化所有时序要求均被满足。结果最终SoC的面积利用率仅从59.97%微增至60.70%总功耗增加0.36%。这些变化在芯片测试中根本无法与正常的工艺波动区分开。5.2 攻击者A3的场景制造阶段通过ECO植入这个场景更隐蔽攻击者是晶圆厂的工程师A3。他拿到的是准备投产的最终版图GDSII文件。他的攻击利用了工程变更指令流程分析版图他使用后端工具分析现有版图寻找标准单元之间未被利用的“缝隙”。ECO插入他准备好勒索软件的网表利用ECO工具在不改变现有模块布局的前提下将这些额外的标准单元“挤”进版图的缝隙中。增量布线工具尝试为这些新插入的单元进行局部布线连接到最近的电源网格和信号线上。结果如下图所示ECO插入的勒索逻辑紫色小点分散在原有逻辑的缝隙中没有改变任何原有模块的形状和位置。面积利用率有微小变化功耗增加仅0.15%。这种攻击对原设计的影响甚至比A2的攻击更小但技术难度更高需要攻击者对后端工具有极深的了解。实操心得与防御启示对A2的防御必须实施严格的供应链安全管理和代码/网表审计。对最终提交流片的网表和GDSII应与经过验证的黄金参考设计进行形式化验证或逻辑等价性检查以发现未声明的额外逻辑。对A3的防御极为困难。一种学术上的思路是BISA即有功能填充单元。即在设计阶段故意用一些有简单功能的逻辑单元如反相器链填满所有空白区域。这样攻击者A3在尝试ECO插入时就必须先移除这些填充单元从而留下物理痕迹。但这种方法会显著增加静态功耗在实际工程中应用有限。更现实的方法是加强对晶圆厂的物理安全审计和信任度评估。6. 攻击的局限性、演进与防御思考尽管这项研究展示了硬件勒索软件在技术上的可行性但它并非完美无缺其走向实际应用仍面临诸多挑战而这些挑战也指明了防御的方向。6.1 当前实现的局限性用户接口与通信如前所述这是最大短板。如何优雅地告知受害者并收取赎金写入一个文本文件到存储设备是最直接的但这要求恶意逻辑理解文件系统增加了复杂性。或许未来的变种会与软件木马结合由软件部分处理通信和支付。PUF的稳定性SRAM PUF的响应存在波动需要纠错。纠错电路会增加面积和功耗并可能引入侧信道信息。攻击者需要权衡稳定性和隐蔽性。加密对象演示中加密的是一个片上SRAM。真实攻击需要加密外部非易失性存储如NAND Flash这就需要控制相应的存储控制器复杂度更高。经济性与针对性这种攻击成本高昂注定是高级持续性威胁针对高价值目标如特定企业、关键基础设施的组件而非普通消费者。6.2 未来可能的演进逻辑复用攻击更高级的攻击者不会从头添加一个完整的加密模块。他们会尝试复用目标SoC中已有的加密硬件。例如SoC中本来就有AES加速器攻击者可能通过篡改其控制逻辑在特定条件下将其“劫持”用于勒索加密。这会使恶意逻辑的足迹更小检测难度呈指数级上升。基于时间的“炸弹”攻击者可能放弃与受害者沟通将攻击设计为“时间炸弹”。例如在芯片出厂三年后或者当芯片累计运行达到某个时间阈值时自动触发加密。其目的可能不是赎金而是造成某个时间点的大规模瘫痪用于金融做空或地缘政治目的。结合侧信道触发触发条件不再依赖数字逻辑信号而是基于功耗、电磁辐射或温度等模拟侧信道信息使其更加隐蔽。6.3 硬件安全防御的严峻挑战这项研究像一记警钟揭示了硬件安全防御的深层次困境检测如同大海捞针在数亿门级的芯片中寻找几十到几万门级的恶意逻辑且其功耗、面积、时序特征都落在正常波动范围内现有测试和侧信道分析手段几乎无能为力。信任根危机如果从芯片设计、制造到封测的漫长供应链中任何一个环节都可能被渗透那么我们还能信任手中的硬件吗这动摇了整个计算安全的根基。防御成本高昂全面的硬件安全验证、可信供应链建设、先进的可信执行环境设计都需要巨大的成本投入而这最终会转嫁到产品价格上。作为一名从业者我的体会是硬件勒索软件的研究并非为了教唆犯罪而是进行“威胁建模”。它提前揭示了攻击者可能采用的技术路径迫使安全社区在攻击发生之前就思考防御策略。对于芯片设计公司这意味着必须将安全左移在架构设计阶段就考虑对抗硬件木马采用诸如逻辑混淆、传感器网络、运行时监控等主动防御机制。对于系统集成商和最终用户则意味着需要建立分层的安全信任模型不依赖单一硬件的绝对安全而是通过软件、网络和流程的协同来构建纵深防御体系。这项研究打开了一扇通往硬件安全黑暗森林的大门。门后的世界充满挑战但唯有正视这些威胁才能推动我们构建更加坚韧、可信的数字基础设施。硬件安全的博弈是一场发生在纳米尺度上的无声战争而这场战争才刚刚开始。

查看全文

http://www.zskr.cn/news/1392923.html