当前位置: 首页 > news >正文

CANN-昇腾NPU-模型加密-怎么保护知识产权

模型部署到客户机房怎么防止被反编译、权重被提取CANN 提供了模型加密工具把.pt/.onnx模型加密成.om离线模型没有密钥无法加载。加密流程原始模型 (.pt) → 加密工具 → 加密模型 (.om) ↑ 密钥文件 (.key)加密后的.om文件只能在有密钥的机器上运行且密钥跟机器 MAC 地址绑定。加密步骤步骤 1生成密钥# 生成密钥文件跟机器 MAC 绑定atc--mode3\--outputmodel.om\--key_filemodel.key\--bind_macyes# 绑定 MAC 地址model.key是二进制密钥文件需要妥善保管丢了无法解密。步骤 2加密模型# 把 PyTorch 模型转成 ONNX中间格式python export_onnx.py--modelmeta-llama/Llama-2-7b-hf--outputmodel.onnx# 加密 ONNX → .omatc--mode0\--modelmodel.onnx\--outputmodel.om\--key_filemodel.key\--framework5# ONNX 格式步骤 3部署加密模型fromatbimportLLM# 加载加密模型需要密钥文件modelLLM(model.om,key_filemodel.key,# 提供密钥devicenpu:0,)没有model.key或密钥跟机器 MAC 不匹配加载失败。密钥管理方案 1密钥跟机器绑定atc--mode3--key_filemodel.key--bind_macyes优点即使密钥文件泄露也不能在其他机器上使用缺点机器更换网卡后密钥失效需要重新生成方案 2密钥不绑定机器atc--mode3--key_filemodel.key--bind_macno优点机器更换不影响缺点密钥文件泄露后可以随意使用方案 3远程密钥服务# 推理服务启动时从远程拉取密钥不落盘importrequests keyrequests.get(https://key-server/internal/model.key).contentwithopen(/dev/shm/model.key,wb)asf:f.write(key)# 加载模型modelLLM(model.om,key_file/dev/shm/model.key)# 用完后删除os.remove(/dev/shm/model.key)密钥不落盘只存在于内存。即使机器被攻破密钥也不会泄露。性能影响加密模型加载时多了一步解密推理时零开销解密后的指令已经加载到 NPU。操作无加密有加密额外开销模型加载2.5s3.1s0.6s (24%)推理prefill35ms35ms0推理decode/token0.31ms0.31ms0加密只影响加载速度不影响推理速度。限制只支持离线模型.omPyTorch 的.pt格式不支持加密需要先转成.om。密钥绑定 MAC换网卡需要重新生成密钥。调试不便加密模型无法用 Profiler 查看算子细节只能看到加密后的 kernel 名。跟 ATB 的配合ATB 的cache_dir会缓存编译后的模型。如果原始模型是加密的缓存的也是加密的modelLLM(model.om,key_filemodel.key,cache_dir./model_cache,# 缓存的也是加密的devicenpu:0,)第一次加载需要解密 编译约 30-60s后续加载只需要解密约 3-5s。模型加密是部署到客户机房的必备步骤。CANN 的加密工具使用简单性能影响只在前期的模型加载推理零开销。记得保管好密钥文件。仓库在这里https://atomgit.com/cann/ATB
http://www.zskr.cn/news/1359581.html

相关文章:

  • 韦斯试验——可程式恒温恒湿试验箱:功能与优势
  • 为什么92%的移动端应用留不住用户?Lovable开发框架的3个反直觉真相
  • Taotoken 的 Token Plan 套餐如何帮助我们预测并锁定开发成本
  • c语言中scanf的基本用法、返回值、占位符、赋值忽略符
  • 抖音批量下载神器:免费无水印下载工具的完整指南
  • XDM浏览器插件:如何将下载速度提升500%的完整指南
  • 芜湖6月雨季来临,房屋漏水怎么办?卫生间免砸砖防水、外墙、屋面+地下室渗漏。权威防水公司靠谱TOP5推荐(2026年6月本地最新深度调研) - 企业资讯
  • 如何快速清理Windows右键菜单:终极管理工具完整指南
  • Anthropic 万亿估值启示录:战略聚焦如何击败全面扩张
  • 在微服务架构中集成Taotoken实现智能客服路由与成本控制
  • 5分钟掌握Illustrator批量替换终极技巧:ReplaceItems.jsx完整指南
  • 并行化FRNN算法在AI公平性与鲁棒性监控中的应用
  • MPC5604B/C Boot启动机制全解
  • 台庆科-低直流阻抗磁珠(AEC)
  • 澳门大学李绍平等:推动中药迈向科学第5范式
  • 湛江6月雨季来临,房屋漏水怎么办?卫生间免砸砖防水、外墙、屋面+地下室渗漏。权威防水公司靠谱TOP5推荐(2026年6月本地最新深度调研) - 企业资讯
  • AI赋能竞对分析:告别低效人工,抢占先机
  • Adobe-GenP 3.0:解锁Adobe全家桶的终极指南
  • 2025年AI数字人行业现状:全国超99万家企业涌入,真正能落地的不到一成
  • 新手入门教程,五分钟完成Taotoken API Key配置与Python调用
  • 如何快速掌握RPFM编辑器:Total War模组制作终极指南
  • 宿迁6月雨季来临,房屋漏水怎么办?卫生间免砸砖防水、外墙、屋面+地下室渗漏。权威防水公司靠谱TOP5推荐(2026年6月本地最新深度调研) - 企业资讯
  • SUMO-RL:基于强化学习的智能交通信号控制系统实战指南
  • 观测 TaoToken 在多模型间自动路由的稳定性与响应速度
  • 将Taotoken作为统一网关整合到企业现有微服务架构中的设计考量
  • 3步快速搭建微信小程序商城:巴爷商城开源项目实战指南
  • 如何轻松实现Windows任务栏图标居中?TaskbarX完整使用指南
  • 跨越嘈杂车间的无障碍沟通:工业降噪与特种方言识别在智能巡检中的声学优化实践
  • 金华6月雨季来临,房屋漏水怎么办?卫生间免砸砖防水、外墙、屋面+地下室渗漏。权威防水公司靠谱TOP5推荐(2026年6月本地最新深度调研) - 企业资讯
  • 回收藤Fujikura 100P+光纤熔接机