当前位置: 首页 > news >正文

Ascend(昇腾)性能优化文章导航

作者:昇腾实战派

算力赋能时代,性能优化既是突破算力瓶颈的关键,也是国产化智能化转型的核心命题。本文聚焦昇腾设备全链路性能优化,汇总从硬件到软件,从算子到框架的实用干货,拆解调优技巧、分享实战案例、解答常见痛点。无论你是深耕昇腾的技术开发者,还是初探优化领域的初学者,都能在这里找到有价值的内容,一起解锁昇腾算力潜能,共探性能优化之道。

一、基础知识

1.1 推理框架及其特性

【推理框架 - vLLM】:vLLM-Ascend模型推理知识管理地图
【推理框架 - SGLang】:SGLang知识地图

1.2 常用模型

【常用模型 - DeepSeek系列】:DeepSeek知识地图;DeepSeek推理部署知识地图

二、定位指导

【定位指导】性能问题通用定位指南

三、工具资源

【工具资源 - 环境预检工具】MindStudio预检工具 - msprechecker
【工具资源 - profiling采集工具】基于vllm-ascend的性能采集方法
【工具资源 - profiling分析工具】MindStudio-Insight

四、调优案例

4.1 推理案例

4.1.1 下发性能调优

【推理案例 - 下发性能调优】NPU推理性能优化实践:从CPU下发瓶颈到算子级调优
【推理案例 - 下发性能调优】Qwen3-32B 推理性能优化实践:基于绑核与NUMA内存调度的TTFT调优

4.1.2 计算性能调优

【推理案例 - 计算性能调优】模型Prefill阶段性能优化实践:从快慢卡问题到吞吐率提升

4.1.3 通信性能调优

http://www.zskr.cn/news/1325630.html

相关文章:

  • 微信小程序 Vue3基于springboot框架的社区团购自提系统
  • Perplexity教育信息搜索全链路拆解:从提问设计→信源验证→引用导出(含教育部推荐引用规范适配版)
  • 2026届毕业生推荐的AI写作助手实际效果
  • 2026届学术党必备的十大AI学术方案实测分析
  • 节日场景下慈善钓鱼与宠物诈骗机理及闭环防御研究
  • 金融公共服务机构钓鱼邮件威胁治理研究 —— 以 NSI 安全事件为例
  • JOIN、IN、EXISTS谁最快?实测三种写法性能差异与执行计划深度剖析
  • 激光全息防伪标签哪家好?2026二维码防伪标签公司推荐:宏鑫源防伪测评 - 栗子测评
  • 开发过程中如何利用Taotoken的容灾路由保障服务高可用
  • 普通工程师堆起来的人海战术,作用其实很有限
  • 一切命运皆可破,我命由我不由天
  • 做芯片的人,为什么容易看不起管理岗?
  • Textractor:3分钟掌握游戏文本提取,轻松跨越语言障碍!
  • ARM Trace Buffer架构与调试优化实践
  • Win系统安装docker
  • 为ubuntu上的openclaw工具配置taotoken作为模型供应商
  • 不经意传输协议的外包化优化与实践
  • Kubernetes集群能耗监测:RAPL与Prometheus方案对比
  • ARMv8-A架构AArch64异常处理机制详解
  • 告别格式大战!用VSCode的Prettier插件拯救你的代码洁癖(含保存即格式化、快捷键技巧)
  • 源头电主轴厂家推荐!顺源精密专注进口电主轴维修,自研高速精密电主轴,告诉你电主轴哪家好,行业口碑优选 - 栗子测评
  • 别再硬背公式了!用Python手把手带你调参二维卡尔曼滤波(附完整代码与可视化对比)
  • 【公安基础知识】01
  • 手机店还会存在吗
  • 从手机待机到芯片发热:深入聊聊CMOS反相器那点‘电费’是怎么算出来的
  • 2026杭州弱电工程哪家专业?智能照明/监控安防系统/机房施工公司实力盘点 - 栗子测评
  • 2026杭州专业汽车4S店弱电智能化服务公司推荐:车牌识别系统/门禁道闸定制厂家实力解析 - 栗子测评
  • 人脸识别:用数据蒸馏训练高精度人脸识别模型
  • 从沙子到车辙(1.2):计算的梦想与破灭
  • 022、旋转变压器原理与解码