当前位置: 首页 > news >正文

CANN/Ascend C:批处理矩阵乘法临时缓冲区大小计算

BatchMatmulGetTmpBufSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

BatchMatmul Tiling调用GetTiling接口获取Tiling参数后,根据Tiling结构体信息获取L1 Buffer/Unified Buffer/L0C Buffer的使用大小。

函数原型

int32_t BatchMatmulGetTmpBufSize(optiling::TCubeTiling &tiling, matmul_tiling::SysTilingTempBufSize &bufSize)

参数说明

表 1参数说明

参数名

输入/输出

描述

tiling

输入

BatchMatmul Tiling的结构体,即BatchMatmulTiling对象得到的TCubeTiling结构体。

bufSize

输出

根据TCubeTiling结构体信息获取L1 Buffer/Unified Buffer/L0C Buffer的使用大小。

SysTilingTempBufSize结构定义如下方代码所示。

struct SysTilingTempBufSize { int32_t ubSize = 0; // Unified Buffer大小 int32_t l1Size = 0; // L1 Buffer大小 int32_t l0cSize = 0; // L0C Buffer大小 };

返回值说明

-1表示获取失败; 0表示获取成功。

约束说明

调用示例

auto ascendcPlatform = platform_ascendc::PlatformAscendC(context->GetPlatformInfo()); matmul_tiling::BatchMatmulTiling tiling(ascendcPlatform); optiling::TCubeTiling tilingData; ... // 初始化tilingData,详见MatmulTiling类使用说明 int ret = tiling.GetTiling(tilingData); // 获取Tiling参数 SysTilingTempBufSize bufSize; BatchMatmulGetTmpBufSize(tilingData, bufSize);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.zskr.cn/news/1340887.html

相关文章:

  • DiffMOT: A Real-time Diffusion-based Multiple Object Tracker with Non-linear Prediction代码详解-2
  • CANN/asc-devkit矩阵计算SetFixSplit
  • Pandora.js与PM2对比分析:哪个更适合你的Node.js应用管理?
  • CANN/ops-tensor矩阵乘Kernel框架
  • 如何5分钟掌握ZeroOmega:浏览器代理智能切换的终极指南
  • 异常处理函数在WebShell免杀中的实战应用:绕过安全检测的终极指南
  • Carnac键盘操作可视化工具:让每个按键都清晰可见的终极方案
  • 【车辆】基于110cc全地形车平台设计的自主无人地面车辆GPS 航路点导航、纯追踪路径跟踪、越野自动驾驶功能附matlab代码
  • qb-web测试策略:Jest单元测试与Vue组件测试最佳实践
  • GLM-4V-9B性能优化技巧:提升推理速度、降低显存占用的5种方法
  • DistroAV终极指南:如何在OBS Studio中实现专业级NDI视频流传输
  • Lawnicons疑难解答:常见问题与解决方案大全
  • 《Sysinternals实战指南》ListDLLs Handle 学习笔记(8.11):谁注入了 DLL?谁占着文件不放?一篇教你全搞定
  • Pitest实战教程:从零构建完整的变异测试流程 - Java代码质量的终极守护者
  • Agent 一接骨架屏页面就开始误判完成态:从 Skeleton Claim 到 Ready State Proof 的工程实战
  • 2026亲测:专业降AIGC平台TOP1推荐
  • clawPDF命令行操作:10个实用技巧实现批量PDF处理
  • 在线去除视频水印用什么工具?2026 免费工具推荐及实测对比 - 科技热点发布
  • 抖音视频怎样去水印?2026 抖音去水印方法全解析,免费在线工具实测对比 - 科技热点发布
  • 10个Elog实用技巧:让你的博客管理效率翻倍
  • Emacs-which-key排序与分页功能详解:高效管理大量快捷键的完整指南
  • R3nzSkin国服特供版:英雄联盟免费换肤工具完整使用指南
  • 2026年免费去水印在线工具推荐|去水印工具哪个最好用?实测对比 - 科技热点发布
  • WZLBadge高级定制:从颜色位置到字体半径的完全自定义
  • 豆包生成的流程图怎么导出
  • SWOT分析是什么
  • NestJS、Spring Cloud、FastAPI、Django 深度对比分析报告
  • CANN/asc-devkit原子或操作API
  • asmcmd lsdg 输出指标解读,相关指标计算方式
  • RustRedOps入门指南:10个核心红队技术快速上手