当前位置: 首页 > news >正文

CANN/asc-devkit Tan接口临时空间大小获取

GetTanMaxMinTmpSize

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

功能说明

kernel侧Tan接口的计算需要开发者预留/申请临时空间,本接口用于在host侧获取预留/申请的最大和最小临时空间大小,开发者基于此范围选择合适的空间大小作为Tiling参数传递到kernel侧使用。

  • 为保证功能正确,预留/申请的临时空间大小不能小于最小临时空间大小;
  • 在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。

函数原型

void GetTanMaxMinTmpSize(const ge::Shape& srcShape, const uint32_t typeSize, const bool isReuseSource, uint32_t& maxValue, uint32_t& minValue)

参数说明

表 1接口参数列表

参数名

输入/输出

描述

srcShape

输入

输入的shape信息。

typeSize

输入

输入的数据类型大小,单位为字节。比如输入的数据类型为half,此处应传入2。

isReuseSource

输入

是否允许修改源操作数。

maxValue

输出

Tan接口能完成计算所需的最大临时空间大小,超出该值的空间不会被该接口使用。在最小临时空间-最大临时空间范围内,随着临时空间增大,kernel侧接口计算性能会有一定程度的优化提升。为了达到更好的性能,开发者可以根据实际的内存使用情况进行空间预留/申请。最大空间大小为0表示计算不需要临时空间。

请注意,maxValue仅作为参考值,有可能大于Unified Buffer剩余空间的大小,该场景下,开发者需要根据Unified Buffer剩余空间的大小来选取合适的临时空间大小。

minValue

输出

Tan接口能完成计算所需最小临时空间大小。为保证功能正确,接口计算时预留/申请的临时空间不能小于该数值。最小空间大小为0表示计算不需要临时空间。

返回值说明

约束说明

调用示例

完整的调用样例请参考更多样例。

// 输入shape信息为1024;算子输入的数据类型为half;不允许修改源操作数 std::vector<int64_t> shape_vec = {1024}; ge::Shape shape(shape_vec); uint32_t maxValue = 0; uint32_t minValue = 0; AscendC::GetTanMaxMinTmpSize(shape, 2, false, maxValue, minValue);

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.zskr.cn/news/1325743.html

相关文章:

  • CANN/asc-devkit Round接口文档
  • 通过 Python 快速开始你的第一个 Taotoken 多模型调用示例
  • 2026最新亲测!3款文本转语音工具真香神器,免费无套路好用到哭!
  • 避坑指南:用YOLOv5处理VisDrone数据集时,你可能会遇到的5个问题及解决方法
  • OpCore Simplify终极指南:5分钟掌握黑苹果EFI自动化配置
  • Linux存储核心:块设备与分区表的本质区别及实践指南
  • 终极指南:3步完成黑苹果OpenCore EFI配置,告别繁琐手动设置
  • Pixelle-Video终极指南:如何用AI全自动制作专业短视频
  • STL文件预览工具:重构3D模型管理流程的轻量级自动化解决方案
  • 2026年4月储罐企业推荐,不锈钢储罐/双层油罐/装油罐/水泥罐/钢油罐/SF双层油罐/化工原料罐,储罐源头厂家哪家好 - 品牌推荐师
  • 配置 UFW 防火墙时怎么放行三网直连所需的关键端口
  • 干粉制粒机靠谱厂家怎么挑?资深行业人教你精准选型不踩坑,膨润土猫砂专用制粒机/对辊造粒机,制粒机企业口碑推荐 - 品牌推荐师
  • 探索高效逆向分析:5个专业技巧助你深入理解Unity游戏机制
  • Go语言多租户架构:隔离与资源共享
  • 从提示词到成片:2026年AI视频工作流效率革命——Top 5工具的Prompt工程兼容度、重绘响应延迟与跨平台资产复用率实测
  • [开源] 护理语音医嘱转换系统:面向移动护理终端的结构化记录工具,自动解析床号、操作、参数与通知状态
  • ChatGPT-Next-Web:跨平台AI对话的终极解决方案
  • 网络基本原理
  • Trae 在极致成本优化中的 Token 消耗实测:3 类场景平均降低 37% 调用量
  • 怎样高效配置浏览器资源嗅探工具:实用操作手册
  • TVA视觉新范式:工业视觉的百年未有之大变局(2)
  • 告别复制粘贴!用Python+GoBot Pro 1.0,5分钟搞定Excel数据自动录入网页表单
  • 迷宫算法避坑指南:为什么你的‘流水算法’跑不出最短路径?(附Python调试技巧)
  • 特高压输电线路在线监测系统设计:从架构到嵌入式核心板选型实践
  • 树莓派Web IDE:零配置云端编程环境与Python硬件模拟实践
  • 保姆级教程:用VASP+VTST脚本搞定CI-NEB过渡态计算(从编译到出图)
  • 告别付费插件!手把手教你用.NET 4.x在Unity里免费读取CAD图纸(附完整Demo)
  • 《Windows Sysinternals实战指南》5.10 Process Monitor 学习笔记:分析工具——从海量事件到可下手的证据
  • 《Windows Sysinternals实战指南》Process Monitor 学习笔记(5.4):进程树(Process Tree)—一眼看穿父子关系与可疑链路
  • 对比直接使用原厂API,通过聚合平台调用大模型的便利性体验