当前位置: 首页 > news >正文

CANN/asc-devkit SIMT bfloat16数学函数

hfloor

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品x
Atlas A2 训练系列产品/Atlas A2 推理系列产品x
Atlas 200I/500 A2 推理产品x
Atlas 推理系列产品AI Corex
Atlas 推理系列产品Vector Corex
Atlas 训练系列产品x

功能说明

获取小于或等于输入数据的最大整数值。

函数原型

inline bfloat16_t hfloor(bfloat16_t x)

参数说明

表 1参数说明

参数名输入/输出描述
x输入源操作数。

返回值说明

小于或等于输入数据的最大整数值。本接口受全局饱和模式影响,特殊值如下:

x值非饱和模式返回值饱和模式返回值
infinfASCRT_MAX_NORMAL_BF16
-inf-inf-ASCRT_MAX_NORMAL_BF16
nannan0

约束说明

需要包含的头文件

使用bfloat16_t类型接口需要包含"simt_api/asc_bf16.h"头文件。

#include "simt_api/asc_bf16.h"

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void KernelIsFinite(bfloat16_t* dst, bfloat16_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = hfloor(x[idx]); }
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) inline void KernelIsFinite(__gm__ bfloat16_t* dst, __gm__ bfloat16_t* x) { int idx = threadIdx.x + blockIdx.x * blockDim.x; dst[idx] = hfloor(x[idx]); }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.zskr.cn/news/1341041.html

相关文章:

  • RustSec平台注册表揭秘:跨平台开发的7个最佳安全实践
  • snnTorch性能优化:10个技巧让你的SNN训练速度提升300%
  • 终极指南:如何在普通电脑上运行BitNet 1-bit大语言模型
  • UDEV Gothic技术实现深度剖析:字体合成、字形优化与元数据处理
  • SPlisHSPlasH粘度模拟技术详解:从标准方法到最新算法
  • 【卷卷观察】Google I/O 2026 炸场:AI 不再跟你聊天了,它开始替你干活了
  • gibMacOS终极指南:三步完成macOS组件下载与系统部署
  • 终极歌词神器:5分钟学会用LDDC为你的音乐库添加完美歌词
  • BDE最佳实践:避免常见陷阱的20个专业建议 [特殊字符]
  • 实战测试10款降AIGC平台:只选真正管用的那一款!
  • AI大模型不是硕士专属!普通人想转行?这4条高薪赛道任你选!
  • 知识竞赛电子计分板 vs 手工计分板:差距有多大
  • Magma高可用部署:如何构建企业级可靠网络基础设施
  • 中小企业如何利用Taotoken的Token Plan实现AI成本可控
  • Android Bug Bounty终极指南:从零开始到提交高质量漏洞报告的完整实战流程 [特殊字符]
  • 软考高项案例分析9:项目采购管理
  • 如何利用Machine Learning Experiments训练你的第一个神经网络模型
  • Wallaby自定义查询:扩展测试框架的灵活性
  • 深入解析AVRDUDESS:图形化AVR编程工具实战手册
  • Show-o实战教程:文本到图像生成的10个技巧
  • CDCS金融算法挑战赛终极指南:甜橙金融与融360实战案例深度解析
  • jor1k开发者指南:如何扩展自定义硬件设备模拟
  • gitstatus 与 Powerlevel10k 完美集成:打造终极终端体验
  • Aspia性能测试对比:与传统远程桌面工具的优劣分析
  • 年龄验证法律来袭,开发者如何应对?开源生态系统面临哪些挑战与机遇?
  • 吃透这 100 个安全知识点,轻松站稳网安行业
  • 收藏必备!2026Web 安全完整学习指南
  • 入门必学 Web 安全教程 从零吃透 Web 基础
  • 2026 最新完整版网安学习图谱 零基础到实战大神
  • 【深度解析】Gemini 3.5 Flash:面向 Agentic Workflow 的高速多模态大模型选型与实战