当前位置: 首页 > news >正文

CANN/asc-devkit TPipe和TQue加法示例

基于TPipe和TQue的Add样例

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

概述

本样例基于TPipe和TQue的内存和同步管理机制实现Add向量加法操作。

支持的产品

  • Ascend 950PR/Ascend 950DT
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品

目录结构介绍

├── add_tpipe_tque │ ├── scripts │ │ ├── gen_data.py // 输入数据和真值数据生成脚本 │ │ └── verify_result.py // 验证输出数据和真值数据是否一致的验证脚本 │ ├── CMakeLists.txt // 编译工程文件 │ ├── data_utils.h // 数据读入写出函数 │ └── add.asc // Ascend C样例实现,tque管理内存 & 调用样例

样例描述

  • 样例功能:
    计算公式:

    z = x + y
  • 样例规格:

    样例类型(OpType)Add
    样例输入nameshapedata typeformat
    x[8, 2048]floatND
    y[8, 2048]floatND
    样例输出z[8, 2048]floatND
    核函数名add_custom
  • 样例实现:

    • Kernel实现
      使用TPipe和TQue管理内存和同步,完成对输入数据的向量加法操作。

    • 调用实现
      使用内核调用符<<<>>>调用核函数。

编译运行

在本样例根目录下执行如下步骤,编译并执行样例。

  • 配置环境变量
    请根据当前环境上CANN开发套件包的安装方式,选择对应配置环境变量的命令。

    • 默认路径,root用户安装CANN软件包

      source /usr/local/Ascend/cann/set_env.sh
    • 默认路径,非root用户安装CANN软件包

      source $HOME/Ascend/cann/set_env.sh
    • 指定路径install_path,安装CANN软件包

      source ${install_path}/cann/set_env.sh
  • 样例执行

    mkdir -p build && cd build; # 创建并进入build目录 cmake -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # 编译工程(默认npu模式) python3 ../scripts/gen_data.py # 生成测试输入数据 ./demo # 执行编译生成的可执行程序,执行样例 python3 ../scripts/verify_result.py output/output.bin output/golden.bin # 验证输出结果是否正确,确认算法逻辑正确

    使用 CPU调试 或 NPU仿真 模式时,添加-DCMAKE_ASC_RUN_MODE=cpu-DCMAKE_ASC_RUN_MODE=sim参数即可。

    示例如下:

    cmake -DCMAKE_ASC_RUN_MODE=cpu -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # cpu调试模式 cmake -DCMAKE_ASC_RUN_MODE=sim -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; # NPU仿真模式

    注意:切换编译模式前需清理 cmake 缓存,可在 build 目录下执行rm CMakeCache.txt后重新 cmake。

  • 编译选项说明

选项可选值说明
CMAKE_ASC_RUN_MODEnpu(默认)、cpusim运行模式:NPU 运行、CPU调试、NPU仿真
CMAKE_ASC_ARCHITECTURESdav-2201(默认)、dav-3510NPU 架构:dav-2201 对应 Atlas A2 训练系列产品/Atlas A2 推理系列产品和Atlas A3 训练系列产品/Atlas A3 推理系列产品,dav-3510 对应 Ascend 950PR/Ascend 950DT
  • 执行结果
    执行结果如下,说明精度对比成功。
    test pass!

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.zskr.cn/news/1344746.html

相关文章:

  • 抖音无水印下载神器:douyin-downloader一站式解决方案
  • ViGEmBus:Windows内核态虚拟输入设备架构深度解析
  • LibreSprite完整教程:从零开始掌握免费像素艺术与动画创作
  • QMCDecode:3步解锁QQ音乐加密音频的终极解决方案
  • 《Sysinternals实战指南》进程和诊断工具学习笔记(8.32):谁在占用这个文件?用 Handle 精准搜索、定位并释放锁
  • 抖音下载终极解决方案:免费高效的douyin-downloader完整使用手册
  • DLSS Swapper完整指南:3分钟掌握游戏性能优化终极技巧
  • 2026年实测AI论文写作软件合集(实测甄选版)
  • 如何快速发现巴西开发者开源宝藏:awesome-made-by-brazilians项目完全指南
  • 金湖县黄金回收哪家强?铭润稳居第一 - 亦辰小黄鸭
  • 2026安阳县黄金回收白银回收铂金回收店铺实力排行榜TOP5;K金+金条+银条+首饰回收靠谱门店及联系方式推荐 - 前途无量YY
  • 深度技术解析:Lenovo Legion Toolkit 高级性能调优与系统集成指南
  • QQ空间数据备份指南:三步骤永久保存你的数字青春
  • 2026TOP5株洲市石峰区黄金,白银,铂金回收门店推荐及联系方式权威发布 - 前途无量YY
  • 探索AI-Shoujo HF Patch:解锁游戏完整体验的终极方案
  • DownGit:3分钟掌握GitHub文件下载的终极指南,无需克隆整个仓库!
  • Linux Pulseaudio深度解析之pa_context_set_default_source调用流程与实战(十三)
  • 免费商用多语言字体终极指南:思源黑体TTF构建教程
  • 26-cv-3985 Lucky Egg 桌游英国派对游戏商Lucky Egg商标版权双维权!爆款抢麦卡牌涉案,TRO已出!卖家速排查避雷。
  • 告别克隆整个仓库:GitHub文件精准下载工具使用指南
  • 注意力机制:多头注意力机制、分组查询注意力机制、多查询注意力机制理论+代码
  • 新能源车辆数据处理平台架构
  • Windows Btrfs驱动完全指南:解锁Linux文件系统的7大核心优势
  • 告别克隆整个仓库:GitHub文件精准下载工具使用指南
  • 5分钟快速上手:免费在线EPUB编辑器终极指南
  • 终极kill-doc指南:一键下载30+文档平台,告别付费墙和登录限制
  • 米哈游游戏字体库终极指南:轻松获取11款精美架空文字字体资源
  • 告别焦虑等待!Elsevier投稿状态自动追踪插件,让你的科研进度一目了然
  • 【硬件面试题精讲】运放求和 + 同相放大电路输出计算(附原理与通用公式)
  • RAG 检索增强生成(全链路)