当前位置: 首页 > news >正文

CANN/catlass 卷积瓦片拷贝

ConvTileCopy

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

代码位置

[TOC]

功能说明

ConvTileCopy是卷积(Conv)场景的搬运模板集合,结构上与 TileCopy 完全相同,区别仅在于模板参数命名和用途——专门服务于 Convolution 的 Im2Col + GEMM 流程。

BiasType 为必选参数(非默认void),因为 Conv 通常包含 Bias。

引用的 Tile 组件

成员别名引用的底层模板说明
CopyGmToL1ACopyGmToL1<ArchTag, AType>A 矩阵 GM→L1
CopyGmToL1BCopyGmToL1<ArchTag, BType>B 矩阵 GM→L1
CopyL1ToL0ACopyL1ToL0A<ArchTag, L1AType>A 矩阵 L1→L0A
CopyL1ToL0BCopyL1ToL0B<ArchTag, L1BType>B 矩阵 L1→L0B
CopyL0CToGmCopyL0CToGm<ArchTag, ElementAccumulator, CType>L0C→GM
CopyGmToL1BiasCopyGmToL1<ArchTag, ...>Bias GM→L1
CopyL1ToBTCopyL1ToBT<ArchTag, ...>Bias L1→BT

模板原型

template < class ArchTag, // 架构标签 class AType, // A 矩阵 GmType class BType, // B 矩阵 GmType class CType, // C 矩阵 GmType class BiasType // Bias GmType(必选) > struct ConvTileCopy;

调用示例

#include "catlass/gemm/tile/tile_copy.hpp" using namespace Catlass::Gemm; using AType = Gemm::GemmType<half, layout::RowMajor>; using BType = Gemm::GemmType<half, layout::ColumnMajor>; using CType = Gemm::GemmType<half, layout::NDC1HWC0>; using BiasType = Gemm::GemmType<half, layout::VectorLayout>; using TileCopy_ = Tile::ConvTileCopy<Arch::AtlasA2, AType, BType, CType, BiasType>; typename TileCopy_::CopyGmToL1A copyGmToL1A; typename TileCopy_::CopyGmToL1B copyGmToL1B; typename TileCopy_::CopyGmToL1Bias copyGmToL1Bias; typename TileCopy_::CopyL1ToBT copyL1ToBT; typename TileCopy_::CopyL0CToGm copyL0CToGm;

【免费下载链接】catlass本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.zskr.cn/news/1428583.html

相关文章:

  • D3KeyHelper:如何高效使用暗黑3技能连点器提升游戏体验
  • AI 编程工具面试题(Claude Code、Codex 等)基础篇(一)
  • Merkle树性能优化与工程实践
  • 终极指南:深度掌握AMD Ryzen SMU调试工具的专业实战技巧
  • d2s-editor:暗黑破坏神2存档编辑器的技术实现与创新实践
  • CANN/catlass L1到L0A数据搬运模块
  • LLC设计指南(四)第四章 :终于讲到 LLC 的灵魂——为什么 MOS 能实现 ZVS?
  • vue使用笔记、import、export等
  • 3分钟上手:浏览器中免费解锁12种加密音乐格式的完整指南
  • 武汉卖黄金别瞎找!2026年5月三大黄金回收平台实测+避坑指南,这家才是真靠谱 - 资讯纵览
  • 5个技巧:如何用COMET框架实现专业级机器翻译质量评估
  • 2026天津家庭教育指导师报名入口:中山优才教育指南 - 当下教育培训干货
  • ChatGPT营销实战指南:从内容创作到策略辅助的AI效率革命
  • 相机标定三大坐标系新手入门指南
  • 2026证件照制作工具推荐|免费在线、手机软件保姆级教程,手把手教你3步做出合格证件照 - AI测评专家
  • SeaQwen2-0.5B性能评测:HellaSwag和ARC意大利语基准测试结果分析
  • 2026想报考生物医学科学专业在广东有哪个医学学校值得推荐 - 品牌2025
  • 【小白友好教程】2026 最新 OpenClaw 安装步骤 全程可视化操作(包含安装包)
  • 无锡GEO优化公司技术实力排名TOP3:制造业专属服务商深度测评(2026年5月最新) - 商业新知
  • D2RML终极指南:一键解锁暗黑2重制版多开新境界
  • 2026手机拍证件照方法保姆级教程:规范要求一文讲透,手把手教你在家拍 - AI测评专家
  • 爷青回!用三台电脑和家人在Win10上重温《龙之崛起》联机,保姆级避坑指南
  • 北京发电机租赁企业实力梳理 综合运营情况分析 - 资讯纵览
  • 数据工程学习路径全解析:从零到精通的实战指南
  • Docker分布式部署与GB28181/RTSP全协议汇聚:基于源码交付的异构边缘计算AI视频管理平台架构解析
  • 完整指南:如何高效使用Python光学计算库进行光子设计与电磁模拟
  • 郑州市航空港区防水补漏|维小达 专业不拆除补漏、室内防水、屋面防水、厨卫漏水维修一站式服务 - 维小达科技
  • 如何用一款工具彻底改变你的游戏资源编辑体验?
  • 深入Linux内核:图解sendmsg/recvmsg如何玩转分散/聚集I/O与辅助数据
  • 2026报考护理学专业在广东有哪些医学学校值得推荐 - 品牌2025