CANN/asc-devkit SetMatmulConfigParams接口 📅 发布时间:2026/7/5 19:15:41 👁️ 浏览次数: SetMatmulConfigParams【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit功能说明在计算Tiling时用于自定义设置表1中的MatmulConfig参数。本接口中配置的参数对应的功能在Tiling与Kernel中需要保持一致所以本接口中的参数取值需要与Kernel侧对应的MatmulConfig参数值保持一致详细MatmulConfig参数请见表2。函数原型void SetMatmulConfigParams(int32_t mmConfigTypeIn 1, bool enableL1CacheUBIn false, ScheduleType scheduleTypeIn ScheduleType::INNER_PRODUCT, MatrixTraverse traverseIn MatrixTraverse::NOSET, bool enVecND2NZIn false)void SetMatmulConfigParams(const MatmulConfigParams configParams)参数说明表1参数说明| 参数名 | 输入/输出 | 描述 | | --- | --- | --- | | mmConfigTypeIn | 输入 | 设置Matmul的模板类型需要与Matmul对象创建的模板一致当前只支持配置为0或1。0代表Norm模板1代表MDL模板默认值为1 | | enableL1CacheUBIn | 输入 | 配置是否开启L1缓存UB计算块推荐开启场景MTE3和MTE2流水串行较多的场景。false不开启L1缓存UB计算块默认值为falsetrue开启L1缓存UB计算块Atlas A3 训练系列产品/Atlas A3 推理系列产品不支持该参数。Atlas A2 训练系列产品/Atlas A2 推理系列产品不支持该参数。Atlas 推理系列产品AI Core支持该参数。Atlas 200I/500 A2 推理产品不支持该参数。 | | scheduleTypeIn | 输入 | 配置Matmul数据搬运模式。参数取值如下ScheduleType::INNER_PRODUCT默认模式在K方向上做MTE1的循环搬运ScheduleType::OUTER_PRODUCT在M或N方向上做MTE1的循环搬运ScheduleType::N_BUFFER_33NBuffer33模板的数据搬运模式MTE2每次搬运A矩阵的1x3个基本块直至A矩阵所有3x3个基本块全载在L1 Buffer中 | | traverseIn | 输入 | Matmul做矩阵运算的循环迭代顺序即一次迭代计算出[baseM, baseN]大小的C矩阵分片后自动偏移到下一次迭代输出的C矩阵位置的偏移顺序。参数取值如下NOSET0当前无效。FIRSTM先往M轴方向偏移再往N轴方向偏移。FIRSTN先往N轴方向偏移再往M轴方向偏移。 | | enVecND2NZIn | 输入 | 是否开启ND2NZ。 | | configParams | 输入 | config相关参数类型为MatmulConfigParams结构体具体定义如下方代码所示。其中的参数说明请参考表2。 |struct MatmulConfigParams { int32_t mmConfigType; bool enableL1CacheUB; ScheduleType scheduleType; MatrixTraverse traverse; bool enVecND2NZ; MatmulConfigParams( int32_t mmConfigTypeIn 1, bool enableL1CacheUBIn false, ScheduleType scheduleTypeIn ScheduleType::INNER_PRODUCT, MatrixTraverse traverseIn MatrixTraverse::NOSET, bool enVecND2NZIn false) { mmConfigType mmConfigTypeIn; enableL1CacheUB enableL1CacheUBIn; scheduleType scheduleTypeIn; traverse traverseIn; enVecND2NZ enVecND2NZIn; } };表2MatmulConfigParams结构体内参数说明| 参数名称 | 含义 | | --- | --- | | mmConfigType | 设置Matmul的模板类型需要与Matmul对象创建的模板一致当前只支持配置为0或1。0代表Norm模板1代表MDL模板默认值为1 | | enableL1CacheUB | 配置是否开启L1缓存UB计算块推荐开启场景MTE3和MTE2流水串行较多的场景。false不开启L1缓存UB计算块默认值为falsetrue开启L1缓存UB计算块 | | scheduleType | 配置Matmul数据搬运模式。参数取值如下ScheduleType::INNER_PRODUCT默认模式在K方向上做MTE1的循环搬运ScheduleType::OUTER_PRODUCT在M或N方向上做MTE1的循环搬运ScheduleType::N_BUFFER_33NBuffer33模板的数据搬运模式MTE2每次搬运A矩阵的1x3个基本块直至A矩阵所有3x3个基本块全载在L1 Buffer中 | | traverse | Matmul做矩阵运算的循环迭代顺序即一次迭代计算出[baseM, baseN]大小的C矩阵分片后自动偏移到下一次迭代输出的C矩阵位置的偏移顺序。参数取值如下NOSET0当前无效。FIRSTM先往M轴方向偏移再往N轴方向偏移。FIRSTN先往N轴方向偏移再往M轴方向偏移。 | | enVecND2NZ | 是否开启ND2NZ |返回值说明无约束说明本接口必须在GetTiling接口前调用。若Matmul对象使用NBuffer33模板策略即MatmulPolicy为NBuffer33MatmulPolicy则在调用GetTiling接口生成Tiling参数前必须通过本接口将scheduleTypeIn参数设置为ScheduleType::N_BUFFER_33以启用NBuffer33模板策略的Tiling生成逻辑。调用示例auto ascendcPlatform platform_ascendc::PlatformAscendC(context-GetPlatformInfo()); matmul_tiling::MatmulApiTiling tiling(ascendcPlatform); tiling.SetAType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetBType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT16); tiling.SetCType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetBiasType(matmul_tiling::TPosition::GM, matmul_tiling::CubeFormat::ND, matmul_tiling::DataType::DT_FLOAT); tiling.SetShape(1024, 1024, 1024); tiling.SetOrgShape(1024, 1024, 1024); tiling.SetBias(true); tiling.SetBufferSpace(-1, -1, -1); tiling.SetMatmulConfigParams(0); // 额外设置 // matmul_tiling::MatmulConfigParams configParams // {1, false, matmul_tiling::ScheduleType::OUTER_PRODUCT, matmul_tiling::MatrixTraverse::FIRSTM}; // tiling.SetMatmulConfigParams(configParams); optiling::TCubeTiling tilingData; int ret tiling.GetTiling(tilingData);【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
MobaXterm中文版:一站式远程终端管理的终极解决方案 MobaXterm中文版:一站式远程终端管理的终极解决方案 【免费下载链接】Mobaxterm-Chinese Mobaxterm simplified Chinese version. Mobaxterm 的简体中文版. 项目地址: https://gitcode.com/gh_mirrors/mo/Mobaxterm-Chinese MobaXterm中文版是一款专为中文用… 2026/7/5 19:13:40
5步玩转NES模拟器FCEUX:从怀旧游戏到专业调试的全面指南 5步玩转NES模拟器FCEUX:从怀旧游戏到专业调试的全面指南 【免费下载链接】fceux FCEUX, a NES Emulator 项目地址: https://gitcode.com/gh_mirrors/fc/fceux FCEUX是一款功能强大的NES模拟器,让你不仅能重温经典红白机游戏,还能深入探… 2026/7/5 19:13:40
鸣潮自动化助手:5步解放双手,轻松实现游戏全自动 鸣潮自动化助手:5步解放双手,轻松实现游戏全自动 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸 一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves 你是否厌倦… 2026/7/5 19:11:40
微信QQ防撤回补丁工具:告别信息丢失的完整解决方案 微信QQ防撤回补丁工具:告别信息丢失的完整解决方案 【免费下载链接】RevokeMsgPatcher :trollface: A hex editor for WeChat/QQ/TIM - PC版微信/QQ/TIM防撤回补丁(我已经看到了,撤回也没用了) 项目地址: https://gitcode.com/G… 2026/7/5 20:42:25
题解:AcWing 797 差分 【题目来源】 AcWing:797 差分 - AcWing题库 【题目描述】 输入一个长度为 n n n 的整数序列。 接下来输入 m m m 个操作,每个操作包含三个整数 l , r , c l,r,c 2026/7/5 20:42:25
题解:AcWing 798 差分矩阵 【题目来源】 AcWing:798 差分矩阵 - AcWing题库 【题目描述】 输入一个 n n n 行 m m m 列的整数矩阵,再输入 q q 2026/7/5 20:42:25
3个战略杠杆:DINOv3视觉AI的企业级部署价值最大化框架 3个战略杠杆:DINOv3视觉AI的企业级部署价值最大化框架 【免费下载链接】dinov3 Reference PyTorch implementation and models for DINOv3 项目地址: https://gitcode.com/GitHub_Trending/di/dinov3 在当今AI驱动的商业环境中,DINOv3作为Meta AI… 2026/7/5 20:38:24
AI游戏辅助技术:从视觉识别到智能操作的完整解决方案 AI游戏辅助技术:从视觉识别到智能操作的完整解决方案 【免费下载链接】AIAssist GameAssist是一个AI游戏助手,结合OpenCv、OpenCvSharp4、ssd_mobilenet_v3等技术,对游戏对象进行识别,支持自动瞄准/自动开枪等功能,提升… 2026/7/5 20:38:24
6个月转型AI工程师:实战路径与核心技能 1. 项目概述:6个月转型AI工程师的可行性路径在2023年大模型技术爆发的背景下,AI工程师岗位需求同比增长217%(LinkedIn数据)。不同于传统算法工程师需要3-5年培养周期,现代AI工程师更侧重工程化落地能力。我在硅谷科技公… 2026/7/5 0:01:32
TPAFE0808与PIC18F87K22的多通道信号采集方案 1. 项目背景与核心需求在工业自动化、医疗设备和科研仪器等领域,多通道信号采集与系统监测是基础且关键的技术需求。传统方案往往面临通道数量不足、信号调理复杂、系统集成度低等问题。TPAFE0808作为一款8通道模拟前端芯片,与PIC18F87K22微控制器的组合… 2026/7/5 0:01:32
STC3115与PIC18LF26K80构建高精度电池管理系统 1. STC3115与PIC18LF26K80在电池管理系统中的核心价值在现代电子设备中,电池管理系统(BMS)的重要性不亚于设备的核心处理器。STC3115作为一款高精度电池电量监测IC,与PIC18LF26K80微控制器的组合,构成了一个既能精确监控又能智能管理的完整解… 2026/7/5 0:05:36
6个月转型AI工程师:实战路径与核心技能 1. 项目概述:6个月转型AI工程师的可行性路径在2023年大模型技术爆发的背景下,AI工程师岗位需求同比增长217%(LinkedIn数据)。不同于传统算法工程师需要3-5年培养周期,现代AI工程师更侧重工程化落地能力。我在硅谷科技公… 2026/7/5 0:01:32
TPAFE0808与PIC18F87K22的多通道信号采集方案 1. 项目背景与核心需求在工业自动化、医疗设备和科研仪器等领域,多通道信号采集与系统监测是基础且关键的技术需求。传统方案往往面临通道数量不足、信号调理复杂、系统集成度低等问题。TPAFE0808作为一款8通道模拟前端芯片,与PIC18F87K22微控制器的组合… 2026/7/5 0:01:32
STC3115与PIC18LF26K80构建高精度电池管理系统 1. STC3115与PIC18LF26K80在电池管理系统中的核心价值在现代电子设备中,电池管理系统(BMS)的重要性不亚于设备的核心处理器。STC3115作为一款高精度电池电量监测IC,与PIC18LF26K80微控制器的组合,构成了一个既能精确监控又能智能管理的完整解… 2026/7/5 0:05:36