中文版 | English
MindSpore 自定义算子扩展(ms_custom_ops),是依托 MindSpore 原生的自定义算子与自定义 pass 能力构建而成的独立算子扩展插件包。其核心定位在于为大模型等前沿 AI 领域模型,提供关键的高性能算子支撑,助力模型突破计算效率瓶颈;在算子接入上,该插件包具备极强的灵活度,可全面覆盖各类第三方算子库、AscendC 算子、Triton DSL 等多种技术路径的算子类型,充分满足不同研发场景下的算子集成需求,为 AI 模型的高效迭代提供底层保障。
ms_custom_ops/
├── CMakeLists.txt # CMake构建配置
├── README.md # 项目文档
├── README_EN.md # 英文项目文档
├── OWNERS # 项目维护者
├── LICENSE # 开源许可证
├── requirements.txt # Python依赖
├── setup.py # Python包配置
├── version.txt # 版本信息
├── 3rdparty/ # 第三方依赖
├── cmake/ # CMake构建脚本
├── docs/ # 文档资源
├── ops/ # 自定义算子kernel源码与接入代码
│ ├── ascendc/ # AscendC算子实现以及对接代码
│ ├── c_api/ # 以预封装的API调用方式对接的算子
│ ├── framework/ # 算子对接公共代码
│ └── dsl/ # DSL(Domain Specific Language)算子源码
├── pass/ # 自定义融合pass
├── prebuild/ # 预编译的二进制库
├── python/ # Python绑定和扩展
├── scripts/ # 构建和工具脚本
└── tests/ # 测试用例
- Python: >= 3.9
- MindSpore: >= 2.7.1
- 华为昇腾软件: CANN toolkit >= 8.3.RC1
- 编译器: GCC 7.3 或更高版本
- CMake: 3.16 或更高版本
- Ninja: 1.11 或更高版本
-
安装华为昇腾CANN工具包: 从华为昇腾官网下载并安装CANN工具包
-
设置昇腾环境:
export ASCEND_HOME_PATH=${YOUR_INSTALL_PATH}$/ascend-toolkit/latest source ${ASCEND_HOME_PATH}/../set_env.sh
-
安装MindSpore: 从MindSpore官网获取下载并安装
-
克隆仓库:
git clone https://gitee.com/mindspore/ms-custom-ops.git cd ms_custom_ops -
安装Python依赖:
pip install -r requirements.txt
-
使用 build.sh 脚本(推荐):
# 查看编译选项 bash scripts/build.sh -h # 默认编译(Release模式) bash scripts/build.sh # Debug编译 bash scripts/build.sh -d # 强制重新编译 bash scripts/build.sh -c
编译完成后,安装生成的wheel包:
pip install dist/*.whl -
使用 setup.py 安装
# 安装(会自动编译自定义算子) python setup.py install # 或者构建wheel包 python setup.py bdist_wheel
安装后,您可以在MindSpore代码中使用自定义算子:
import mindspore as ms
import ms_custom_ops
# 自定义算子的使用示例(实际API可能有所不同)
# result = ms_custom_ops.some_custom_operation(input_tensor)您可以注册和使用自定义融合Pass来优化图执行:
import mindspore as ms
import ms_custom_ops
# 注册自定义Pass
ms_custom_ops.register_custom_pass("AddRmsNormFusionPass", backend="ascend")
ms_custom_ops.register_custom_pass("ReplaceAddNFusionPass", backend="cpu")
# 配置MindSpore上下文
ms.context.set_context(mode=ms.GRAPH_MODE, device_target="Ascend")
# 您的网络将自动应用注册的Pass优化详细的Pass机制、架构设计和开发指南请参考:Pass自动注册机制文档
- 算子列表
- Pass自动注册机制详解 - 详细介绍Pass架构、开发流程和最佳实践
- 算子接入指导
我们欢迎对此项目的贡献。请参阅CONTRIBUTING.md文件了解如何贡献的指南。 我们欢迎并重视任何形式的贡献与合作,请通过Issue来告知我们您遇到的任何Bug,或提交您的特性需求、改进建议、技术方案。
