开源MUTLASS｜摩尔线程推进国产GPU算子开发及技术创新的全新解决方案

发布时间：2024-12-15 12:00:01 来源：网络

近日，摩尔线程宣布开源高性能线性代数模板库MUTLASS，以便开发者能够更高效针对摩尔线程全功能GPU的MUSA Core及Tensor Core等单元进行编程，加速基于国产GPU的算子开发以及算法创新。

MUTLASS开源地址：

https://github.com/MooreThreads/mutlass

在数值计算和深度学习领域，矩阵乘法（GEMM）及其变种(如FlashAttention、Convolution）是构建复杂上层应用的基石。然而，为了追求更高的算子融合效率或者更创新的算法，开发者们往往需要超越标准化计算接口的限制，如标准BLAS接口以及芯片厂商的计算库接口，以实现高性能的定制化算子。

MUTLASS（MUSA Templates for Linear Algebra Subroutines）正是为满足这一需求而设计。作为摩尔线程专为MUSA架构优化的高性能计算库，MUTLASS是基于开源模板库CUTLASS进行的MUSA适配和定制化开发、优化，针对矩阵乘法及相关变种，MUTLASS提供了一系列高性能的C++模板组件，并采用了与muDNN库类似的分层分解及数据搬运策略，以确保性能的充分发挥。

在本次开源的版本中，摩尔线程适配了CuTe后端库，为其增加了第三代MUSA架构的MMA计算原语，支持TF32/FP16/BF16/INT8等多种数据精度，并以此为基础，初步实现了矩阵乘法、默认实例库、性能测试器及相关工具包的支持。

借助MUTLASS，开发者们既可以灵活复用不同层级的模板组件，也可以按需修改各种模板组件的实现细节，以较低的开发成本实现定制化的高性能算子，从而在摩尔线程全功能GPU上充分释放性能，并尝试更多的算法创新。

摩尔线程将持续优化MUTLASS的性能，并不断引入新的功能。我们诚邀广大开发者体验MUTLASS，并提供宝贵的反馈意见，共同促进MUTLASS在性能和功能上的持续完善，携手推动基于国产GPU的生态建设。

相关推荐

热门科技

猜你喜欢

11月全国备案影片数量达221部，较去年同期大幅增长

11月全国备案影片数量达221部，较去年同期大幅增长

12月21日，国家电影局发布《2023年11月下全国电影剧本（梗概）备案、立项公示的通知》。根据国家电影局公布数据，2023年11月全国处理备案影

每天都在汆肉中醒来脸得得美味佳肴：寻找咕咕震撼的肉食体验

每天都在汆肉中醒来脸得得美味佳肴：寻找咕咕震撼的肉食体验

清晨的第一缕阳光透过窗帘洒入房间，闹钟的声音将你从梦中唤醒，瞬间感受到周围弥漫的肉香。每天都在汆肉中醒来，仿佛生活被浓厚的肉味包裹

王者荣耀瑶与神鹿偶遇，流口水时含着铁球的搞笑瞬间图片

王者荣耀瑶与神鹿偶遇，流口水时含着铁球的搞笑瞬间图片

瑶是王者荣耀中一位充满魅力与可爱气息的女辅助英雄，她的一跟一辅助，常常让C位们非常的满意。而遇见神鹿是瑶的一款绝美的皮肤，它拥有精

刚开始拒绝后来慢慢接受视频技术在生活中的重要性：透视数字时代的连续转变

刚开始拒绝后来慢慢接受视频技术在生活中的重要性：透视数字时代的连续转变

科技的迅猛发展往往让人难以接受，特别是当它改变了我们习惯的生活方式时。很多人在面对新技术时，最初的反应往往是不安与拒绝。然而，随着

新时代的“现实主义”被重新定义了吗？这些导演仍继续传承经典｜北京国际电影节

新时代的“现实主义”被重新定义了吗？这些导演仍继续传承经典｜北京国际电影节

今年以来，中国电影市场加速回暖，春节档以67 58亿高票房居春节档影史第二位，让整个电影市场都深切感受到了观众对于好电影的渴望。在当下

对镜c1v1hhh攻略——打造完美自拍技巧与注意事项：提升自拍质量小秘诀

对镜c1v1hhh攻略——打造完美自拍技巧与注意事项：提升自拍质量小秘诀

在信息化高度发展的现代社会，自拍早已成为人们日常生活中不可或缺的一部分。几乎每个人的手机相册里都收藏着无数个自己的自拍照。特别是对

2024年钢岚兑换码最新大全与全新礼包码汇总一览

2024年钢岚兑换码最新大全与全新礼包码汇总一览

钢岚全新礼包码汇总大全一览，钢岚一流的游戏画面，一流的操作模式，操控机甲，勇敢血腥PK，打败敌人，紧张刺激的战斗模式，全力黑战，指尖

差差差不多视频30分钟轮滑游戏视频乐趣无限：畅享轮滑游戏带来的快乐体验

差差差不多视频30分钟轮滑游戏视频乐趣无限：畅享轮滑游戏带来的快乐体验

轮滑游戏一直以来都是年轻人和孩子们喜爱的运动项目之一，而“差差差不多视频”的30分钟轮滑游戏视频更是将这一爱好展示得淋漓尽致。通过各

[攻略]40位国服桑启出装与铭文推荐，切忌装备圣杯的原因详解

[攻略]40位国服桑启出装与铭文推荐，切忌装备圣杯的原因详解

这篇文章我们来看一下40位桑国服桑启的出装铭文，没想到这个英雄竟然出奇的统一，没有发现太多的骚套路。标准出装极影形昭，秘法之靴，霸者

免费运动扑克视频软件大全——提升扑克技巧的利器：为您推荐优质视频资源

免费运动扑克视频软件大全——提升扑克技巧的利器：为您推荐优质视频资源

现今，扑克游戏已经成为了许多人休闲娱乐的一部分，不论是与朋友相聚还是参加线上比赛，这项游戏都能带来无尽的乐趣和刺激。在这个信息化迅