yiy wu <[email protected]> writes:

> 1. 完善了rocBLAS-4.1 的 ebuild,修复了若干问题,包括取消生成多余 GPU
> ISA 的 ASM code object、解决了 cmake-3.21 支持 HIP 语言导致的问题、规
> 范 ebuild 书写,并将 rocBLAS-4.1 推入 science overlay,并打下了进入
> ::gentoo 的基础。

> 2. review 了来自 fuga15 的 PR,在本地将 MIOpen bump 到 4.2,根据
> fuga15 的提示去除了对 boost 的版本限制(上游仍仅支持 1.72)

> 3. 结合 fuga15 的 PR,将 pytorch 依赖的各个组件升级到 4.2 并修复了若干
> bug,使之适应 gcc-11 与 glibc-2.33

> 4. 修复目前 broken 的 pytorch-1.9.0::science,并在本地测试了
> pytorch-1.9.0 against rocm-4.2,表现良好。

> 5. 使 rocBLAS 支持 test 与 benchmark,并将 rocblas-test 链接到系统的
> blas 库上。test 的原理是将 rocBLAS 在 GPU 上的运算结果与其它 BLAS 库进
> 行比较,结果一致则 PASS。将 rocBLAS 链接到系统库上,可以使用 eselect
> 来切换不同的 BLAS 库进行比对。RadeonVII 测试结果:对比
> sci-libs/blis-0.6.0,11 项 nightly 测试集 FAIL,对比
> sci-libs/openblas-0.3.17 8 项 pre_checkin FAIL;总共有1513020 被执行,
> 另有 5232 多设备测试集被跳过。另外,还测试了rocBLAS-4.2,新引入含
> 79004 项的 known_bug 测试集, 56052 FAIL。

> 在中期之前(本周末),计划将 rocm-4.2 与 pytorch-1.9.0的 ebuild 提交
> PR 到上游。

加油!期待。

本达

-- 
您收到此邮件是因为您订阅了 Google 网上论坛的“TUNA 主邮件列表”群组。
要退订此群组并停止接收此群组的电子邮件,请发送电子邮件到[email protected]。
要在网络上查看此讨论,请访问 
https://groups.google.com/d/msgid/tuna-general/87tuju3sb1.fsf%40gmail.com。

回复