发布日期:2026-04-18
新浪科技讯 2月26日上昼音书,DeepSeek开源周(OpenSourceWeek)第三日,在晓谕开源MLA解码核FlashMLA以及DeepEP两款代码库后,DeepSeek本日再次晓谕绽开了DeepGEMM代码库。 据DeepSeek方面先容,DeepGEMM是专为任意高效的FP8通用矩阵乘法(GEMMs)而盘算,它同期撑握鄙俚的和巨匠搀杂(MoE)分组的GEMM运算。该库使用CUDA编写,在装配经过中无需编译,通过在运转时使用轻量级即时编译模块来编译统统内核。 现在,DeepGEMM仅...