ChainCatcher 消息,DeepSeek 今日启动“开源周”,首个开源的代码库为 Flash MLA——针对 Hopper GPU 优化的高效 MLA 解码内核,专为处理可变长度序列而设计。
据介绍,Flash MLA 的灵感来自 FlashAttention 2&3 和 cutlass 项目。