ChainCatcher 消息,DeepSeek 今日啟動"開源週",首個開源的代碼庫為 Flash MLA------針對 Hopper GPU 優化的高效 MLA 解碼內核,專為處理可變長度序列而設計。
據介紹,Flash MLA 的靈感來自 FlashAttention 2\&3 和 cutlass 項目。