DeepSeek-R1发布一周年之际曝光新模型「MODEL1」

Binancer

BlockBeats 消息,1 月 21 日,据量子位报道,DeepSeek-R1 发布一周年之际对新模型「MODEL1」进行了曝光。DeepSeek 在 GitHub 更新 FlashMLA 代码,横跨 114 个文件中有 28 处提到 MODEL1,与 V32 作为不同的模型出现。已知 V32 是 DeepSeek-V3.2,MODEL1 很可能是新的架构。代码中的具体差异体现在 KV 缓存布局、稀疏性处理和 FP8 解码方面,在内存优化上有多处不同。

币安交易所(binance)是全球交易量最大的数字货币交易所,拥有超过1.5亿的忠实投资者,本站提供币安交易平台实时网址、币安交易所官网入口及币安相关公告

目录[+]