DeepSeek-V3.2-Exp模型正式发布并开源

MarsBit 快讯 53 阅读 0 评论 0 点赞

火星财经消息，9 月 29 日，DeepSeek-V3.2-Exp 模型正式发布并开源。模型引入稀疏 Attention 架构，这种架构能够有效降低计算资源消耗并提升模型推理效率。目前，该模型已正式上架华为云大模型即服务平台 MaaS，针对 DeepSeek-V3.2-Exp 模型，华为云此次仍沿用大 EP 并行方案部署，基于稀疏 Attention 结构叠加实现长序列亲和的上下文并行策略，并兼顾模型时延和吞吐性能。(金十)