9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。
该版本作为迈向下一代架构的重要中间步骤,在 V3.1-Terminus 的基础上引入了团队自研的 DeepSeek Sparse Attention (DSA) 稀疏注意力机制,旨在对长文本的训练和推理效率进行探索性优化与验证。这种架构能够降低计算资源消耗并提升模型推理效率。
目前,华为云已完成对 DeepSeek-V3.2-Exp模型的适配工作,最大可支持160K长序列上下文长度。
随着新模型服务成本的显著降低,DeepSeek 同步采取了重磅举措:大幅下调官方 API 价格,降价幅度超过 50%,新价格已即刻生效。目前,官方 App、网页端和小程序均已同步更新至 DeepSeek-V3.2-Exp 版本。
每日经济新闻综合公开消息
上一篇:钠电池产业化预期升温,业内人士:预计2026年钠电池进入规模应用阶段 钠电池未来发展趋势 钠电池大规模量产进展
下一篇:17系列出货不及预期?小米股价两日重挫10% 公司回应:没有削减订单计划 小米17系列市场反应 17系列销量下降原因