DeepSeek新发布
创始人
2025-09-29 21:45:14

本文来自微信公众号:科创板日报 (ID:chinastarmarket),作者:黄心怡


梁文锋最新动作来了,DeepSeek-V3.2-Exp今天正式发布并开源。


根据DeepSeek官方介绍,这是一个实验性(Experimental)的版本,作为迈向下一代架构的过渡。V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek稀疏注意力(Sparse Attention)机制,旨在对长文本的训练和推理效率进行探索性的优化和验证。


对于此次模型更新,中信建投TMT行业首席分析师武超则评价,DeepSeek-V3.2-Exp“易用性再次大幅提升”。


值得一提的是,除了英伟达CUDA版本外,DeepSeek还开源了TileLang版本GPU算子。


目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。


在缓存命中的情况下,输入价格由0.5元/百万token降低为0.2元。在缓存未命中的情况下,输入价格由4元/百万token减低为2元。输出价格则从12元/百万token大幅降低为3元。



在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。


据介绍,该实验版本代表了DeepSeek对更高效的transformer架构的研究,特别注重提高处理扩展文本序列时的计算效率。


DeepSeek稀疏注意力架构(DSA)首次实现了细粒度(fine-grained)稀疏注意力,在保持几乎相同的模型输出质量的同时,显著提高了长文本训练和推理效率。



为了评估引入稀疏注意力机制的影响,DeepSeek方面特意将DeepSeek-V3.2-Exp的训练配置与V3.1-Terminus进行了对齐。在各个领域的公开基准测试中,DeepSeek-V3.2-Exp的表现与V3.1-Terminus相当。



DeepSeek方面称,在新模型的研究过程中,需要设计和实现很多新的GPU算子。


“我们使用高级语言TileLang进行快速原型开发,以支持更深入的探索。在最后阶段,以TileLang作为精度基线,逐步使用底层语言实现更高效的版本。因此,本次开源的主要算子包含TileLang与CUDA两种版本。我们建议社区在进行研究性实验时,使用基于TileLang的版本以方便调试和快速迭代。”


《科创板日报》了解到,TileLang编程语言是由北京大学计算机学院副研究员杨智团队主导开发的开源AI算子编程语言。在华为全联接大会上,该团队核心成员董宇骐曾介绍,TileLang实现了FlashAttention算子开发,代码量从500+行减少至80行,并保持了与官方版本持平的性能。


除了DeepSeek外,近期阿里通义千问、智谱也都在推进大模型的迭代升级。


在2025云栖大会现场,阿里云接连发布了七款大模型技术产品,覆盖语言、语音、视觉、多模态、代码等模型领域。其中包括了阿里旗舰模型Qwen3-Max正式发布,预训练数据量达36T,总参数超过万亿,在Coding编程能力和Agent工具调用能力上有较大提升。


智谱新模型GLM-4.6将于近日发布,目前已可通过API接口调用。


月之暗面Kimi则发布Agent模式“OK Computer”并开启灰度测试。据官方介绍,“OK Computer”延续“模型即Agent”理念,通过端到端训练Kimi K2模型,进一步提升智能体及工具调用能力。

相关内容

热门资讯

黄金业务毛利率直冲80%!又一... 本报记者 董红艳 北京报道继紫金矿业旗下境外黄金板块赴港上市之后,山金国际黄金股份有限公司(0009...
伍戈:“晴雨表”反映经济吗? ... 伍戈系长江证券首席经济学家、中国首席经济学家论坛理事核心观点:1.道是无晴,却有晴。金融市场往往被视...
优必选订单接到手软,单月股价涨... 记者丨赵云帆编辑丨包芳鸣 (资料图)9月29日,人形机器人上市公司优必选(09880.HK)宣布,公...
罗志恒:如何优化假期制度以提振... 罗志恒、原野(罗志恒系粤开证券首席经济学家、中国首席经济学家论坛理事)摘要时间和收入一样,是居民进行...
“酱油四强”,正在上演生死洗牌... 订阅 快刀财经 ▲ 做您的私人商学院消费升级下的产业逻辑重构。作者:纳食来源:纳食(ID:kuaix...
3年提高262元,企业退休职工... 人均养老金有多少?数据公布了。9月28日,国家统计局发布“十四五”以来社会民生统计报告。报告显示,企...
EA:接受价值550亿美元全资... 2025年9月29日,美国艺电(EA)发布公告称,已经与由沙特公共投资基金(PIF)、银湖资本(Si...
荣耀炮轰vivo营销抄袭,手机... 手机行业的下一站,或许不在营销话术的争抢上,而在那些尚未被发掘的用户痛点中。“录中美拍,这个荣耀20...
王健林和万达“自救”这三年:引... 本文来源:时代周报 作者:张钇璟图片来源:图虫创意近日,“王健林被限制消费”的消息登上热搜。企查查此...
程强:节前市场热情减弱 程强在... 程强系德邦证券研究所所长、首席经济学家、中国首席经济学家论坛理事PART.01市场概览2025年9月...
4600亿大牛股,遭套现近23... 记者丨雷晨 编辑丨巫燕玲9月的A股科技板块正遭遇一场减持冲击。近期,明星股光模块龙头中际旭创(300...
中国资产深夜大涨,阿里巴巴涨超... 北京时间9月29日晚,美股三大指数高开后走势分化。大型科技股普涨,截至22:32,美光科技涨超4%,...
来凯医药:LAE102的I期临... 人民财讯9月29日电,来凯医药9月29日在港交所公告,LAE102针对治疗肥胖症在中国进行的I期多剂...
纯债基金9月业绩遇冷,“固收 ... 临近9月底,债市在最近一个月内继续维持震荡格局,而纯债基金的业绩持续受到影响。截至9月28日,纯债基...
麦科奥特向港交所提交上市申请 据港交所文件,9月29日,陕西麦科奥特医药科技股份有限公司向港交所提交上市申请书,联席保荐人为建银国...
这事闹的,沸沸扬扬 这事闹的,... 图:Simonbailly 最近有个事,闹得沸沸扬扬。 许多众包骑手、电商从业者、主播、博主、 司机...
筹集超3亿港元“还债”背后:百... 中经记者 钟楚涵 孙吉正 上海报道近日,百果园公告,将筹集约3.27亿港元资金,筹集资金的大部分将用...
王健林“限消令”被撤销,谁放了... 万达两年多的自救长跑。作者 | 刘银平编辑丨高远山,付影来源 | 野马财经9月28日,北京金融法院的...
“并购六条”后北交所首单发股购... 9月29日,北京证券交易所(简称“北交所”)召开年内首次并购重组委审核会议,结果公告显示,湖南五新隧...
落袋为安!山东夫妇半卖半送,把... 在A股市场里,上市公司实际控制人的一举一动,往往藏着耐人寻味的信号。有的老板选择坚守,有的则选择落袋...
天价“抚养费”?昔日美妆大鳄离... 2025.09.29本文字数:1166,阅读时长大约2分钟9月29日,丽人丽妆发布公告称,控股股东、...
双节临近,中高端白酒回暖,有经... 红星资本局9月29日消息 国庆、中秋假期临近,红星资本局走访线下商超及白酒经销商发现,中高端白酒销售...
“鸭脖大王”陷入“ST危机” ... 文 | 萧田谁也没有想到,“鸭脖大王”绝味食品的人设会在一夜之间崩塌。几天前,绝味食品公告,称因20...
“旧配料表”引风波,大润发月饼... 红星资本局9月29日消息 近日,有消费者反馈在大润发(沈阳和平店)购买的月饼,其配料表中明确标注含有...
富临精工:拟与宁德时代共同对子... 今日焦点富临精工:拟与宁德时代共同对子公司江西升华增资扩股,预计构成重大资产重组富临精工公告称,为进...
西贝“塌房”了,但供应商新天力... 85%募资用于塑料食品容器扩产。作者|万德福编辑|刘钦文“预制菜争议” 余波未散的西贝门店里,服务员...
商务部新闻发言人就美商务部发布... 新京报讯 据商务部网站消息,商务部新闻发言人就美商务部发布出口管制穿透性规则事答记者问。有记者问:美...
“牛市旗手”大涨,持股还是持币... 还有明天最后一个交易日,就要放小长假了,今天有好几位朋友在问我,要不要在放假前加仓?一开始看到这个问...
当答案失灵,CEO的集体AI焦... 题图|视觉中国AI时代,中国企业家们正在经历前所未有的焦虑。云栖大会期间,虎嗅与阿里云联合举办了一场...
DeepSeek新发布 本文来自微信公众号:科创板日报 (ID:chinastarmarket),作者:黄心怡梁文锋最新动作...