DeepSeek论文登上《自然》封面,创始人梁文锋为通讯作者,R1成首个接受同行评审的大语言模型 deepseek创始人梁文锋毕业论文 deepseek创始人梁文锋谈科技
创始人
2025-09-18 11:15:17

9月18日,梁文锋作为通讯作者,带着DeepSeek-R1的研究,登上最新一期国际顶级期刊《自然》(Nature)封面。

今年1月份,国产大模型公司深度求索(DeepSeek)在预印本平台arxiv公布论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。



图据澎湃新闻

《自然》杂志指出,如此总结DeepSeek-R1带来的进步:如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似,但这对人工智能有极大挑战,需要人工干预来添加标签和注释。

DeepSeek-R1模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。最终它学会了推理——逐步解决问题并揭示这些步骤——更有可能得出正确答案。这使得DeepSeek-R1能够自我验证和自我反思,在给出新问题的答案之前检查其性能,从而提高其在编程和研究生水平科学问题上的表现。


图据澎湃新闻

据悉,DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。

在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了此前关于知识蒸馏的质疑。

DeepSeek明确否认了此前关于其使用OpenAI模型输出进行训练的质疑。在长达64页的同行评审文件中,DeepSeek介绍,DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4生成的结果,但绝非有意而为之,更没有专门的蒸馏环节。

今年1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1引爆AI行业,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAIo1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。

伴随AI大模型行业的日新月异,DeepSeek已经更新出R1以外的新版本,但万众期待的R2尚未面世。此前8月21日DeepSeek正式发布DeepSeek-V3.1,称其为“迈向Agent(智能体)时代的第一步”。

据介绍,V3.1包含三大主要变化。首先,V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式;其次,V3.1具有更高的思考效率,相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;另外,V3.1具有更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

当时,DeepSeek表示,DeepSeek-V3.1使用UE8M0FP8Scale的参数精度。UE8M0FP8是针对即将发布的下一代国产芯片设计。这也表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。相关表态,一度带动国产芯片算力股价迎来飙升。

来源:澎湃新闻(记者 范佳来)、界面新闻

相关内容

热门资讯

锤子科技成老赖,罗永浩为实控人... 2025.09.18本文字数:394,阅读时长大约1分钟中国执行信息公开网显示,近日,锤子科技(成都...
中国创新药企“闯美”,如何预防... 政策冲击下的战略觉醒:风险信号与市场响应2025 年 9 月 6 日,《纽约时报》在题为《白宫拟议生...
“AI驱动+自主可控”双主线驱... 9月18日,半导体板块震荡拉升,瑞芯微(603893.SH)率先涨停,新相微(688593.SH)、...
地产股持续走低 地产股持续走低... 地产股午后持续走低,金地集团、城建发展、新城控股、招商蛇口等多股跌逾3%。(中新经纬APP)
A股逼近3900点,芯片强势爆... 9月18日,A股三大指数早盘低开后震荡拉升,截至13:09,沪指涨0.36%,盘中逼近3900点,深...
老铺黄金的“平替”,要IPO了 前几天,不少网友在网上放出了自己在上海南京西路街头偶遇LVMH集团董事长兼CEO贝尔纳·阿尔诺(Be...
每经数读|TOP50上市房企8... 今年8月,随着北京、上海等一线城市陆续出台楼市新政,积极预期重回市场。 据中指研究院数据,今年1—8...
“中产都买不到但县城人手一件”... 新的minmin已经出现。不久前伪大牌衣物最流行的还是仿冒意大利奢侈品牌miuimiu印上“minm...
替尔泊肽同靶点药物获批临床试验... 新京报贝壳财经讯(记者丁爽)9月18日盘中,智飞生物股价一度涨超6%。前一日晚间,公司发布公告表示,...
京东位列第十, “中国企业50... 文 / 现代物流报记者 朱睿颖 9月15日,中国企业联合会(以下简称:中国企联)、中国企业家协会在...
扎克伯格发布799美元智能眼镜... Meta新眼镜内置显示屏 北京时间9月18日,据CNBC报道,在周三举行的Meta Connect ...
科大智能涨0.37%,成交额7... 来源:新浪证券-红岸工作室 9月17日,科大智能涨0.37%,成交额7.17亿元,换手率8.37%,...
智慧医疗新纪元:快瞳科技如何用... 精准识别,效率飞跃,开启医疗数据处理智能时代 在医疗信息化快速发展的今天,海量医疗单据的处理效率...
“中产都买不到但县城人手一件”... 新的minmin已经出现。不久前伪大牌衣物最流行的还是仿冒意大利奢侈品牌miuimiu印上“minm...
重仓贵州茅台,泰信基金互联网+... 近日,第三方基金评价机构济安金信公布关于2025年第二季度公募基金不予评价的说明,部分基金被剔除评级...
腾讯控股涨超2%,云业务与债券... 来源:港股研究社 港股研究社迅,近日,腾讯控股(00700)股价表现强劲,涨幅超过2%,年内至今股价...
美联储降息25个基点 年内或再... 美国联邦储备委员会17日宣布,将联邦基金利率目标区间下调25个基点到4.00%至4.25%之间,符合...
雀巢动荡未止!CEO才因办公室... 全球最大的食品饮料公司——瑞士巨头雀巢(Nestlé)的治理危机似乎正向更深处发酵。 9月17日,据...
涨疯了!近四年新高! 来源:图虫 今天港股科技股集体爆发,恒生科技指数涨4.22%,创下了2021年11月以来新高。 权重...
刚刚,中国资产爆发!解读来了 ... 中经记者 郝亚娟 夏欣 上海、北京报道截至9月18日早盘收盘,A股三大指数上涨。同日,中国人民银行授...
两套别墅抵偿近500万元!远大... 9月17日晚间,远大智能(002689.SZ)公告,公司与云南省城乡建设投资有限公司宣威分公司(以下...
胖东来大月饼代购价格下降,去年... 红星资本局9月18日消息 今年中秋节临近,红星资本局注意到,去年受消费者喜爱的“胖东来大月饼”代购价...
来自爸爸的关爱!汇川技术实控人... 昔日“岳阳首富”朱兴明总计将约14.5266亿元的股份赠与了女儿朱瀚玥。近日,汇川技术(300124...
白银集团巴西铜金矿项目稳健运营... 本文来源:时代周报APP 作者:唐洛2025年9月,距离白银集团成功收购巴西铜金矿项目已过5个月。这...
股东、险资、社保集体增持银行股... 科技股大热之际,银行板块遭遇连续回调。9月18日,银行股全面下跌,农业银行跌超2%,常熟银行、邮储银...
V观财报|中粮糖业:注射级疫苗... 【V观财报|中粮糖业:注射级疫苗糖生产线已建成】中粮糖业18日举行2025年半年度业绩说明会,董事会...
A股午评:科创50指数创3年多... 沪指早间震荡走强,创业板指探底回升,科创50盘中一度涨超4%创3年多新高。南财金融终端显示,截至早盘...
一波三折的“西伯利亚力量” 9月2日上午,在上合峰会与阅兵之间的空隙,中、俄、蒙三国元首举行了一次重要的会晤。官方稿件里有这样一...
东方电气:拟配售6800万股H... 新京报贝壳财经讯 9月18日,东方电气发布公告称,公司与独家配售代理订立配售协议,据此,独家配售代理...
A股午评:科创50指数创3年多... 沪指早间震荡走强,创业板指探底回升,科创50盘中一度涨超4%创3年多新高。南财金融终端显示,截至早盘...