北大与DeepSeek联合开源DSpark框架,高并发下生成速度提升超60%
开心田螺
2026-07-04 08:06:21
6月27日消息,DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率瓶颈。该框架已部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中,相比此前生产环境采用的单token推测解码基线MTP-1,在同等吞吐量水平下可将单用户生成速度提升60%至85%。相关论文、训练代码及模型检查点已在GitHub平台DeepSpec项目中开源。

相关内容

热门资讯

伊朗媒体称有更多船只申请通过霍... 6月27日消息,据伊朗伊斯兰共和国广播电视台27日报道,从当地时间当日早上开始,有更多船只提交通过霍...
2025年人口增长10强城市出... 6月27日消息,随着各地陆续发布去年的常住人口数据,2025年常住人口增量十强城市出炉。前十强为深圳...
中央社会工作部副部长贺志亮被查 6月27日消息,中央社会工作部副部长贺志亮涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察...
北大与DeepSeek联合开源... 6月27日消息,DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高...
中国黄淮海地区首个农业遥感大模... 6月27日消息,中国黄淮海地区首个农业遥感大模型“舜耕·粮安”27日在山东济南发布。“舜耕·粮安”农...