DeepSeek致谢腾讯技术团队,DeepEP开源通信框架性能显著提升
创始人
2025-05-08 06:29:22

腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。

经测试,优化后的通信框架性能在 RoCE网络环境提升100%,IB 网络环境提升 30%,为企业开展AI大模型训练提供更高效的解决方案。

该技术方案获得了DeepSeek公开致谢,称这是一次“huge speedup”代码贡献。

IT之家注:DeepEP是一个为专家混合(MoE)和专家并行(EP)量身定制的通信库。它提供高吞吐量和低延迟的全对全GPU内核,这些内核也被称为MoE派发和组合。该库还支持低精度运算,包括FP8。

据悉,腾讯星脉网络团队在DeepEP开源后便展开技术攻关,发现两大关键瓶颈:一是对于双端口网卡带宽利用率不足,二是CPU控制面交互存在时延。

在腾讯的技术优化下,DeepEP不仅在RoCE 网络实现性能翻倍,反哺到IB(InfiniBand)网络时更使原有通信效率再提升30%。

目前,该技术已全面开源,并成功应用于腾讯混元大模型等项目的训练推理,在腾讯星脉与H20服务器构建的环境中,这套方案展现出出色的通用性。

来源:IT之家

相关内容

热门资讯

美国北卡罗来纳州一小型飞机坠毁... 当地时间12月18日,美国北卡罗来纳州斯泰茨维尔地区治安官办公室官员称,一架小型私人飞机当日在斯泰茨...
“量子科技第一股”董事长突然去... 来源:每日经济新闻 12月18日晚间,《每日经济新闻》记者从多个渠道获悉,国盾量子董事长吕品已于当...
刚融资超20亿,上海半导体材料... 上汽参投。 作者 | ZeR0 编辑 | 漠影 芯东西12月15日报道,12月11日,证监会官网披露...
“反内卷”推动炼化行业经营改善... 文丨秦佳丽 编辑丨李壮 在“减油增化”的政策指引下,民营石化行业从快速推进规模扩张转向塑造独特的价值...
免签再扩圈 中外人员往来迎新利... 中新社北京12月18日电 题:免签再扩圈 中外人员往来迎新利好 中新社记者 郭超凯 2025年,“C...