从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点 鍗庝负tps2500-12d 鍗庝负tps2500
创始人
2025-08-28 10:04:19

2025年8月27日,在第四届828 B2B企业节开幕式上,华为云宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,单芯片最高可实现2400TPS、50msTPOT的超高吞吐、低时延的性能,超过业界水平。

发挥“大杂烩”优势,以系统能力打造先进算力

过去18个月,中国AI算力需求呈现指数级增长。数据显示,2024年初中国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已突破30万亿,1年半的时间增长了300多倍反映了我国人工智能应用规模快速增长,也对算力基础设施的需求提出了更大的挑战。

在以往按卡时计费的基础上,今年3月,华为云正式推出了基于MaaS的Tokens服务。针对不同应用、不同场景的性能和时延要求,还提供了在线版、进线版、离线版乃至尊享版等多种服务规格,为大模型、Agent智能体等AI工具提供了更为灵活、便捷、低成本的先进算力。

而这一次,华为云的Tokens服务正式接入CloudMatrix384,并通过384原生的xDeepServe框架再次实现了吞吐量的突破,从年初的1920TPS提升至2400TPS,TPOT仅为50ms。



大算力的构建不是单点突破,而是一个从硬件到软件、从算子到存储、从推理框架到超节点的全栈创新,充分依托了华为的“大杂烩”能力。

首先,CloudMatrix384 超节点以全新的计算架构创新,突破性能瓶颈,构筑稳固澎湃的算力根基; CANN昇腾硬件使能,优化算子与高效通信策略,让云端的算力能够以最高效的方式被调用和组合;EMS弹性内存存储打破AI内存墙,突破性地实现“以存强算”, 彻底释放了每一颗芯片的算力;xDeepServe 分布式推理框架则以极致分离架构Transfomerless让超节点释放出更高效算力。

“拆掉”Transformer,xDeepServe全面激发算力潜能

作为CloudMatrix384 超节点的原生服务,xDeepServe以Transformerless 的极致分离架构,把MoE大模型拆成可独立伸缩的 Attention、FFN、Expert三个微模块,相当于在一台CloudMatrix384上把“大模型”拆成“积木”,并分派到不同的NPU上同步处理任务。之后,再用基于内存语义的微秒级XCCL通信库与FlowServe 自研推理引擎把它们重新拼成一个超高吞吐的LLM服务平台,即Tokens的“超高速流水线”。通过xDeepServe不断调优,最终实现了从非超节点单卡吞吐600tokens/s至超节点单卡吞吐2400tokens/s的提升。

作为硬件加速计算的中间层,CANN包含多个算子库和和XCCL这种高性能通信库等组件,共同支撑AI模型的高效运行。其中,XCCL作为专为超节点上的大语言模型(LLM)服务而量身打造的高性能通信库,能够充分发挥CloudMatrix384扩展后的UB互联架构(UB fabric)的全部潜力,为 Transformerless的全面分离奠定了带宽与时延双重硬底座。

而作为被重构的“去中心”式分布式引擎,FlowServe把CloudMatrix384 切成完全自治的 DP 小组,每个小组自带 Tokenizer、执行器、RTC 缓存与网络栈,完全自给自足,做到千卡并发也不“拥堵”。

目前,xDeepServe已实现MA分离,而下一步,将把Attention、MoE、Decode全部改成自由流动的数据流,并把同样的拼图方法复制到多台超节点,让推理吞吐像铺轨一样线性延伸,最终或将视线吞吐量的更大突破,让每块 NPU 都高效运作,芯片永不排队,推理永不塞车。

聚焦主流大模型,不断提升模型性能

目前,华为云MaaS服务已支持DeepSeek、Kimi、Qwen、Pangu、SDXL、Wan等主流大模型及versatile、Dify、扣子等主流Agent平台。

华为云积累了大量模型性能优化、效果调优的技术和能力,从而实现“源于开源,高于开源”,让更多大模型可以在昇腾云上跑得更快更好。以文生图大模型来说,在轻微损失画质的情况下,通过Int8量化、旋转位置编码融合算子等方式,在在华为云MaaS平台实现了2倍于业界主流平台的出图速度,最大尺寸支持2K×2K。而在文生视频大模型上,不仅通过量化方式来提速,还通过通算并行等方式,降低延迟与显存占用,大幅提升视频生成速度,相较于友商实现了3.5倍的性能提升。华为云Tokens服务在性能、模型适配、效果调优方面的基础,也让更多企业能够快速开发和构建AI Agent。

而在应用层,华为云已与超过100家伙伴携手深入行业场景,共建丰富的Agent,在调研分析、内容创作、智慧办公、智能运维等领域解决产业难题,让企业更便捷地拥抱AI创新,加速智能化。

如基于MaaS平台推出的今日人才数智员工解决方案,集成了先进的自然语言处理、机器学习和深度学习技术,能实现与用户的智能交互和任务处理,显著提升服务效率与客户满意度;而北京方寸无忧科技开发的无忧智慧公文解决方案可以提升公文处理效能,实现政企办公智能化转型。

以Token为动力的智能社会已经到来,而华为云将以系统级创新能力和全新的Tokens服务构筑先进算力,助力各行各业加速落地AI。

相关内容

热门资讯

中东财团,投了普洛斯100亿 本文来自微信公众号:投资界 (ID:pedaily2012),作者:周佳丽报道I投资界PEdaily...
A股V型反弹,科创50涨超7%... 红星资本局8月28日消息,今日A股市场午后V型反弹,截至收盘,沪指涨1.14%,深证成指涨2.25%...
寒武纪登顶A股背后:陈天石如何...   英伟达市值一夜蒸发1300亿美元,数据中心收入不及预期。当英伟达遭遇滑铁卢时,同为AI芯片领域的...
华金资本上半年营收2.34亿元... 8月28日,A股投资管理公司珠海华金资本股份有限公司(简称华金资本,代码000532)发布2025年...
蒙牛乳业上半年营收下滑6.9%... 奶粉业务贡献4%收入,能否补齐短板?作者 | 于婞编辑丨高岩来源 | 野马财经蒙牛乳业(2319.H...
V观财报|贵州燃气上半年净利润... 【V观财报|贵州燃气上半年净利润同比降近42%】贵州燃气28日盘后发布的财报显示,2025年上半年,...
日元一路涨,住宿按人收税,去日... 外国游客太多了,日本开征住宿税。据央视新闻报道,目前,日本不少地方政府已开始或计划向酒店和传统旅馆征...
“豪门梦碎”王艳带货狂揽300... 靠山山会倒,靠人人会跑,只有靠自己。自从2019年“复出”以来,关于王艳因豪门没落需要挣钱养家的讨论...
温氏股份上半年营收近500亿,... 本文来源:时代周报 作者:闫晓寒上半年,生猪、肉鸡价格均呈现下跌态势,温氏股份(300498.SZ)...
一个吴彦祖还不够! 高途二季度... 近日,高途集团(NYSE:GOTU)发布2025年第二季度财务报告。本季度,高途营收约13.9亿元,...
深度揭秘致诚卓远:不追风口,深... 编者按通常,投资者在了解私募时,会关注公司团队水平、策略运作、中长期业绩、风险控制等内容,为此,私募...
中国民营企业500强最新排名出... 微成都报道8月28日,全国工商联发布“2025中国民营企业500强”。微成都注意到,四川共有11家民...
中金公司助力佳鑫国际资源在中国... 8月28日,佳鑫国际资源投资有限公司正式在香港联交所主板、哈萨克斯坦阿斯塔纳国际交易所(AIX)“一...
“股王”不再是茅台,意味着什么... A股市场连续两天迎来“历史”。8月28日开盘,寒武纪的股价一路上扬,截至收盘上涨15.73%,二度超...
山东长裕集团有点“拧巴”:不想... 历史是沿革,而沿革可以是包袱,也可以是辉煌印记。来自山东淄博的长裕控股集团股份有限公司(下称长裕集团...
退市不免责,中程退索赔股民征集... 2025年7月21日,青岛中资中程集团股份有限公司(以下简称“公司”)发布《关于公司股票终止上市暨摘...
中国人民保险集团发布2025年... 2025年8月28日,北京——中国人民保险集团股份有限公司(“中国人民保险集团”或“本集团”、“集团...
低基数带来19倍利润增速,北方... 21世纪经济报道记者董鹏8月28日,北方稀土再次大涨5%,公司总市值重返2000亿元,逼近2021年...
预计下半年增长提速 迈瑞医疗年... 8月27日晚间,迈瑞医疗(300760.SZ)披露了2025年半年报。今年上半年,公司实现营业收入1...
贵阳银行招标结果:2025年度... 证券之星消息,根据天眼查APP-财产线索数据整理,贵阳银行股份有限公司8月25日发布《2025年度贵...
寒武纪站上1500元,科创芯片... 截至2025年8月28日 14:49,上证科创板芯片指数(000685)强势上涨6.94%,成分股中...
华为董事:国产算力基本能解决美... (文/观察者网 吕栋 编辑/张广凯) “像以华为为龙头的硬件公司,在算力上应该已经能基本解决美国对...
人福医药上半年净利润小幅提升,... 在历经两年归母净利润下滑后,易主央企的麻醉药龙头人福医药(600079.SH)终于在2025年上半年...
两大利好!A股深v反转,AI算... 今天A股盘中一度大跳水,差点重演昨天的戏码,但买盘太过强大,盘中走了个深v,海外算力和国产算力大高潮...
航天彩虹突遭“风雨”,业绩下滑... 21世纪经济报道记者雷晨在国际冲突持续与全球军费开支高企的背景下,军用无人机需求显著增长,行业迎来新...
V观财报|富维股份:获27亿元... 【V观财报|富维股份:获27亿元合资品牌客户内饰项目定点】富维股份28日盘后公告,公司收到某知名合资...
V观财报|凌志软件上半年净利润... 【V观财报|凌志软件上半年净利润同比增超10倍】凌志软件28日盘后发布的财报显示,公司上半年实现营业...
A股迎来本轮牛市的首次急跌 真... 来源:郭一鸣- 昨日A股市场大跌,这是此轮牛市以来的首次急跌。有关下跌,市场流传着两句话: 1、牛市...
“股民人均挣786万!”中国又... A股光模块龙头——天孚通信(300394.SZ),股价爆发!8月28日,天孚通信强势“20CM”涨停...
股价跌超4%!老铺黄金股份激励... 图片来源:界面图库 8月28日,老铺黄金(06181.HK)低开低走,截至界面新闻发稿,公司跌4.1...