算力、算法双重变革?九章云极CEO方磊:GPU云将成AI基础设施新火种 涔濈珷浜戞瀬鏂圭鐜扮姸 涔濈珷浜戞瀬绉戞妧鏈夐檺鍏徃鏂圭
创始人
2025-06-16 17:22:11

本文来源:时代周报 作者:申谨睿

AI新云(也称GPU云、智算云)是全球 AI 基础设施当下变革的注脚。

过去一年,生成式AI及大语言模型集成企业应用加速生长,市场对训练 AI 模型的 GPU 专用计算需求激增。为满足该需求,GPU专用云服务平台不断涌现,这些云服务平台被称为 AI 新云( NeoCloud)。


(九章云极CEO方磊 受访者供图)

与提供广泛通用服务的传统通算云服务商不同,NeoCloud 专注为 AI 工作负载提供高性能基础架构。据Business Research预测,全球GPU专用云市场规模将由2024年的31.7亿美元快速增长至2033年472.4亿美元,增长近15倍,复合增长率约为35%。


(数据来源:Business Research)

为在这一蓝海中掌握先发优势,海内外企业皆摩拳擦掌。

今年3月,被业内称作“英伟达亲儿子”的AI基础设施企业CoreWeave上市,这家依托英伟达GPU资源冲击新云市场的创企,市值在IPO后的两个月从230亿美元飙升至720亿美元。与CoreWeave颇为类似,另一家海外AI基础设施企业Crusoe也凭借其掌握的GPU资源成功转型云服务商。

在这场AI算力淘金热中,中国同样参与者众多,其中不乏云服务商、利用云服务拓展业务的AI基础设施企业。

今年第二季度,这些冲击AI新云计算的公司先后发布了自己的AI基础设施服务。如CoreWeave推出基于英伟达GB200的全新架构;阿里云基于 PAI-DLC 云原生分布式深度学习训练平台推出了 FlashMoE,九章云极从AI计算底层革新出发,推出了基于Serverless+RL强化学习技术架构的九章智算云Alaya NeW Cloud。

“相比海外企业以资本驱动实现规模化,中国AI新云更关注迭代速度、总体拥有成本等务实客户价值。”近日,九章云极CEO方磊在接受时代周报记者专访时表示,资本市场对以CoreWeave为代表的资源型企业的考察重点并非技术,而是其凭借卖资源打下的市场规模。相比而言,中国企业更关注技术本身的“用处”——业务范围既涵盖售卖资源,也包括应用在各种场景中的AI工具。他认为,这样的模式有助于维系长尾客户,而长尾客户往往是企业稳健发展的关键要素。

九章云极DataCanvas于2013年成立,是国内AI基础设施的头部企业。此前,九章云极提出“一度算力包”概念,希望解决行业中算力结构性错配、服务非标准化、用户需求难以预测等问题。

方磊是清华电子工程系毕业的博士,虽技术出身,但对商业的见解十分“接地气”。他表示,商业的本质是“卖货”,在交易与合作中,要理解货物本身的价值,也要清楚其边界,同时看到客户企业的能动性和创造力。

“涉足AI新云业务的公司把所能提供的价值点押注在算力层而非工具链上,更有利于公司行稳致远。”方磊向时代周报记者解释道,GPU一旦“云化”,其规模和技术门槛会迅速提升。规模将会和电力一样巨大。就像微软从操作系统的软件公司涉足Office,GPU云企业也会克服算力、算法变迁带来的难题,在多元的生态位上找到自己的角色。

算力:CPU云向GPU云的历史性迁移

市场为什么会大力呼唤GPU专用云?

方磊表示, 传统云架构的局限性逐渐凸显。传统CPU 云基于虚拟化技术的资源切片模式,主要针对互联网时代带宽密集型应用设计。但 AI 工作负载以计算密集型处理为核心,需要大规模并行计算能力,这与CPU的串行处理特性形成了根本性矛盾。

简而言之,CPU的技术架构在训练和推理大型AI模型方面不够高效。那么,AI时代需要怎样的硬件设施?

方磊向时代周报记者拆解道,硬件方面,GPU性能更强,资源利用方式更“聪明”。如英伟达最新的 H200 GPU 内存带宽达 4.8TB/s,约为传统 CPU 系统( 50GB/s) 的近百倍,在深度学习训练中,性能可提升 10-100 倍。同时,Multi-Instance GPU(MIG)技术能将单个 GPU 分割为最多7 个独立实例,即不同“GPU分身”可以同时工作,互不干扰,便于下游企业更灵活地分配计算资源,实现 GPU 的精细化管理。

硬件迭代如同给AI研发装上了"涡轮增压",在带来高效计算的同时,也为业内玩家的商业模式带来与传统巨头同台竞技的底气。时代周报记者注意到,在传统 CPU 通算云向 GPU 智算云的架构迁移的过程中,传统云巨头面临了新势力的挑战——AWS、Google Cloud、Azure等企业虽推出 GPU 实例,但在定价和性能优化上未能即时适应新的市场需求。

“一个数据中心,如果同时兼顾CPU和GPU的需求,就会变成‘四不像’。”方磊解释称,一方面,如果数据中心仅运行GPU,要比同时运行GPU和CPU的成本低廉。据市场信息,如亚马逊的GPU租赁价格为12美元/卡时,CoreWeave的价格则为6美元/卡时;另一方面,假如一个计算中心不是单纯为GPU高度优化的,也会影响GPU的性能。”

相较传统云厂商“大象难起舞”,专用GPU云企业的成本与商业模式更显“普适性”。如CoreWeave 的 GPU 实例定价,相比传统云提供商有 50%-80% 的成本优势;九章云极智算云Alaya NeW Cloud的定价策略则抛去了传统裸金属租赁方式,提出“一度算力”按量计费模式,降低算力使用门槛,提升算力使用的灵活性。

从 CPU 云到 GPU 云的迁移,不仅是技术升级,更是计算范式从通用向专用的根本转变,这种转变正重塑着整个云计算产业的竞争格局。

算法:深度学习向强化学习跃迁

算法层面的变革也在影响底层算力的跃迁。当前,AI 算法正从数据驱动的深度学习向经验学习转变,这一新的模型训练方式,对GPU专用云的效率提出了新要求。

“用于训练大模型的高质量数据量接近天花板,难再有指数级增长。这一限制促使研究者转向强化学习,通过模型与环境交互生成训练数据,以经验反馈突破数据稀缺瓶颈,增强模型的推理能力。”方磊告诉时代周报记者,算法范式的变化会产生新的算力缺口。原因在于,强化学习的多模型架构大幅增加了训练资源需求。以 70B 参数模型为例,RLHF 阶段约需 48 个 A100 GPU 同时工作,计算需求比传统深度学习增加 1-2 个数量级。

"这一数据的判断与英伟达计算芯片迭代的实际节奏高度吻合——与‘B系列’芯片相比,其‘R系列’芯片的推理性能实现了十倍乃至百倍的提高。”方磊补充道。

如何提升GPU专用云的效率以应对算法的变革?不妨从云计算的发展史中汲取经验。

近20年,云计算产业的发展出现了三个分水岭。一是以虚拟化为主要技术支撑的云计算正式登上历史舞台,应对高速扩张的移动互联网以及流媒体萌芽所带来的爆炸式计算需求;二是池化技术的变革,通过规模化的调度、编排,形成了超大规模的计算和存储资源池,继而形成亚马逊云、微软云、阿里云三强鼎立的格局;三是阿里云创新性地推出CIPU(云基础设施处理器)架构方式,该架构不仅能在数据中心内发挥效用,也能和系统内的软硬件深度适配,当计算资源、存储资源、网络资源接入CIPU后,就会被云化为虚拟算力进行调度编排,兼顾零损耗与高性能。

前两次浪潮,使得CPU为核心的传统X86架构替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求,但他们的本质都是通过软件的优化,将越来越多的计算节点连接组合对外提供服务。时至第三次变革,软件的迭代已不足以应对当时的市场需求,架构的创新成为云厂商换道超车的新思路。

同样地,于GPU专用云而言,“软硬一体化”的创新架构是应对当前算法变化的抓手。方磊告诉时代周报记者,九章智算云从底层技术架构出发,推动由虚拟技术向Serverless(无服务)+RL(Reinforcement Learning,强化学习)为主导的架构演变,支撑AI部署从“配置机器”转向“提交任务”,从而提高高密度算力需求下的GPU资源的利用率。

Serverless+RL的核心是将传统后端服务拆解为更细粒度的函数或服务单元,由云平台自动管理资源、运维和扩展。就如解决饱腹问题,需求方原本需要建厨房、买食材甚至雇厨师,而现在只需要在外卖平台下单即可。

“在CPU云时代,虚拟化技术通过切片资源让用户使用;GPU云时代,Serverless技术可以让用户更聚焦应用而非花太多代价去关注底层优化。让GPU云的提供者更关注如何做好AI优化、高密集AI计算等,让企业低成本实现他们的目标。”

“与自动驾驶的AI训练系统类似,得益于Serverless 架构,九章云极AI新云平台DataCanvas Alaya NeW Cloud能自动完成环境配置、策略加载与任务监控,在强化学习训练中的端到端性能提升5倍。同时,Alaya-UI智能体采样速率提升5-10倍,GPU利用率提升2倍。”方磊认为,Serverless会成为GPU云的主要技术趋势。

(九章云极智能计算论坛 受访者供图)

中美AI新云分野

在AI云服务的竞逐中,中美两国走出了截然不同的发展路径。

美国AI云市场呈现出典型的资本集聚特征。CoreWeave通过与英伟达的深度合作,凭借数百亿美元的基础设施投入,构建起50-80%的成本优势;同样采用资本密集策略的Lambda Labs,则以每小时2.49美元的H100 GPU租赁价格快速占领学术市场。

不过,上述两家企业的客户集中度较高,如CoreWeave超过60%的收入来自微软单一大客户。这种商业结构虽能保证短期收入快速增长,却也暗藏一定业务风险。

中国企业则倾向于通过技术破局、围绕客户需求提供服务方案寻求增长。“我们优化后的GPU利用率可以超过95%,这个数字比很多客户自己优化的结果还要高,而行业平均GPU利用率通常为70%左右。”

此外,中美AI云企业的市场定位也存在差异。美国的资本驱动模式聚焦大型企业客户,而中国的技术驱动模式则将目光投向长尾市场。在生态建设理念方面,前者追求规模与效率,后者更强调普惠与可持续发展。

方磊认为,数百万企业、数千万个人开发者,都亟需弹性且高性价比的GPU云服务。他坦言,目前中国智能算力的短缺主要呈现结构性错配的特征。“如某厂商在某一地区设立了万卡集群,但当地的智能算力需求方可能需要在外地寻找服务器租用。目前公开市场上,大量AI计算芯片要么掌握在头部互联网厂商手中,要么以服务器(裸金属)的形式出租,市场化的、面向大众的、普惠的智能算力非常稀缺。”

谈及发展目标,方磊表示,九章云极希望成为中国NeoCloud的定义者,"此前我们定义了'一度算力',未来希望探索出具备中国特色的AIDC运营模式”。他称,DeepSeek-R1的问世已表明,低成本投入能博取优质的模型能力。这也意味着,能否为数千万开发者提供普惠算力服务,将成为决定AI云企业竞争力的重要考核维度。

相关内容

热门资讯

剑指“开药难、跑腿远”!乌海市... 转自:草原云 6月16日,记者从乌海市海勃湾区卫健委获悉,由海勃湾区中医医院牵头实施的紧密型城市医疗...
积极引导创新资本向科技创新 与... 大力推动科创板改革落地见效 苑多然说,在服务新质生产力发展的新征程中,上交所股票市场为科技创新与产业...
城市会思考、工厂自进化、物流天... 大象新闻记者 李莉 张迪驰 在鹤壁市华夏南路,樱花造型的智慧灯杆静静矗立,广播音柱正提醒违停车辆驶离...
46名员工干出2亿利润,if椰... 两个月前,if椰子水母公司IFBH Limited(下称“IFBH”)向港交所递交了招股书,中信证券...
百利天恒,千亿创新药“黑马”如... 文 / 三生来源 / 节点财经十年之前的2015年,是中国创新药产业发展的一个里程碑。彼时开启的药品...
美股全线飘红,中国资产爆发!A... 6月16日,美股三大指数高开,截至22:50,涨幅扩大,纳斯达克指数涨1.51%,道琼斯指数涨1.1...
上交所组织沪市优质上市公司代表... 中经实习记者 孙汝祥 记者 夏欣 北京报道近日,上交所组织沪市优质上市公司代表赴英国伦敦和瑞士日内瓦...
广汽埃安:生产经营正常,员工股... 新京报贝壳财经讯(记者张冰)6月16日,广汽埃安发布声明称,作为广汽旗下核心自主品牌,广汽埃安的发展...
澳华人区4居室引买家激烈争夺!... 《时代报》6月16日报道,在墨尔本华人区Glen Waverley,一套自1987年以来由同 一家族...
华尔街日报:供应链“武器化”时... 《华尔街日报》6月14日报道:本周早些时候,美国和中国结束了对峙,焦点就是超级大国角力中最强大的新工...
核心抵债资产价值缩水、子公司净... 一份年报问询函的回复内容,详细披露了方正证券(601901.SH)近年来金融资产投资、股票质押等业务...
彩电市场“618”期间量额齐增... 正值一年一度的“618”促销期,家电市场消费势头一片向好。其中,彩电市场在“618”期间实现了强势增...
首单落地!中科创星成为全国首个... 6月16日,中科创星科技投资有限公司(简称“中科创星”)在中国银行间债券市场成功发行“2025年度第...
中美投资对比:美在华有7万家企... 受贸易战影响,大洋彼岸的美国民众因缺乏中国出口的日用百货而苦不堪言。 而在中国,大家却在期待着苹果的...
“耗不起”的补贴 “高息高返”... 近期,监管部门叫停多地汽车金融“高息高返”业务。这一曾被银行和经销商视为“双赢”的营销模式,在实际操...
福布斯发布:2025全球企业2... 2025年上榜的2000家公司合计实现年收入52.9万亿美元、利润4.9万亿美元、资产242.2万亿...
上交所赴欧洲举办推介交流活动,... 近日,上海证券交易所(简称“上交所”)组织沪市优质上市公司代表赴英国伦敦和瑞士日内瓦,开展资本市场推...
海伦哲:美通公司减持2.12%... 新京报贝壳财经讯 6月16日,海伦哲公告,持股5%以上的股东MEI TUNG(CHINA)LIMIT...
广汽埃安回应,员工认购股权争议... 2025年6月16日晚,广汽埃安新能源汽车股份有限公司发布声明表示,“近期,广汽埃安监测到网络上有部...
高盛:“中国民企十杰”崛起,全... 高盛提出,对标美股“七巨头”,中国有自己的“中国民企十杰”。6月15日,高盛首席中国股票策略师刘劲津...
业绩决定费率!嘉实基金这只混合... 作者 |钱锋来源 | 独角金融自近期《推动公募基金高质量发展行动方案》发布以来,新型浮动管理费率基金...
超1500只产品规模不到100... 超1500只产品规模不到100万元,揭秘“迷你理财”背后玄机作者 | 唐曜华 陈子卉编辑 | 方海平...
叮咚!两家国有大行2850亿定... 叮咚!两家国有大行2850亿定增款已到账作者 | 叶麦穗编辑 | 曾芳新媒体编辑 | 实习生 宋语菡...
ASML的EUV光刻之路还能走... ASML 的 EUV 光刻技术在半导体制造领域占据着关键地位,但未来之路充满不确定性。一方面,EUV...
神奇富二代,没一个中国员工,却... 在中国一个员工都没有,却卖成了“中国椰子水一哥”!这个泰国富二代,还准备到港股上市了。你看,IFBH...
5月中国(成都)车市红星榜出炉... 红星资本局6月16日消息,今日,红星资本局发布2025年5月中国(成都)车市红星榜。榜单显示,5月成...
北京银行,业绩爆了个小雷 北京... 都说银行是最稳定,但高管为啥总换叻?事情是这样的~最近,曾经的“城商行一哥”北京银行,叒叒叒换高管了...
第115期:66.00 第11... 2025年6月13日更新:【#大V综合信号#】66.00买入(上期61.25)
9只创新药指数 9只创新药指数... 上周海外战火纷飞,经过了一个周末的消化,虽然态势处于升级状态,但A股今天收涨。 当然,这个收涨是缩量...
“10万+”豪宅集中入市,5月... 本文来源:时代周报 作者:张钇璟图片来源:图虫创意6月16日,国家统计局公布2025年5月份70个大...