“行业对AI基础设施的需求远超我们的预期。”9月24日的2025云栖大会上,阿里巴巴集团董事兼首席执行官吴泳铭透露,阿里正在推进3800亿元的AI基础设施建设,并计划追加更大的投入。
受此消息影响,截至9月24日港股收盘,阿里巴巴(09988.HK)股价大涨9.16%,报174.0港元/股,创下近四年来新高。
此前2月,吴泳铭曾宣布,阿里将在未来三年投入超过3800亿元,用于建设云和AI硬件基础设施,投资总额超过去十年的总和。
AI基建(AI Infra)之于AI,如同电⽹之于电⼒。云厂商和大模型公司对AI基建的投资热度至今不减。9月22日,英伟达宣布将逐步向OpenAI投资高达1000亿美元,用于建设电力容量达10吉瓦(gigawatt)的AI数据中心,其规模相当于部署400万至500万块GPU。
云栖大会上,吴泳铭预测,未来五年全球AI累计投入金额将超过4万亿美元,“这是人类历史上最大的算力和研发投入”。对比2022年生成式AI元年,2032年阿里云全球数据中心的能耗规模将提升10倍。
吴泳铭说,阿里云是少数能做到软硬件垂直整合的AI云计算平台。在硬件和网络层面,阿里云自研核心存储系统、网络架构、计算芯片等;阿里云同时拥有业内领先的通义模型,从而实现基础设施架构设计与模型架构设计的协同创新。
云栖大会上,阿里云智能集团首席技术官周靖人发布了7款通义大模型,以及全新升级的阿里云多款AI Infra产品和服务。
AI Infra是一系列硬件和软件资源的集合,涵盖计算、网络、存储、数据库、人工智能平台、服务器、安全等产品和服务模块。阿里云加速计算产品技术负责人王超近期在一次媒体沙龙中形容,算法的团队决定模型的效果,AI Infra团队则是追求让大模型的计算速度更快、成本更低,两个团队互为搭档。
阿里云的打法是做AI云计算基础设施的全栈布局。阿里云智能集团弹性计算、存储产品线产品负责人陈起鲲在前述媒体沙龙中表示,当企业进行AI智能化转型时,所需要的不仅仅是单一产品的功能,而是AI Infra的全栈产品。
全新发布的磐久AI Infra 2.0超节点服务器兼容多种AI芯片,单柜拥有128颗AI芯片。阿里云发布的高性能网络HPN8.0,其作用就是将成千上万的服务器连接起来。
磐久AI Infra 2.0超节点服务器。图:阿里云
AI计算离不开存储,阿里云提供文件存储(CPFS)和对象存储(OSS)两款存储产品:前者面向训练和推理场景的提效;后者面向智能体(Agent)开发,是为了更有效地支持多模态数据的管理及使用。
陈起鲲介绍,传统数据发现方式面临数据难以高效查找,内容混杂、难以发现和整理有效信息的痛点。但基于对象存储OSS服务,能让海量非结构化数据变得更容易查询,从而方便AI智能体的调用。
将计算、存储、网络等能力集成,阿里云升级智能计算灵骏集群。周靖人说,灵骏集群不但有算力规模上的优势,同时也支持异构芯片能力,支持业界主流GPU,深度适配和支持多种国产AI芯片。数据显示,灵骏智算集群在万卡规模下网络带宽利用率超过99%,可支持单集群十万张GPU卡的AI算力规模。
为了适配AI出海对算力的需求,阿里云提供全球算力调度网络。周靖人介绍,AI应用公司可以在全球各区域就近接入阿里云的服务。
陈起鲲表示,海外数据中心建设是阿里3800亿AI基建投资的重要组成部分。
目前,阿里云的云计算服务遍布全球29个地域、91个可用区。9月24日的云栖大会上,阿里云宣布新一轮全球基础设施扩建计划:将在巴西、法国和荷兰首次设立云计算地域节点(region),并将扩建墨西哥、日本、韩国、马来西亚和迪拜的数据中心。
安全服务也是AI Infra的一环。周靖人认为,安全话题在AI时代显得尤为重要。在模型训练侧,需要确保数据的安全,特别是对敏感数据进行过滤。在模型服务侧,则要做好提示词攻击的防护,落实内容合规审计等措施。
阿里对AI基建的投入取得直观的收入。财报显示,2025年第二季度,阿里云业务收入同比增长26%,这受益于市场对AI服务的高涨需求。
9月9日,市场调研机构Omdia发布的一份报告显示,在2025年上半年的中国AI云市场中,阿里云占比35.8%、位列第一,其份额也高于2到4名的总和。紧随其后的火山引擎占比14.8%、华为云占比13.1%、腾讯云占比7%,百度云占比6.1%,前五名总和超过整个市场的75%。得益于生成式人工智能的蓬勃发展,中国AI云市场2025年预计达518亿元,增长148%,到2030年将达1930亿元规模。
采写:南都N视频记者 杨柳