在近日召开的2025搜狐科技年度论坛上,清华大学计算机系教授、中国工程院院士郑纬民表示,2025年人工智能发展呈现两大特点:第一个是多模态,大模型能处理文字、图像、视频;第二个人工智能被应用到了与GDP密切相关的行业,中国在推动AI落地方面具有显著优势。
他指出,人工智能大模型的生命周期主要包括五个环节:数据获取、预处理、模型训练、微调和推理。前三个环节需要大量算力和存储资源,通常由阿里、华为、DeepSeek等公司完成。一般单位只需基于已有基础模型进行领域适配的微调和后续的推理应用。
郑纬民提出,当前大模型训练主要依赖两类系统:一是英伟达GPU,其硬件性能与生态成熟度领先,但面临禁售、价格高涨和一卡难求的困境;二是国产芯片,全国已有3万余家企业投入研发,硬件性能逐步提升,但核心障碍在于生态兼容性不足。
对此,郑纬民建议从两方面突破,一方面构建“类CUDA”系统,确保降低开发者学习成本,通过习惯迁移重塑生态;另一方面提升国产卡硬件性能至国外同类产品的60%以上(若达 70%~80%更佳),即便起步晚、进程难,只要性能基本达标,配合生态优化,仍可吸引用户。