从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了! 从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
创始人
2025-08-31 11:33:15

在AI大模型的激烈竞赛中,衡量标准正悄然改变。

从美团最新开源的龙猫大模型,到OpenAI下一代旗舰GPT-5和明星创业公司DeepSeek的新品,顶尖玩家们不约而同地将目光投向了“混合推理”与“自适应计算”,标志着AI行业的发展重点正从“更高、更强”转向“更聪明、更经济”。

美团近日开源的“龙猫”(LongCat-Flash)凭借创新的架构,在性能比肩业界顶尖水平的同时,实现了惊人的算力节省。

华尔街见闻此前提及,LongCat-Flash最具创新性的设计之一是 “零计算”专家机制,该机制能智能识别输入内容中的非关键部分,如常见的词语和标点符号,并将其交由一个不进行复杂运算的特殊“专家”处理,从而直接返回输入,极大地节省了算力。

此举并非孤立的技术炫技,而是对当前行业痛点的精准回应——随着推理模式变得更加复杂,AI应用的成本正在快速上升。

业界的应对策略正在聚焦到一个共同方向:混合推理模式。这种模式让AI系统能够根据问题复杂度自动选择合适的计算资源配置,避免在简单任务上浪费昂贵的算力。

AI越“聪明”,成本越昂贵

美团对效率的极致追求,恰恰反映了整个AI行业正面临的严峻挑战。

据机器之心,前段时间,TextQL联合创始人兼CEO丁一帆(Ethan Ding)就指出了一个反直觉的现象 —— 明明Token的成本一直在下降,但各家模型公司的订阅费却在飞涨。

丁一帆认为,问题的症结在于,那些降价的模型大部分不是SOTA模型,而人类在认知上的贪婪决定了,大部分人只想要“最强大脑”,所以99%的需求会转向SOTA。而最强模型的价格始终差不多。

简单来说就是,虽然单个token的价格在下降,但完成复杂任务所需的token数量正在以前所未有的速度增长。

例如,一次基础的聊天问答可能仅消耗几百个token,但一项复杂的代码编写或法律文件分析任务,可能需要消耗数十万甚至上百万个token。

AI初创公司T3 Chat的首席执行官Theo Browne也曾表示:

“争夺最智能模型的竞赛,已经演变成了争夺最昂贵模型的竞赛。”

这种成本压力已传导至应用层公司。据媒体报道,生产力软件公司Notion的利润率因此下降了约10个百分点。一些AI编程辅助工具的初创公司,如Cursor和Replit,也不得不调整定价策略,引发了部分用户的抱怨。

顶尖模型的共同答案:混合推理

为破解成本困局,“混合推理”或称“自适应计算”已成为行业共识。

各大模型厂商虽然路径不一,但目标高度一致:让模型学会判断何时需要“深度思考”,何时只需“快速响应”。

OpenAI的GPT-5采用“路由器”机制,根据问题复杂程度自动选择合适的模型处理。举例来说,对于如“天空为什么是蓝色”的简单问题,GPT-5会直接将其交给轻量级模型,复杂任务则调用高算力模型。

根据OpenAI内部评测,GPT-5使用思考模式能以比前代模型少50-80%的输出token完成任务,达到相同或更好的效果。该系统通过用户行为、偏好反馈和正确率等真实信号持续训练路由机制,随时间不断改进。

DeepSeek的V3.1版本则更进一步,将对话和推理能力合并到单一模型中,推出了单模型双模式架构。开发者和用户可以通过特定标记或按钮,在“思考”与“非思考”模式间切换。

官方数据显示,其思考模式能在消耗减少25-50% token的情况下,达到与前代模型相当的答案质量,为企业提供了一个高性价比的开源选择。

目前,这一趋势已成为行业主流。从Anthropic的Claude系列、Google的Gemini系列,到国内的阿里Qwen、快手KwaiCoder、字节豆包以及智谱GLM等,几乎所有头部玩家都在探索自己的混合推理方案,试图在性能与成本之间找到最佳平衡点。

有分析指出,混合推理的下一个前沿将是更智能的“自我调节”——让AI模型能够精准地自我评估任务难度,并在无人干预的情况下,以最低的计算代价,在最恰当的时机启动深度思考。

相关内容

热门资讯

卡游赚了小朋友们太多钱 本文来自微信公众号:投资人黄海 (ID:haivcconsumer),作者:投资人黄海正值开学季,这...
上合峰会上的科技力量 科技引领... 8月31日至9月1日,天津迎来上海合作组织成立以来规模最大的一次峰会,20多位外国领导人和10位国际...
超3100只个股上涨 超310... 2025.09.01本文字数:1142,阅读时长大约2分钟作者 |一财阿驴11:31 A股午盘|沪指...
沪指冲高回落涨0.12%,黄金...   中新经纬9月1日电 1日早盘,A股冲高回落,三大指数集体上涨。  截至午间收盘,上证指数涨0.1...
这家券商拟出售6处房产,估值超... 8月28日晚间,红塔证券发布公告称,为盘活内部闲置资产,公司拟通过产权交易中心挂牌转让方式处置公司所...
万亿城商行扩容、排名赶超变局下... A股2025年中期报告披露结束,头部城商行变局落定,万亿俱乐部新增一员,排名也发生较大变化,其中位于...
A股午评:创业板指涨0.55%... 市场早盘冲高回落,三大指数小幅上涨。南财金融终端显示,截至早盘收盘,沪指涨0.12%,深成指涨0.1...
十月稻田2025中期业绩超预期... 8月28日,家庭食品创新企业十月稻田公布了2025年中期业绩报告。报告显示,集团上半年实现营业收入与...
墨西哥拟提高对华商品关税,涵盖... 墨西哥政府计划在下个月的2026年预算提案中提高对中国的关税。路透社援引三位不愿透露姓名及计划细节的...
天津银行新班子首份中报亮相:资... 21世纪经济报道 记者郭聪聪8月29日,港股上市的天津银行发布2025年中期业绩,这也是该行2025...
千亿AI投入,阿里巴巴-W盘中... 9月1日,阿里巴巴-W大涨超17%,此外多只港股医药、互联网、芯片股上涨,药明康德、药明生物涨超6%...
黄金股涨幅超金价,机构:重视贵... 今日,中证沪深港黄金产业股票指数(931238)强势上涨,截至发稿该指数涨6%,涨幅超黄金现货(伦敦...
人均300的云贵川bistro... 总第 4324 期作者 | 餐饮老板内参 内参君云贵川bistro迎来拐点火了一年半,云贵川bist...
招行行长:坚信下半年会实现稳中... 9月1日,招行银行行长王良在该行中期业绩发布会上表示,上半年两个季度的经营情况看,一季度经营压力巨大...
实地探访:美国废弃的老码头,是... 在AI浪潮如火如荼的当下,有人说:“下一波西雅图AI初创公司,可能就诞生在西雅图的老码头上”。上周,...
天齐锂业半年报净利润8441万... 8月29日晚间,天齐锂业(002466.SZ;09696.HK)发布了2025年中报。2025年上半...
十年一遇的风口,为科大讯飞量身... 二十六年前,在合肥,在中科大的实验室里,走出来过一群疯狂的年轻人。当时的他们,和今天全球AI行业担纲...
茅台宣布30亿元级增持,食品饮... 9月1日,白酒板块迎来回调,个股方面,山西汾酒下跌1.09%,贵州茅台、五粮液、泸州老窖小幅下跌。据...
在创新中修行 蒙牛中报里这些喜... 独立 稀缺 穿透创新牛、世界牛、要强牛!作者:闻道编辑:大鹏风品:可乐来源:铑财——铑财研究院中国乳...
改革没有完成时:中国平安的新长... 2023年,平安产险西藏比如支公司的业务员们接到了一项奇妙的任务:在一个月内给20万头牦牛上好“身份...
100家上市公司扎堆炒股,那些... 如果说股市上演的是一台从不间断的魔幻大戏,那么投入真金白银买股票,就属于花钱坐到了第一排,沉浸式感受...
游戏+TapTap双引擎驱动,... 本文来源:时代周报 作者:谢斯临 图片来源:Pixabay上半年净利润暴增268%,港股游戏公司心...
原创 王... 文字原创丨美筑家居 以后房地产市场会怎么走,房价到底是涨还是跌,不管是不是行内人,估计都在关注这个问...
上合组织天津峰会|从天津再出发... 灯火海河畔,津门纳百川。中国天津,迎来世界瞩目的“上合时刻”。 新华社记者 谢环驰 摄 8月31日...
商业银行加速调整 代理销售业务... 中国商报(记者 马文博)国家金融监督管理总局印发的《商业银行代理销售业务管理办法》(以下简称办法)将...
退休后,他们重新开始上班 本文来自微信公众号:猛犸工作室 (ID:MENGMASHENDU),编辑:梁励,作者:王晨婷本是陪伴...
东方财富上周获融资资金买入超2... 一、证券市场回顾南财金融终端数据显示,上周(8月25日-8月29日,下同),上证综指周内上涨0.84...
原创 不... 一、慢牛式上涨!A股的目标,可能不止是3800,接下来上4000点,才是战略意图,但上面又要求不急于...
中国稀土:股票交易异常波动,无... 新京报贝壳财经讯 8月31日,中国稀土发布股票异动公告,公司股票于2025年8月27日、8月28日、...
上交所:截至8月底沪市ETF规... 每经AI快讯,8月31日,据上交所发布,截至8月底,沪市ETF规模超3.7万亿元,境内占比超七成,5...