我们扒完了GPT-5全网爆料,奥特曼和OpenAI 这次的饼真不好画了
创始人
2025-08-05 18:43:48

我们历经艰辛,扒完了关于 GPT - 5 的全网爆料。原本以为这会是一场令人振奋的科技盛宴,然而结果却让人大跌眼镜。奥特曼和 OpenAI 似乎在这次的计划中遇到了难以跨越的障碍,那曾经被寄予厚望的大饼如今变得模糊不清。众多期待着 GPT - 5 能带来巨大突破的目光,在这些爆料面前渐渐黯淡。这无疑给科技界投下了一颗小小的石子,激起了层层涟漪,也让人们开始重新审视科技发展的进程,奥特曼和 OpenAI 此次的“画饼”行动似乎遭遇了不小的挫折。


本文来自微信公众号:APPSO (ID:appsolution),作者:发现明日产品的,原文标题:《我们扒完了 GPT-5 全网爆料,奥特曼和 OpenAI 这次的饼真不好画了》


如果炒作是奥运项目的话,Sam Altman的奖牌数将创下纪录。


在X上,这是网友对这段时间GPT-5营销狂轰滥炸的锐评。


从OpenAI宣布自己达到了IMO金牌水平以来,对它高热度营销的诟病就一直没有停下来过。


几乎每天,都有一点关于GPT-5的消息被「不经意」地放出。一会儿是Altman在播客上感叹自己「相对于AI毫无用处」;一会儿是The Information深度报道其内部挑战重重;一会儿又是在X上晒出与GPT-5的聊天截图……


大家的胃口是被吊足了,但关于产品的核心信息,却始终若隐若现。


过去一段时间来,GPT-5貌似一直是「最热的未来产品」。从去年开始就陆续有媒体在爆料,发布时间的传闻从去年一路传到今年8月。


结果是,OpenAI的确在刷新各种benchmark,但大家期待的GPT-5却迟迟没有现身。



根据OpenAI官方模型发布公告整理


OpenAI的benchmark越是刷新,大家的兴奋感反而越低。毕竟,马斯克都要靠二次元动漫角色Ani来获得流量关注了,而Grok 4刷新了多少榜单根本提不起大家的兴趣。


所以,OpenAI看起来也转向了一种新节奏,靠不断「暗示」、不断「吊胃口」来保持热度。


我们整理了近期所有关于GPT-5的爆料和报道,试图跳出这套营销叙事,看清在漫长的预热背后,OpenAI接下来到底在押什么注。GPT-5在真正到来之前,还有哪些值得关注的信号。


GPT-5的核心升级,统一了基础和推理模型


与以往更新不同,GPT-5的最大亮点并非空泛的跑分提升,而是在多模态、软件工程和AI智能体(Agent)这三个极具实用价值的领域,展现了相当大的性能提升。


实现「完整的多模态」能力


这是最新爆料中最大、也最令人兴奋的特性。据专栏SemiconSam博主@Jukanlosreve公开的一份专家电话会议纪要透露,GPT-5最显著的特点是「多模态能力的显著提升,实现了一个完整的多模态模型」。


这意味着它在处理和生成图文、音视频等多种信息流上的能力将远超以往,有望带来「吉卜力时刻」的用户体验,并在发布后登顶绝大多数评测榜单。


软件工程能力的大幅提升


GPT-5不再局限于解决算法竞赛题,而是能深入到大型、陈旧、复杂的企业级代码库中进行修改和维护。这被视为OpenAI直接挑战Anthropic Claude在编程领域优势地位的重磅武器。


一位测试者甚至表示,在他们的横向比较中,GPT-5的表现优于Anthropic的Claude Sonnet 4。


同时,作为OpenAI最重要的合作伙伴,微软内部员工在测试后透露,GPT-5在产出高质量代码的同时,并没有消耗更多的计算资源。


X上有用户分享通过OpenAI API免费尝试了GPT-5,并用它做了一个六边形振动测试的HTML页面,看起来效果确实很不错。


真正可用的AI Agent


更强的推理能力,意味着GPT-5能更好地理解和执行复杂的多步骤指令,从而以更少的人工监督来执行多步骤任务,向着能够自主完成任务的「AI智能体」迈出了关键一步。


例如,有媒体称它可以遵循一套复杂的规则,来判断自动客服代理是否应该批准退款,而此前的模型则需要大量具体案例才能学会。


攻克主观领域的「通用验证器」


为了解决推理模型难以评估的问题,OpenAI开发了一项名为「通用验证器」(universal verifier)的技术。


值得关注的是,这项名为「通用验证器」的工作,还是Ilya之前带领的超级对齐团队在去年完成的。


它的本质上是另一个AI,专门负责检查和评估主模型的回答质量,即使是在没有标准答案的场景下。因此GPT-5不仅在编程和数学等可验证领域表现出色,在创意写作、策略分析等主观性更强的领域也取得了进步。


这项技术也是OpenAI能在国际数学奥林匹克竞赛中摘金的关键。


Reddit上也有网友分享自己透过OpenAI API获得了GPT-5的访问权限,并用GPT-5生成了一张图片,他在评论区里面提到生成这张图片用了50多秒,他倾向于认为所使用的并不是GPT-5 mini版本。


而我们使用ChatGPT-4o生成的图像则更像是简笔画。


要实现上述强大的功能,GPT-5依赖于其最核心的一项变化:一个能自动为用户选择最优解的智能调度系统。


综合多家媒体的报道,与以往单纯追求更大参数规模的路径不同,GPT-5旨在将传统的GPT语言模型与专注于推理的「o」系列模型(如o1、o3)整合在一起。


如果你跟我一样曾经对GPT-4o、o4、GPT-4.1等令人眼花缭乱的模型名称感到困惑,那么GPT-5的首要目标就是终结我们的「选择困难症」。


ChatGPT内提供的模型,有擅长编码、分析、处理日常任务、写作、推理等等


一些研究人员推测,GPT-5可能并非单一模型,而是一个智能「路由系统」,能根据用户问题的难度,动态选择调用最合适的模型来处理。


对于简单请求:它会调用更快速、成本更低的GPT系列模型,实现即时响应。


对于复杂难题:如STEM(科学、技术、工程和数学)或深度编程问题,它会自动切换到更强大的推理模型,进行更深入的「思考」,确保答案的质量。


OpenAI ChatGPT负责人Nick Turley对此的愿景是:「我们的目标是让普通用户无需再思考该用哪个模型」。相反,目标是让GPT-5自动为用户的任务选择最佳模型。


发布、版本与最后的悬念


时间:虽然早在2023年末,就有媒体称OpenAI可能会在2024春季或夏季发布GPT-5。然而到了2024年5月,OpenAI的官方当时表示,


近些日子已经开始训练公司的「下一代前沿模型」,预计这个新系统将达到通往AGI(通用人工智能)的「下一个能力水平」。


到了2025年,有关发布时间的传闻消息更加密集。六月份,在奥特曼的访谈视频里,他说GPT-5「可能是在今年夏天的某个时候」会发布。


七月份,有媒体称为了应对欧盟的AI监管法律生效,OpenAI会在七月底发布GPT-5。之后,The Verge又透露OpenAI计划在八月初推出GPT-5。


昨天,X上还有网友截到了奥特曼发文说20个小时之后见,不过这条推文很快被删掉了,也无法证实奥特曼是否有发布该则推文。


而随着最近几天Perplexity、Cursor、Microsoft Copilot、Flowith、以及ChatGPT macOS应用和网站上,都开始有出现GPT-5的踪迹,我想发布的时间应该不会再拖太久。


更确切的信息,则是几天前《连线》杂志报道Anthropic切断了OpenAI对Claude API的访问。


OpenAI被指利用API对Claude的功能(如编码和创意写作)进行测试,并与其自家模型进行比较,而这被视为「构建竞争产品」,其行为是违反了Anthropic的商业条款。


OpenAI则对此表达了失望,称自己也为Anthropic提供了类似的API访问权限。


很明显这应该是OpenAI在为GPT-5最后的发布做准备。


目前,综合多个消息源的信息,GPT-5的发布时间仍是指向2025年8月初。


X上还有网友等麻了,揪着一条OpenAI研究员发布推文的时间,说这是为GPT-5的发布时间埋下了彩蛋,8:05就说明是八月五号。


「因为一天有1440分钟,为什么他刚好就在8:05发布了这则推文,这肯定不是巧合。」


Boris Power是OpenAI应用研究负责人,这条推文发布时间在相差13个小时时差的地区(加州时间)会显示8:05 AM。


GPT-5的发布时间快定下来吧,不然大家都等「疯」了。


版本:预计GPT-5将提供多个版本。主要的「推理整合版」将通过ChatGPT和API提供;「迷你版」(mini)也将登陆ChatGPT和API;而「纳米版」(nano)预计将仅通过API提供。


微软与OpenAI的协议:在那份披露的电话记录中,提到微软与OpenAI的新合作协议,实质是微软在利用OpenAI来弥补自身模型研发的不足(如优化Copilot和Bing),为自己的独立研发争取时间。协议中有意模糊了AGI的定义,更侧重于短期的技术互补。


协议中提到AGI的规定是,「当OpenAI实现通用人工智能后,微软将失去使用该初创公司先进技术的部分权利」。


爆料博主信息,他发推文表示自己不是电话记录里面那个回答的人,他觉得可以通过出售这个赚很多钱,但他决定免费发布。


挑战不断,GPT-5艰难的诞生背景


在这些亮眼的功能和发布信息背后,是一段充满挑战的研发历程,除了爆料里面提到OpenAI近期使用了17万至18万张GPU来完成GPT-5的训练,这一惊人的训练规模。


要理解GPT-5为何会选择这条路,根据The Information的独家报道,我们回顾了OpenAI近几年的技术演进路线。


1、缩放为王与「Orion」的陨落


从2020年的GPT-3到2023年的GPT-4,OpenAI乃至整个行业都信奉着「缩放定律」(Scaling Law)。即更大的模型、更多的数据,就能带来更强的智能。这一策略催生了ChatGPT的辉煌,但模型在逻辑、数学等需要严谨推理的领域始终步履维艰。


然而,这条路的尽头似乎比预想的更早到来。


在内部,一个代号为「Orion」的宏大项目曾被寄予厚望,它本该是GPT-5的前身,但现实却泼了一盆冷水。


研究人员发现,传统的预训练方法开始遭遇瓶颈,高质量的网络数据日益枯竭,许多在小模型上验证有效的训练技巧,在模型规模扩大后便神秘失效。


最终,Orion未能实现预期的性能飞跃,惨遭降级,并在2025年2月以GPT-4.5的名义悄然发布,很快便无人问津。这标志着OpenAI第一次在「缩放定律」这条路上撞上了南墙。


2、推理的成功与Q*的惊喜


幸运的是,另一条道路早已在悄然探索中。早在ChatGPT诞生之前,公司内部一个名为MathGen的团队就在默默研究如何让模型解决数学竞赛难题。


他们的工作,最终与强化学习(RL)和测试时计算(test-time computation,允许模型在推理过程中多思考一会儿)等技术结合,在2023年底引发了一场内部地震。


这就是后来广为人知的Q*(或称Strawberry)技术突破。它让模型首次能够解决从未见过的数学问题,其表现出的推理能力让研究员们震惊不已,甚至「看到了模型在思考、在犯错、在回溯、在沮丧,就像在阅读一个人的思考过程」。


3、「天才」的诞生与烦恼


Q*的突破直接催生了专注于推理的o系列模型(o1、o3)。这些「母体模型」在内部测试中展现出惊人的能力,它们被给予了更多的英伟达芯片算力,甚至被赋予了联网搜索和调用代码库的能力,从而在科学等领域取得了非凡的进步。


但「天才」也有烦恼。当研究人员试图将强大的o3母体模型转化为一个能与普通人对话的聊天版本时,它的性能出现了严重退化。一位内部人士将其形容为,为了迁就人类的语言,而将一个「用自己独特逻辑思考的天才」强行「降智」。


近期奥特曼的「凡尔赛」时刻


在焦急的等待中,OpenAI的高层也不断地在释放一些信号以更好的预热GPT-5。


CEO Sam Altman近期在一次播客节目中分享了一个亲身经历。


他向GPT-5提出了一个自己无法理解的难题,结果模型完美地解答了。他形容那一刻自己「感觉相对于AI毫无用处」,并称之为一种「怪异的感觉」。这无疑极大地拉高了外界的期待。


昨天,他又在X上分享了自己与GPT-5的聊天页面,他向GPT-5提问什么是最发人深省的AI题材电视剧,截图显示GPT-5向他推荐了《万神殿Pantheon》和《Devs》。


有用户评论说从这个截图看不出GPT-5和现在的ChatGPT有什么区别,但是这波热度是又被奥特曼拿下了。


ChatGPT agent发布的时候,我在社交媒体上看到一个评论。


里面说,以前是OpenAI做什么,大家跟着做什么,现在可能是Anthropic做什么,大家跟着做什么。


他提到OpenAI现在方方面面都比不上Anthropic,编程、幻觉抑制、安全、以及MCP都是属于Anthropic,而OpenAI却只是一直说自己拿了哪些benchmark。


今天,OpenAI看起来又拿下了一个榜单,「最会营销」的榜单。


在Anthropic、Google、Meta、xAI等强大对手的激烈竞争下,这次发布可能对OpenAI至关重要。


Logan Kilpatrick是Google DeepMind集团产品经理,Steven Heidel是OpenAI技术工程师,预计Gemini 3也快要发布。


GPT-5不仅要赢回在特定领域,像是编程这块失去的阵地;更要向世界证明,OpenAI是依然有能力引领AI走向更自主、更通用的未来前进。


附上部分参考资料地址:


https://www.theinformation.com/articles/inside-openais-rocky-path-gpt-5


https://www.theinformation.com/articles/openais-gpt-5-shines-coding-tasks


https://www.businessinsider.com/openai-ceo-sam-altman-teases-gpt-5-2025-8


https://www.theverge.com/notepad-microsoft-newsletter/712950/openai-gpt-5-model-release-date-notepad


https://www.wired.com/story/anthropic-revokes-openais-access-to-claude/


https://www.zdnet.com/article/this-one-feature-will-make-gpt-5-a-game-changer-if-openai-gets-it-right/


https://www.zdnet.com/article/openai-teases-imminent-gpt-5-launch-heres-what-to-expect/


欢迎加入APPSO AI社群,一起畅聊AI产品,获取#AI有用功,解锁更多AI新知


我们正在招募伙伴


简历投递邮箱hr@ifanr.com


✉️邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

相关内容

热门资讯

百胜中国:二季度经营利润3.0... 新京报讯(记者王萍)8月5日,百胜中国发布2025年第二季度业绩,集团取得总收入28亿美元,同比增长...
4天赚了4200万元!“超级牛... 8月5日,ST华通(002602.SZ)以涨停价收盘,股价报14.21元/股。自8月以来,ST华通累...
海光信息上半年营收、净利增幅均... 8月5日,算力芯片厂商海光信息(688041)发布2025年上半年业绩,期内公司实现总营业收入54....
听劝后改价,理想重回性价比 听... 理想汽车的产品竞争力是什么?在7月29日的理想i8上市发布会上,这一问题并未得到完美解答。核心问题在...
400亿风电巨头,董事长总裁身... 【高管】金风科技股份有限公司董事会换届完成近一个月后,才对管理层重新任命,基本沿袭了原班人马。根据金...
消费电子股价爆发 消费电子股价... 记者丨张赛男 实习生许思佳 编辑丨朱益民8月5日,A股消费电子板块大爆发,朗特智能“20CM”涨停...
600421,再次筹划“卖身”... 2025.08.05本文字数:1605,阅读时长大约3分钟作者 |第一财经 周楠上一次易主失败半年多...
上演“一周游”定价!理想新车i... 上市仅一周,理想i8就降价改配。8月5日,理想官方发文,宣布对新近上市的i8车型进行配置和售价调整,...
南下资金净买入港股234亿创3... 格隆汇8月5日|南下资金今日净买入港股234.26亿港元,创今年3月12日以来单日净买入额新高。其中...
董明珠炮轰家电行业:靠价格套路... 8 月 5 日消息,格力「董明珠健康家」内蒙古首店在包头开业了。这可是格力在健康家电领域的又一次开疆...
南向资金追踪|单日净流入约23... 财联社8月5日讯(编辑 冯轶)据Wind数据显示,南向资金今日成交约1297.01亿港元,与前一日基...
“宠物界Uber” Wag! ... 2025年7月21日,旧金山的宠物服务平台 Wag! 在纳斯达克敲钟不到三年便递交了破产申请,市值从...
【投融资动态】洪量新材科技B轮... 证券之星消息,根据天眼查APP于8月2日公布的信息整理,浙江洪量新材科技有限公司B轮融资,融资额1亿...
鹏华固收黄金战队全面开花,25... 来源:鹏华基金 近日,银河证券、天相投顾、晨星中国、上海证券、招商证券、济安金信六大权威机构发布最...
产业观察|196万新开户数,A... 5日,A股沪指再度站上3600点。沪深两市半日成交额1.01万亿元,较上个交易日放量849亿元。截至...
上交所发布上纬新材相关情况通报... 8月5日,上交所发布关于上纬新材相关情况的通报。上纬新材(688585)近期多次出现严重异常波动情形...
2025“爱在上海”服务消费“... 市商务委介绍, 2025“爱在上海‘+’年华” 活动以“爱在上海 浪漫无界”为核心主题,主会场设在静...
“对等关税”实施在即,美国消费... 美东时间8月4日,美国海关和边境保护局(CBP)发布了特朗普调整后的“对等关税”行政令实施细则。根据...
从废弃油脂到资本盛宴:丰倍生物... 实控人夫妇已套现超6500万。作者|鹤鸣编辑|刘钦文地沟油,一度被大众视为“餐桌噩梦”的废弃食用油,...
孙正义AI雄心逐渐清晰 孙正义一直怀揣着宏大的 AI 雄心。他早年便在科技领域展现出卓越的眼光和果断的决策力,对 AI 领域...
2025第一神股诞生!17天怒... A股涨起来,妈都不认得。没错,2025年最猛的股,诞生了!不到一个月时间,已经涨了1400%!即便自...
宗馥莉还没有输|氪金·大事件 ... 作者|谢芸子编辑|黄绎达封面来源|视觉中国2009年前,宗庆后打赢“达娃之争”时应该未曾想到,同样震...
1600亿,甘肃夫妻要IPO了... IPO市场太火爆,“A+H”更热闹。作者 | 老高来源 |投资家(ID:touzijias)IPO市...
高阶智驾免费风潮,汽车业未来靠... 如今,高阶智驾免费风潮席卷汽车行业。各大车企纷纷加入这场竞争,将高阶智驾功能作为吸引消费者的重要卖点...
赵伟:美国劳动力市场——脆弱的... 赵伟、陈达飞、王茂宇、赵宇、李欣越(赵伟系申万宏源证券首席经济学家、中国首席经济学家论坛理事)摘要美...
几千万人等雨停!华北暴雨,西北... 作者 | 知远北方气候,正在“南方化”。今年全国大江大河的首次编号洪水,发生地居然不在南方,而是河北...
纽约开LAB店,硅谷排长队,喜... 作者|唐飞编辑|计然如果我们绘制一张2025上半年中国新茶饮出海地图,箭头一定是集体指向欧美的。2月...
2.79亿豪赌ST股!“超级牛... “超级牛散”魏巍再次赢得豪赌。8月5日,ST华通(002602.SZ)以涨停价收盘,股价报14.21...
“80后”无锡富豪,斥资7亿元... 21世纪经济报道记者曹恩惠超硬材料专家、“70后”邹余耀,欲将国内第一家金刚线上市公司三超新材(30...
纽约开LAB店,硅谷排长队,喜... 作者|唐飞编辑|计然如果我们绘制一张2025上半年中国新茶饮出海地图,箭头一定是集体指向欧美的。2月...