你是一个成熟的Agent了,该自己报道ChatGPT Agent的新闻了
创始人
2025-07-18 16:43:45

近日,ChatGPT 这一强大的人工智能 Agent 引起了广泛关注。它以其卓越的语言理解和生成能力,在自然语言处理领域展现出非凡的实力。ChatGPT 能够快速准确地回答各种问题,进行富有逻辑的对话,甚至可以创作故事、诗歌等文学作品。其训练数据的海量性和先进的算法,使得它能够不断学习和进化,为用户提供更加优质的服务。它的出现,不仅推动了人工智能技术的发展,也给人们的生活和工作带来了诸多便利,成为了当今科技领域的一大亮点。


本文来自微信公众号:硅星人Pro (ID:gh_c0bb185caa8d),作者:黄小艺


7月18日凌晨,OpenAI发布了ChatGPT Agent,这是继1月份推出operator,2月份推出deep research之后,OpenAI在Agent化道路上又一关键举动。


当下,一个有趣的现象出现了:AI Agent领域正悄然分化为两大流派。一方是以OpenAI、Claude为代表的“基座派”,正在将Agent能力融入其底层模型;另一方则是“应用派”,强调自己在具体的应用场景和灵活的工具调用上的设计规划。


3月,Manus的横空出世,便已点燃了通用Agent的第一波市场狂潮,随后,Genspark、Flowith、Fellou等一众新锐玩家纷纷从不同应用场景切入,迅速在Agent赛道上形成了各自的阵营。


就在OpenAI发布ChatGPT Agent后不久,Genspark便在社交平台X上公开“叫板”,直言视频中演示的ChatGPT Agent能力“表现不够出色”。Manus也贴脸开大,对比了自己和OpenAI展示的案例的结果。


我们也想对比一下这些产品在ChatGPT Agent展示的一些案例上究竟表现有何不同。


1、你是一个成熟的Agent了,你该自己报道Agent的新闻了


首先,今天的AI Agent产品这么热闹,我们觉得它们也都是成熟的Agent了,应该来自己报道其他Agent的新闻了。


于是我们让几个备受关注的AI Agent产品来报道此次ChatGPT Agent的发布。我们并没有选择只是给一个很简单Prompt的方式,而是用类似深度报告的方式来要求它们,最终产出一个有些设计要素在的one pager。


结果如下。


Manus:


有意思的地方是,Manus的Agent自己分析之后,并没有像官方X账号那样“自信”,给了OpenAI更高的分数。


Genspark:


生成了一个更复杂的报告。这个报告里对OpenAI ChatGPT的信息捕捉更全。


并输出了一份非常详细的对比。



同样,与官方X的“自信”也不同,Genspark的Agent也对OpenAI的水平表达了高度认可。


Flowith:


Flowith算是对我们比较长的Prompt做了充分理解后,抓住了要做一个one pager这个重点,这让它的结果看起来设计感也最强,交出了一个格式上更好看的one pager。


1、比一比:从规划到执行的“最后一公里”


在报道完ChatGPT Agent后,我们让这些AI Agent也拿OpenAI视频展示的案例练了练手。互相比较一下。


OpenAI视频中提到了四个案例,主要是行程策划、图像设计类、资讯分析类,这也是自3月份Manus推出之后比较常见的场景。


我们先找了其中一个,婚礼规划的场景,把视频中展示的Prompt提交给了Manus、Genspark、Flowith、Fellou等,看看直接对比。


prompt:Our friends are gettingmarried later this year!This is the wedding website:https://www.zola.com/wedding/minniaandsarahCan you help me find:-An outfit that matches the dress code for all the functions(mens)-Propose like five options.Something nice,mid luxury items which match the venue,and weather-Find me hotels with couple of days of buffer on either end_-Use booking.com for these,and make sure to check availability and current price-And also don't forget to pick a gift for them ideally under$500(registry preferred if any,otherwisefind something nice)make a nice report!


Manus:


https://manus.im/share/iWutNt1yTVXu8ZUTuz6YVQ?replay=1


Manus输出了一个长文本页面,没有给到具体购买链接等涉及到下一步行动的结果,属于婚礼参加指南和建议。


Flowith:


同样给出了一份详细的婚礼参与指南,无法进行到下一步加购等动作,更关键的是,因为单开了一条任务线来挑选参加婚礼的服饰,该任务线出现bug,最终没能输出服饰结果。


Fellou:


Fellou居然为这个任务一口气跑了1小时14分钟。这是一个很有意思的不同,OpenAI此次发布后,它的研究员也提到,应该有一个榜单来比较AI Agent一次任务能够跑的时长。


当然,这个时长和最终效果之间的关系也需要进一步查看。但Fellou这个操作还是给用户带来某种微妙的“靠谱”感。


这个过程它非常认真的单开了很多浏览器,比较行程、路线、酒店事件和日期。


最终它把信息用一种经过简单设计的格式,提供给用户。


但是在具体推荐上,同样无法直接购买,没有具体链接,只能输出报告,更像是一个搜集信息的AI浏览器。


https://chat.fellou.ai/report/0d853b10-fcd0-4c22-a1f2-696556c8f277


第二个我们选了“做贴纸”的场景。


prompt2:Make some team swag for our launch of chatgpt agent-makesome anime-style art that'scute and quirky based on theattached photo of our teammascot.then,make them into.1x1 laptop stickers and order 500 to 575 Florida St in SF.I like StickerMule!


贴纸的设计在近三个月来各类Agent测试中算是非常简单的了,而且,很多产品,例如Genspark的任务,本身也是调取的GPT的生图能力。


不过同样的,和OpenAI展示的相比,多个产品在订购环节,因为没有调用能力,无法完成具体操作。


比如Genspark会提示:很抱歉,我无法直接为您完成在线订购,因为这需要您的个人信息、付款方式和账户验证。不过我可以为您提供详细的订购指导,让整个过程变得超级简单!


Flowith同样只能进行订购指引。


在这个任务中,Manus在流程中显示完成了购物车的添加,也是除了OpenAI以外唯一一个进行到这一步的Agent。


可以看到,今天的AI Agent依然是在一个“混沌期”,它能做到的事情,在不停让我们惊叹,而同时它也依然是不稳定的,哪怕OpenAI,今天发布的ChatGPT Agent更像是一个占位动作。但当我们把AI Agent视作一个潜力巨大,价值巨大的方向,这些新的重要玩家的加入和更激烈的竞争,都是好事——它最终会推动一个能稳定地解决人类面对的复杂任务的Agent更早出现在我们的生活里。

相关内容

热门资讯

MetaUserDao:上海国... MetaUserDao:上海国委组织学习稳定币,释放了哪些信号 2025年7月,上海市国资委下属相关...
新易盛业绩股价狂飙:机构重仓躺... 在连续三日的暴力拉升并晋级川股市值前三后,7月18日,CPO(共封装光学)大牛股新易盛(300502...
红宝丽:第一大股东及实控人计划... 新京报贝壳财经讯 7月18日,红宝丽公告,公司第一大股东江苏宝源投资管理有限公司及实际控制人芮敬功计...
女律师十年体检漏“癌踪”,“体... 爱康国宾因何漏检癌症?作者 | 高岩编辑丨于婞来源 | 野马财经7月17日,北京一位女律师连续十年在...
慧辰股份涨3.14%,成交额1... 来源:新浪证券-红岸工作室 7月17日,慧辰股份涨3.14%,成交额1.69亿元,换手率3.77%,...
西藏珠峰7月17日融资净买入9... 雷达财经雷助吧出品 文|阑珊 编|深海 东财Choice数据显示,2025年7月17日,西藏珠峰融资...
快手,不需要周杰伦 快手,不需... 文丨云潭入驻抖音21小时未发作品就涨粉超1000万,一个星期粉丝破2200万,点赞近2600万。已经...
甜啦啦上半年国内累计签约门店1... 新京报讯(记者王子扬)进入暑期消费热潮,各个新茶饮品牌在加码新品、营销动作的同时,招商加盟商方面释放...
严管专项债挪用之后 记者 杜涛 7月份,一位地方政府投融资人士查看省里最新一批专项债发行数据时,发现部分县区专项债发行量...
突传重磅!武汉国资将控股良品铺... 来源丨每日经济新闻综合7月17日晚,良品铺子股份有限公司(603719.SH,以下简称“良品铺子”)...
1.25亿紧急“输血”,西部材... 第 2330期〡2025/07/18西安诺博尔稀贵金属材料股份有限公司(以下简称“西诺稀贵”)北交所...
超600亿“掏空式分红”让它再... 9年前,一场私有化风波引发科兴控股生物技术有限公司(SVA.US,下称“科兴生物”)旷日持久的控制权...
盈康生命历史亏损“清零” 凸显... 7月16日,盈康生命(300143.SZ)宣布拟利用母公司972.6万元盈余公积与14.48亿元资本...
V观财报|元隆雅图及董事长孙震...   中新经纬7月18日电 据北京证监局网站18日消息,北京证监局对北京元隆雅图文化传播股份有限公司(...
第二家未盈利IPO!通过! 未... 7月18日,深圳北芯生命科技股份有限公司(下称“北芯生命”)在上交所科创板成功过会。北芯生命的IPO...
V观财报|南京新百被责令改正 ...   中新经纬7月18日电 南京新百因两项违规行为被责令改正。  18日盘后,南京新百公告,公司、控股...
给陷入ROI的营销朋友,列一份... 出品 | 虎嗅智库作者 | 大鲸助理在一家消费品牌的市场部,每天都有内容团队在赶稿——新品发布、会员...
保留职级,原海通国际高管林涌、... 21世纪经济报道记者孙永乐 报道国泰海通(601211.SH)近期发布人事任免通知,聘任林涌为政策和...
游戏行业全面回暖:长青产品筑底... 南方财经记者 吴立洋春江水暖鸭先知,上半年游戏行业的全面回暖,开始在首批A股游戏半年业绩预告中显现。...
裁员裁到振兴美造船业大动脉?特... 特朗普政府旨在扭转美国航运业数十年衰落的雄心计划正陷入停滞之中。近期,旨在负责振兴美国造船业的国家安...
中国船舶:公司吸收合并中国重工... 7月18日晚间,中国船舶工业股份有限公司(中国船舶,600150.SH)公告称,7月18日,中国证券...
律师10年体检“未见明显异常”... 图片来源:视觉中国蓝鲸新闻7月18日讯(记者 屠俊)"2013年到2023年,我在‘爱康国宾’体检了...
被责令停止锂资源开采 藏格矿业... 上证报中国证券网讯(记者 陈梦娜)藏格矿业7月17日午间公告称,公司全资子公司格尔木藏格钾肥有限公司...
欧盟准备再退一步:只要美国降到... 【文/观察者网 王一】美欧关税谈判陷入僵局,为了不在8月1日被美国总统特朗普强征关税,欧盟打算在其重...
秦洪看盘|资源主线崛起,牵引A... 李晶昀 AI图周五A股市场出现了热点此起彼伏、主要股指强劲回升的走势。其中,AI主线有所休整,给创业...
定投傅鹏博5年亏12%:季报透... 昨日,睿远成长价值公布二季报,亮点比较多。开始主题之前,先说几个题外话,也是近期的一些思考。一、近期...
1.47亿资金抢筹建设工业,机... 7月18日,上证指数上涨0.5%,深证成指上涨0.37%,创业板指上涨0.34%。盘后龙虎榜数据显示...
高瑞东:美国消费增速高于预期,... 高瑞东、周欣平(高瑞东系光大证券首席经济学家、中国首席经济学家论坛理事)核心观点事件:7月17日,美...
就是它,陕西芯片小龙头,掐住A... 中国供应链,是个奇迹!例如,从无到有,到蓬勃兴盛的半导体产业链,现在中芯国际、北方华创等也正在抓紧国...
加码全球支线航空市场 山河智能... 中经记者 庄灵辉 卢志坤 北京报道山河智能(002097.SZ)正持续加码国际市场。日前,山河智能发...