为什么说现在所有的AI Agent，都像3D 打印机？_财经热点

为什么说现在所有的AI Agent，都像3D 打印机？

创始人

2025-09-15 12:26:27

本文来自微信公众号：极客公园（ID：geekpark），作者：汤一涛，编辑：靖宇，原文标题：《为什么说现在所有的 AI Agent，都像 3D 打印机？｜AI 上新》

GPT-5的发布，可以看作是一个分水岭。练习时长两年半的GPT-5，并没有展现出和GPT-4本质上的差别，甚至因为模型的预设人格引发了用户的反感情绪。

这基本宣告了一个事实，过去两年，大模型的能力跃进并没有本质突破。各家模型即使在跑分榜上有差距，这种差距也很难传递给用户。单纯的模型参数与能力的「军备竞赛」已非战场的全部。

所以站在这样一个时间点，在模型能力趋于同质化、所有AI公司都用「一句话生成xxx」作为标准宣传语的时候，真正的分野在于如何将技术落地，为用户创造真正的价值。

带着这样的观察视角，我体验了MiniMax Agent。

栏目作者召集

极客公园的新栏目「AI上新」，将带大家体验最新的AI应用和硬件，让你成为AI时代「最靓的仔」！

现在，我们也向所有喜欢尝鲜和体验AI的同学发出召集，只要你发现并体验了新的AI应用或者功能，按照格式（参考案例：「一句话生成爆款视频」，这款AI流量神器有点东西｜AI上新）向栏目投稿，在极客公园公众号发布，不仅能获得相应稿费，且会为你「报销」AI应用的订阅费用。

同时，优秀作者还有机会进入极客公园AI体验群，获得最新AI应用和工具的内测资格，参加极客公园专属相关AI活动，和AI应用创始人一对一沟通。

AGI太久，只争朝夕，让一部分人先AI起来吧！投稿、进群请扫描下方二维码添加极客小助手微信

01、社区化的创新：Gallery和Remix

大多数Agent产品都面临一个共同的用户体验障碍——一个输入框，和无限的可能性。

这对于缺乏经验的创作者而言，无疑是一块令人望而生畏的「空白画布」。正如乔布斯所言，用户常常不知道自己想要什么，直到你把成品摆在他们面前。

MiniMax Agent通过一个类似「应用商店」的Gallery（作品廊）区域，直面了这个问题。图库中既有「交互式统计学教程」这类教育应用，也有「横版冒险游戏」这样的轻娱乐，还有「全球演唱会指南」等实用信息工具。这种设计，实际上把用户的思考从「我该怎么做？」引导向了「我能做什么？」。

在输入框下方，是MiniMax的Gallery区域，其它用户已经完成的作品会在此展示

不止如此，MiniMax还引入了「Remix」机制。如果你对某个作品感兴趣，你可以花上100积分修改这个作品，让它成为你自己的版本。而这100积分，也会作为一种激励全部返回给原作者。

这是一个三方共赢的措施：

新用户可以用一个较小的代价获得一个比较确定的产出

老用户可以用作品获得激励

而对于MiniMax来说，这不光是促进了创作者生态的繁荣；更为实际的，他们所消耗的算力成本也更少了。

我们从Gallery里选了一个「OpenAI新闻网页」案例。它的原始需求很明确：「用Serper API每分钟更新OpenAI新闻，UI贴近OpenAI官网的油画质感」。基于这个基础，我们提出了定制需求：「除了OpenAI，还要看谷歌、Anthropic、微软、Meta的AI新闻，UI改成苹果官网的简洁风格」。

随后，Agent就给出了清晰的升级计划：自动任务分解、制定执行步骤，并在获得用户同意后开始执行，还会主动问「是否符合预期」——整个过程不用自己写一行代码，只需要确认需求就行。

MiniMax Agent拆解任务

值得注意的是，在开发过程中，Agent还主动要求了需要的API权限（Serper API用于搜新闻，Supabase用于存数据），这意味着它具备了处理数据存储和管理的全栈开发能力，而不只是一个「前端皮肤」生成器。

Minimax Agent要求后端数据库授权

经过十几分钟的开发周期，一个定制化的新闻聚合器就基本完成了。不过初始版本只有Anthropic的新闻成功获取，其他公司的新闻出现了缺失。好在Agent很快识别出问题，又花了十几分钟迭代修复。最终成品不仅能按公司筛选新闻（比如只看微软AI动态），还能手动搜索关键词、每分钟自动更新。

https://r8jzmyahyxr7.space.minimax.io/

这个过程的亮点在于，在Agent的协助下，如果后续有迭代需求（如添加更多订阅源、更换UI风格等），在Agent的协助下都能快速完成。同时，所有工程文件都经过规范化整理打包，为有经验的开发者提供了精细化手动修改的空间。

任务完成后，MiniMax Agent还给出了规范打包的工程文件｜图片来源：极客公园

对于MiniMax VIP用户，还提供了个性化域名服务。完成作品之后，用户可以直接发布，交付使用。

也就是说，从开发、测试、部署到发布，MiniMax提供了一个完整的产品交付闭环，这和早先只是静态网页式Agent产品还是有本质区别。

MiniMax还提供了个性化域名服务（付费）

02、复杂场景应用：创造一个创意美食App

为了进一步测试MiniMax的能力边界，我设计了一个更具挑战性的任务：开发一个基于AI的美食探索App。但它的核心功能不是推荐餐厅或菜谱，而是通过分析用户的感官描述和喜好，来反向推导出他们可能喜欢的特定美食或饮品。

例如，用户不再输入「上海小笼包」或「日式拉面」，而是输入一系列感官关键词，比如：「有嚼劲的」、「微辣的」、「带有烟熏味的」，AI会根据这些关键词推荐符合描述的美食，有点类似「猜你喜欢」的食物版本。

这对于agent的挑战在于，它需要：

跨模态理解：将抽象的感官描述转化为具体的食物

强大的推理能力：从少量线索中推导出准确结论

深厚的美食知识库：涵盖全球各地的美食文化和特色

面对这个复杂度显著提升的任务，开发时间从之前的十几分钟延长到了半小时。

最终的成品长这个样子，因为我没有提出UI方面的特殊要求，成品比较简单，但也达到了及格线。App具备了应有的基本元素：恰当的应用命名、清晰的用户引导界面，甚至还有富有文学色彩的slogan。

最终成品的访问地址：https://47upjztctd5b.space.minimax.io｜图片来源：极客公园

在测试中，对于「童年」这类具象关联性强的关键词，App能返回「香草布丁」、「冰淇淋圣代」等匹配度较高的结果。

「味觉侦探」界面

当但当面对「在人间」、「我的大学」这类更抽象的关键词时，系统便难以提供有效匹配。这其实暴露了底层数据库的局限性。但就功能实现来说，作为一个半小时内完成的作品，表现已经很不错。如果匹配上更专业的开发者和更丰富的数据库，味觉侦探其实可以很快就成为一个成熟的产品。

03、给自己造一个文保地图

最后，我基于自己的需求，让MiniMax给我做了一个文保地图。

市面上已有的产品，如华夏古迹图、文保在身边等，都无法满足我的需求。他们要么是性能拙劣、UI粗糙，要么收录的文保单位数量有限，且夹杂了许多我不需要的增值服务。

此前我曾尝试过将文保数据导入苹果地图、谷歌地图。苹果的问题在于并不支持数据导入，每一个文保单位都需要手动创建。谷歌地图支持数据导入，但是很难满足一些我的个性化需求，例如将各个层级的文保单位（国保、省保、市保）分层显示。此外，它对数据行数有限制，最大只支持2000行，同时且对网络环境也有要求。

在谷歌地图中，所有目的地都混杂在一起｜图片来源：极客公园

在Minimax的帮助下，我自己做了一个文保地图。成品最终如下图所示。相比谷歌地图而言，界面更加友好，有更详细的背景介绍。点击导航键之后也可以跳转至高德地图导航。对我来说，这款应用的最大优势是高度可定制化。即使不懂编程，我也可以随时要求MiniMax按照我的想法进行后续的迭代和改进。

用MiniMax制作的文保地图产品｜图片来源：极客公园

然而，目前这款应用的数据库仅仅收录了12个文保单位的信息。主要原因是，要获取包含经纬度的专业地理数据，通常需要特定的账号权限才能登录某些专业数据库，这超出了当前AI Agent的能力范围。

这让我意识到一个现实：以MVP（最小化可行产品）的标准而言，这个文保地图是合格的。但是「一句话生成App」还只是一个宣传口号，实际上在创建一个真正可用App的过程中还需要大量的人工介入，无论是前期的产品文档撰写还是之后数据库支持、运营维护等等。

总结一下MiniMax Agent的优点。

Gallery和Remix功能算是还不错的功能点，它可以引导新用户创作、促进老用户的创作动力，并且在更低的算力成本下加大了社区的活跃度。

全栈开发能力是一个贴近实际生产环境的功能。MiniMax集成了后端数据库、一键测试、部署等完整的开发链路，产出的产品具备真正的可用性和交互性。

至于缺点，坦率地说，MiniMax本身并没有明显的产品缺陷，它所表现出的问题主要来自两个层面：

AI技术的内在约束：包括模型幻觉现象、对真实世界理解的局限性等，这些是当前AI技术发展阶段的共性问题。

人类认知的投射：AI技术的华丽前景往往折射出人类复杂的情感诉求，而这种期待本身就承载着人类认知的局限性。

对于现在的AI产品，我观察到身边的朋友有一种矛盾的复杂情感。

一方面是厌烦。AI产品层出不穷，"逆天"、"炸裂"等夸大词汇充斥着信息流，让人产生审美疲劳。

另一方面又是恐惧——万一呢？万一真有他们说的那么好？那我的工作是不是会被淘汰？

虽然Agent在特定任务上展现了强大的能力，但在实际生产环境中，它还远未达到可以完全自主运行的水平。

将agent想象成一台3D打印机会更恰当。

就像3D打印机能够将数字模型转化为物理物体，满足小规模、定制化的生产需求，现在的agent也擅长处理特定、界限清晰的任务。它们可以根据明确的指令生成代码片段、撰写特定主题的文章或自动化重复性强的流程。这些应用场景通常是针对个人用户或小规模团队，用于实现个性化、快速迭代的目标。

然而，3D打印机无法替代大规模的工业化生产线。同样，现在的agent也无法直接进入复杂的生产环境。大规模生产需要的是高度可预测、可靠且经过严格质量控制的系统，而当前的agent缺乏这种稳定性。它们可能会产生「幻觉」，出现无法预料的错误，或者在面对复杂、多变的实际场景时表现出脆弱性。

客观地说，AI的能力其实处在一个中间态。确实展现了前所未有的强大能力，却又存在着明显的缺陷。与其说它有多么地强大，更准确的描述是，它承诺了一个充满可能性的未来。

实际上，只要再深入了解一下，就可以轻易发现AI的脆弱。正如杨立昆所说，现在大语言模型本质上是一种「统计机器」，它通过在海量的文本数据中学习词语之间的统计关联性，来预测下一个最有可能出现的词。

换句话说，AI并不理解世界，本质上是猜测，是一种对人类的模拟。一个模型可以学会「火很热」和「水能灭火」的词语关联，但它不知道为什么火是热的，也不知道水如何从物理层面扑灭火焰，它只是在复述训练数据中已有的模式。

就像你教小狗做出「恭喜发财」的动作一样。小狗当然不懂什么是恭喜发财，但是这么做之后，就会有零食奖励。

AI也是如此。

上一篇：超2000只个股上涨超2000只个股上涨超5300只个股上涨原因

下一篇：宁德时代股价创上市以来新高！固态电池进展加速+储能需求爆发宁德时代股价连创新高宁德时代固态电池股价

为什么说现在所有的AI Agent，都像3D 打印机？

相关内容

热门资讯