AI自主决策权扩大,Anthropic为Claude Code引入自动模式 ai自主决策龙头 ai自主意识实现的最新研究
开心田螺
2026-03-25 10:13:32

Anthropic正在赋予其AI编程工具更大的自主权,同时试图在效率与安全之间寻求平衡。

3月24日,Anthropic宣布为Claude Code推出"自动模式"(auto mode),允许AI自行判断哪些操作可以直接执行,无需等待用户逐一确认。

这一功能目前以研究预览版形式面向团队计划用户开放,未来数日内将扩展至企业版及API用户。

新功能的核心在于内置安全机制,每项操作在执行前均会经过AI安全层的审查,系统将自动放行被判定为安全的操作,并拦截存在风险的行为。

Anthropic表示,该安全层还可检测提示注入攻击,即恶意指令被隐藏在AI正在处理的内容中,试图诱导模型执行非预期操作。

该公司建议用户在隔离的沙盒环境中使用这一新功能,以防止潜在风险蔓延至生产系统。

开发者痛点驱动产品迭代

对于当前使用AI编程工具的开发者而言,一个普遍困境是,要么对AI的每一步操作全程监督,要么放手让模型自行运行,由此承担不可预知的风险。

Anthropic的自动模式本质上是对Claude Code现有的"不会再向用户请求确认(dangerously-skip-permissions)"命令的升级延伸。

该命令原本将所有决策权完全交由AI处理,而新模式则在此基础上叠加了一层安全过滤机制。

通过让AI而非用户来决定何时需要申请权限,Anthropic试图在不牺牲执行效率的前提下,为开发者提供更高程度的安全保障。

GitHub、OpenAI等公司已相继推出能够代替开发者执行任务的自主编程工具,Anthropic此次的举措在此基础上进一步推进,将权限决策的主导权从用户一侧转移至AI本身。

自动模式的发布,紧随Anthropic近期一系列产品更新之后,包括用于在代码合并前自动捕捉缺陷的Claude Code Review,以及允许用户将任务委派给AI代理处理的Dispatch for Cowork。

这一系列布局显示,Anthropic正系统性地构建面向企业开发者的自主化AI工作流产品矩阵。

关键细节尚待厘清

尽管如此,这一功能仍存在值得关注的不确定性。

Anthropic目前尚未公开其安全层判定操作风险等级的具体标准,而这恰恰是开发者在大规模采用该功能前最需要了解的核心信息。

此外,自动模式目前仅支持Claude Sonnet 4.6与Opus 4.6两款模型,且仍处于研究预览阶段,意味着该产品尚未最终定型。

对于考虑在生产环境周边部署这一功能的企业用户而言,上述限制与信息不透明之处或将是其审慎评估的重要依据。

相关内容

热门资讯

伊朗:特朗普“极度渴望”达成协... 央视新闻消息,伊朗伊斯兰议会议长卡利巴夫17日在社交媒体发文称,霍尔木兹海峡的控制权属于伊朗,这一事...
伊朗:特朗普7项社媒声明“均不... 新华社消息,伊朗伊斯兰议会议长卡利巴夫18日凌晨在社交媒体发文称, 美国总统特朗普此前在1小时内于社...
特朗普称将很快发布第一批UFO... △美国总统特朗普(资料图) 美国总统特朗普17日在一场集会活动上表示,他领导的政府找到了许多关于不明...
伊朗发布霍尔木兹海峡通行新规 伊朗伊斯兰革命卫队海军司令部17日晚在社交媒体发布船舶在霍尔木兹海峡通行的新规定。伊朗国防部发言人后...
法国与英国牵头召开国际会议讨论... 中新社巴黎4月17日电 (记者 李洋)法国与英国当地时间17日在巴黎牵头召开国际会议讨论霍尔木兹海峡...