AI 自己写代码、自己跑测试,AWS 这次把事情做大了

AI 自己写代码、自己跑测试,AWS 这次把事情做大了

最近两天,X 和 GitHub 上关于 Claude Code + AWS Bedrock 的讨论又热了起来,而且讨论的重心和之前完全不同。

之前大家聊的是"直连 Anthropic 还是走 AWS""认证会不会出问题""配额怎么算"。这回呢?话题变成了:AI 现在能不能自己写代码、自己跑测试、自己看结果,然后自己改?

答案是,可以了。至少在 AWS 的环境里,这件事正在变成现实。

AWS 开放了一个很关键的能力

3 月 17 日,AWS 宣布 Bedrock AgentCore Runtime 支持 shell 命令执行。

翻译成人话就是:以前 AI Agent 只能"想"和"写",现在它还能自己"动手"了。

你可以让它在云端直接跑测试、装依赖、执行 git 操作。这些命令在 Agent 自己的运行环境里执行,输出实时返回,不需要开发者额外写调度代码。

这意味着,AI 编程正在从"帮你补代码",变成"帮你干活"。

Claude Code 是什么

Claude Code 是 Anthropic 推出的智能体编程工具。你在终端或者 VS Code 里给它一个任务,它能自己拆步骤、读文件、写代码、跑命令、看报错、再改。

现在它可以直接接入 AWS Bedrock 作为后端。好处是:数据不出 AWS 环境,权限走 IAM,费用走统一账单。

而且 AWS 新推出的 Prompt 缓存功能,可以让连续工作时的重复上下文只收十分之一的价格。这对 Claude Code 这种"在同一个项目里连续干活几小时"的场景来说非常划算。

和 GPT-5.4 的差距在哪

很多人会问,Claude 4.6GPT-5.4 比,到底谁更强。

客观来说,两家在模型能力上已经非常接近。单轮问答、代码生成、推理分析,两边各有擅长,很难说谁碾压谁。

真正拉开差距的,是背后的基础设施。

Claude 4.6 目前在 AWS 生态里的集成深度更强:AgentCore 提供了 Agent 运行时、shell 执行、MCP 服务器;Bedrock 提供了统一的权限、监控、缓存和计费体系。这套东西合在一起,让 Claude 在企业场景里的落地效率更高。

GPT-5.4 在 Azure OpenAI 上也有自己的优势,尤其是和微软生态的集成。但在"智能体自主编程"这个方向上,AWS + Claude 这波走得更快。

国内用户能不能用

老规矩,说实话。

AWS 海外账号注册、Bedrock 模型权限申请,这些对国内个人开发者来说依然有门槛。AgentCore 目前支持 14 个区域,包括亚太的东京和新加坡,但没有中国区。国内直连海外的网络延迟也会影响 Claude Code 的实时交互体验。

所以对于大多数国内用户来说,这套东西目前更适合关注和学习,直接使用的条件还不太成熟。

不过值得关注的是,Prompt 缓存和 Agent 工作流设计的方法论是通用的。即使你用的不是 AWS,这些思路也可以应用到其他平台和场景里。

这波热潮的信号

这两天 X 和 GitHub 上的讨论,传递了一个很明确的信号:AI 编程正在从"辅助工具"变成"自主工作流"。

当 AI 不只是帮你写代码,而是能自己跑测试、自己看结果、自己改 bug 的时候,开发者和 AI 的关系会发生根本性的变化。

这件事,可能比任何一次模型发布都更值得关注。

参考链接:

← 返回博客列表